文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

使用 Go 语言开发一个并发文件下载器

2024-12-02 23:01

关注

本文转载自微信公众号「Golang来啦」,作者Seekload。转载本文请联系Golang来啦公众号。

今天给大家分享一个实战项目,涉及到的知识点还挺多,文末也有源码地址!!

原文如下:

Go 语言是一门了不起的语言,尽管它非常简单,与 Koltin 和 Scala 等其他现代语言相比,它的功能很少,但它具有强大的并发能力。这篇文章,我们将会看到使用 Go 语言如何编写一个完整的并发文件下载器。完整的代码在这里[1]。

检查服务器是否支持并发下载

如何之前使用过类似 IDM 的下载工具,你可能会注意到它支持并发下载文件。

可以看到下载文件的时候启动了 8 个进程。

实现并发下载,我们必须确保服务器支持范围请求。怎么确认呢?我们可以发送 HEAD 请求,如果响应头的 Accept-Ranges 返回的值是 bytes,我们就能确定服务器支持此功能。

  1. res, err := http.Head("http://some.domain/some.file"
  2. if err != nil { 
  3.    log.Fatal(err) 
  4.  
  5. if res.StatusCode == http.StatusOK && res.Header.Get("Accept-Ranges") == "bytes" { 
  6.    // Yeh, server supports partial request 

如何下载文件的其中一部分

设想服务器支持范围请求,我们知道文件大小是 4000 字节(文件大小从响应头的 Content-Length 获取)。要仅下载 2000 到 3000 字节的文件的一部分,我们可以发送 HTTP GET 请求,并在 header 头设置 Range 参数:

  1. curl -X GET -H "Range: bytes=2000-3000" -o OUTPUT_FILE http://some.domain/some.file 

实现相同功能的代码如下:

  1. req, err := http.NewRequest("GET""http://some.domain/some.file", nil) 
  2. if err != nil { 
  3.     log.Fatal(err) 
  4. rangeStart := 2000 
  5. rangeStop := 3000 
  6. req.Header.Set("Range", fmt.Sprintf("bytes=%d-%d", rangeStart, rangeStop)) 
  7.  
  8. // make a request 
  9. res, err := http.DefaultClient.Do(req) 

将响应保存在文件中

为了支持断点续传功能,我们不会将请求响应保存在内存里,而是会持久化在文件中。举个例子,如果我们把并发级别设置成 4,在输出目录将会有 4 个临时文件。下面的代码,我们只是简单地读取 HTTP 响应体并将它写入一个文件中:

  1. f, err := os.OpenFile(outputPath, flags, 0644) 
  2.     if err != nil { 
  3.         log.Fatal(err) 
  4.     } 
  5. defer f.Close() 
  6.  
  7. _, err = io.Copy(f, res.Body) 

暂停下载

不知道大家注意到没有,上面代码有个问题,使用时不支持 CTRL+C 暂停下载。如果下载的文件过大,或者网络慢,下载需要花费很长时间。因为 io.Copy 复制文件时遇到 EOF 或者发生错误才结束。为了解决这个问题,我们使用 io.CopyN 和 cancel channel 组合:

  1. // copy to output file 
  2. for { 
  3.   select { 
  4.     case <- context.Done(): 
  5.        // user canceled the download 
  6.         return 
  7.     default
  8.       _, err = io.CopyN(f, res.Body, BUFFER_SIZE)) 
  9.       if err != nil { 
  10.         if err == io.EOF { 
  11.             return 
  12.         } else { 
  13.             log.Fatal(err) 
  14.         } 
  15.       } 
  16.     } 
  17.   } 

其他功能参见完整源代码

这篇文章只提到了代码中最重要的部分,但是通过阅读代码你可以了解其他功能是怎么实现的,比如:进度条的工作方式、如何使用 sync 包实现部分下载的同步、如何合并临时文件以及如何实现恢复功能等。所以可以通过阅读仓库代码[2]获取更多信息。

参考资料

[1]这里: https://github.com/mostafa-asg/go-dl

[2]仓库代码: https://github.com/mostafa-asg/go-dl

via:

https://returnfn.com/lets-build-a-concurrent-file-downloader-in-go

作者:Mostafa Asgari

 

来源:Golang来啦内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯