这篇文章将为大家详细讲解有关python如何流式读取大文件,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
如何流式读取大文件
使用with…open…可以从文件中读取数据,这是所有Python开发人员都非常熟悉的操作。
但是,如果使用不当,也会造成很大的麻烦。
例如,当您使用读取功能时,Python会将文件内容一次全部加载到内存中。 如果文件具有10 GB或更多,则计算机将消耗的内存非常大。
对于此问题,您可能会考虑使用readline作为生成器来逐行返回。
但是,如果此文件的内容在一行中,则每行10 GB,您仍将一次读取所有内容。
最优雅的解决方案是使用read方法指定一次只读取固定大小的内容。 例如,在下面的代码中,一次仅返回8kb。
上面的代码在功能上没有问题,但是代码看起来还是有点肿。
使用部分函数和迭代函数,您可以像这样优化代码
关于“python如何流式读取大文件”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。