python对大文件的增量读取-编程学习网

欢迎关注我的豆瓣http://www.douban.com/note/484517776/

对于很多大文件的增量读取，如果遍历每一行比对历史记录的输钱或者全都加载到内存通过历史记录的索引查找，是非常浪费资源的，网上有很多人的技术博客都是写的用for循环readline以及一个计数器去增量读取，这样是十分脑残的，假如文件很大，遍历一次太久。
我们需要了解获取文件句柄的基本理论，其中包含的指针操作等。
原理是这样子，linux的文件描述符的struct里有一个f_pos的这么个属性，里面存着文件当前读取位置，通过这个东东经过vfs的一系列映射就会得到硬盘存储的位置了，所以很直接，很快。
以下是利用python实战代码,核心函数tell(),seek(). 也是调用的系统调用seek tell

seek()的三种模式：

（1）f.seek(p,0) 移动当文件第p个字节处，绝对位置

（2）f.seek(p,1) 移动到相对于当前位置之后的p个字节

（3）f.seek(p,2) 移动到相对文章尾之后的p个字节

tell()：
返回当前文件的读取位置。
代码：
#!/usr/bin/python
fd=open("test.txt",'r') #获得一个句柄
for i in xrange(1,3): #读取三行数据
fd.readline()
label=fd.tell() #记录读取到的位置
fd.close() #关闭文件
#再次阅读文件
fd=open("test.txt",'r') #获得一个句柄
fd.seek(label,0)# 把文件读取指针移动到之前记录的位置
fd.readline() #接着上次的位置继续向下读取

后续：今儿有一人问我如何得知这个大文件行数，以及变化，我的想法是
方法1：
可以去遍历'\n'字符。
方法2：
从一开始就用for循环fd.readline()进行计数，然后变化的部分（用上文说的seek、tell函数做）再用for循环fd.readline()进行统计增加行数。

文章详情

python对大文件的增量读取

软考中级精品资料免费领

相关文章

猜你喜欢

python对大文件的增量读取

Python 读取大文件

python读取大文件

Python读取大文件(GB)

强悍的 Python —— 读取大文件

python怎么读取大文件

python之批量读取文件

Python按行读取文件的实现方法【小文件和大文件读取】

怎么中python读取大文件

如何使用Python读取大数据中的对象文件？

Python读取大量Excel文件并跨文件批量计算平均值的方法

python简单读取大文件的方法

Python实现读取大量Excel文件并跨文件批量计算平均值

python如何流式读取大文件

python文件的读取

python怎么批量读取dat文件

python怎么批量读取文件名

python大批量读写.doc文件的解决

Golang文件读取操作：快速读取大文件的技巧

Python如何读取相对路径文件