Python之如何使用pandas操作Excel表-编程学习网

pandas.read_excel(file, sheet_name=0, keep_default_na=False)
1、file为要读取的Excel文件
2、sheet_name表示要读取的sheet名，0表示第一个sheet，1表示第2个sheet，依次类推；也可以直接写sheet的名称，如sheet_name='Sheet1'
3、当Excel中有空值时，直接读取会显示nan，read_excel方法中加上keep_default_na=False后，
空值nan会变成：'' 空字符串，后续可用if cell_data=='' 进行判断

代码如下：

import pandas

file = r'D:\student.xlsx'

class opexcel():
def getdata(self, file):
data = pandas.read_excel(file, sheet_name=0, keep_default_na=False)
print(type(data)) # 输出数据类型（DataFrame）
print(data) # 输出数据

if __name__ == '__main__':
opexcel().getdata(file)

打印结果如下：

3.1、获取行号、列名

row_index = data.index.values # 行号：数组形式 [0 1 2 3 4 5 6 7 8]
print('行号是：%s' % row_index)
row_num = len(data.index.values) # 行数
print('行数是：%s' % row_num)
col_index = data.columns.values # 列名：数组形式['姓名' '性别' '年龄' '住址' '爱好']
print('列名是：%s' % col_index)
col_num = len(data.columns.values) # 列数
print('列数是：%s' % col_num)

打印结果：

3.2、获取单元格的值，并循环输出

for i in range(row_num): # 循环行数
for j in range(col_num): # 循环列数
cell_data=data.iloc[i,j] # 获取单元格的值
print('第%s行，第%s列的数据是：%s ' %(i,i,cell_data))

打印结果如下：

3.3、对空值进行处理，替换

Excel文件中，某个单元格的值可能为空，直接读取会显示nan，且各个单元格的数据类型可能不一致，如date、str、int、float。这时如果直接读取，使用numpy.isnan()或者pandas.isnull()进行判断，都可能会报错，所以在开头读取Excel文件的方法pandas.read_excel(file, sheet_name=0, keep_default_na=False)中加上keep_default_na=False后，空值nan会变成：'' 空字符串。

现在我们想要将Excel中所有为空的单元格，替换为NULL字符串，操作如下

取出所有列名

循环列名，对空值替换（据实践，只有列名才有.replace()方法）

col_index = data.columns.values  # 列名for col in col_index :    data[col].replace('','NULL',inplace=True)    # 第一个参数是替换前的值，即Excel表指定列的值，如有多个相同的值，后续都会被替换      第二个参数是替换后的值，此处为字符串'NULL'，也可填数字、或其他类型      第三个参数，是否替换，True为替换    print(data)打印结果如下：

如要将上方结果中【爱好】这一列的【无】，替换为羽毛球，操作如下：

data['爱好'].replace('无','羽毛球',inplace=True)

结果如下：

3.4、增加一列，并对新增列的第一行进行赋值

新增一列【成绩】，并赋值未None：

data['成绩']=None

打印结果如下：

修改增列的第一行的值为50：

data['成绩'][0]=50

打印结果如下：

3.5、将修改后数据保存到原文档

注意：以上操作中将空值替换、新增列、修改单元格数据等编辑操作，只在控制台有效，实际文件的内容并不会被改变

file = r'D:\student.xlsx'

data.to_excel(file,sheet_name='Sheet1',index=False,header=True)

# 用DataFrame的to_excel方法可将编辑后的数据进行保存（前面第一节已知data为DataFrame类型）

第一个参数file，表示数据将要保存到这个文件。可以是原文件(r'D:\student.xlsx')，如果写另外的文件（r'D:/test/newstudent.xlsx'），则数据将保存到另一个文件中，原文件数据不变

第二个参数sheet_name，表示将数据保存到文件的哪一个sheet工作表。如工作表不存在则会报错。

第三个参数index，表示工作表自带的序号。如果设置index=True，则保存后的数据将多出一列

第四个参数header，表示列名。设置header=True，保存后的数据将带上列名；设置header=False，保存后的数据将没有列名

注意：

读取文件的时候，sheet_name可以写成 sheet_name=0或 sheet_name='Sheet1'

data = pandas.read_excel(file, sheet_name=0,keep_default_na=False)

写入文件的时候，只能填写工作表的名称sheet_name='Sheet1'

保存后的数据如下：

设置index=True，结果如下：

设置header=False，结果如下：

3.6、关于循环取数

col_index = data.columns.values  # 列名 ['姓名' '性别' '年龄' '住址' '爱好' '成绩']数组，用in进行循环取值:for i in col_index:col_num = len(data.columns.values)  # 列数 6数值，用rang进行循环取数：for i in range(col_num :

7、字符串分割

url=data['URL'][0] # https://blog.csdn.net/m0_46400195/article/detailspyprint(url)print(type(url))str1=str(data['URL'][0]).split('/')# 注意： 虽然显示URL为str类型，但是仍然要先将data['URL'][0]转为str，才能使用.split方法进行分割。str(data['URL'][0]).split('/')，也可以写成str(url).split('/')print(str1) # 打印分割后的结果newstr1=str1[0]+'//'+str1[2]+'/'+str1[3]+'/'+'druid' #根据分割后的信息进行拼接newstr2 = str1[0] + '//' + str1[2] + '/' + str1[3]+'/' + 'druid/index.html'print(newstr1) #打印拼接后的字符串print(newstr2)打印结果如下：

PermissionError: [Errno 13] Permission denied

这个错误出现可能是文件未关闭，关闭后再操作即可。还有可能是文件损坏了，打开文件，确认文件内容是否正常

……

import pandasimport requestsfrom pandas import DataFrameimport xlwt'''1、当Excel中有空值时，直接读取会显示nan，read_excel方法中加上keep_default_na=False后，空值nan会变成：‘’ 空字符串，后续可用if cell_data=='' 进行判断2、col_index = data.columns.values  # 列名   数组col_index：['序号' '是否导出' '所属单位']，用in进行循环取值:for i in col_index:   row_num = len(data.index.values)  # 行数   数值row_num：用rang进行循环取数：for i in range(row_num):'''file = r'D:\student.xlsx'class opexcel():    def getdata(self, file):        data = pandas.read_excel(file, sheet_name=0,keep_default_na=False)        # 当Excel中有空值时，直接读取会显示nan，read_excel方法中加上keep_default_na=False后，        # 空值nan会变成：‘’ 空字符串，后续可用if cell_data=='' 进行判断        # print(type(data))        # print(data)  # 输出数据        row_index = data.index.values  # 行号： 数组形式 [0 1 2 3 4 5 6 7 8]        print('行号是：%s' % row_index)        row_num = len(data.index.values)  # 行数        print('行数是：%s' % row_num)        col_index = data.columns.values  # 列名： 数组形式['序号' '是否导出' '所属单位' '项目名称' '项目']        print('列名是：%s' % col_index)        col_num = len(data.columns.values)  # 列数        print('列数是：%s' % col_num)        # data['result']=None        # data.to_excel(r'D:\userCase11.xls', sheet_name='Sheet1', index=False, header=True)        # for i in range(row_num): # 循环行数        #     for j in range(col_num): # 循环列数        #         cell_data=data.iloc[i,j] # 获取单元格的值        #         print('第%s行，第%s列的数据是：%s ' %(i,i,cell_data))        #        # for col in col_index :        #     data[col].replace('','NULL',inplace=True)        #     print(data)        #        # data['爱好'].replace('无','羽毛球',inplace=True)        # print(data)        # data['成绩']=None        # print(data)        # data['成绩'][0]=50        # print(data)        # data.to_excel(file,sheet_name='Sheet1',index=False,header=False)if __name__ == '__main__':    opexcel().getdata(file)

来源地址：https://blog.csdn.net/qq_14945475/article/details/126240827

文章详情

Python之如何使用pandas操作Excel表

3.1、获取行号、列名

3.2、获取单元格的值，并循环输出

3.3、对空值进行处理，替换

3.4、增加一列，并对新增列的第一行进行赋值

3.5、将修改后数据保存到原文档

3.6、关于循环取数

软考中级精品资料免费领

相关文章

猜你喜欢

Python之如何使用pandas操作Excel表

（新手)使用pandas操作EXCEL

python使用xlsx和pandas处理Excel表格的操作步骤

如何利用Python操作excel表格

python如何使用xlwt操作excel

使用 Python 掌握多表 Excel 操作

Python利器openpyxl之操作excel表格

python操作Excel神器openpyxl如何使用

Windows下Python使用Pandas模块操作Excel文件的教程

PHP 使用 PhpSpreadsheet 操作 excel 表格

python中怎样使用xlrd、xlwt操作excel表格

Java如何使用POI操作Excel

Python如何利用xlrd和xlwt模块操作Excel表格

Python入门之使用pandas分析excel数据

如何使用python修改excel表某一列内容的操作方法

python数据分析之怎么用pandas搞定Excel表格

python操作Excel读写--使用x

Python使用pandas导入xlsx格式的excel文件内容操作代码

PHP使用PhpSpreadsheet库的操作Excel表格

flutter操作excel表的库使用方法