csv 文件读写乱码问题的一个简单解决方法-编程学习网

今天使用Python，很少代码就能将上面过程自动化。首先，导入3个模块：

# coding: utf-8 
# @author: zhenguo 
# @date: 2020-12-16 
# @describe: functions about automatic file processing 
 
import pandas as pd   
import os  
import chardet

chardet 模块用于得到文件的编码格式，pandas 按照这个格式读取，然后保存为xlsx格式。

获取filename文件的编码格式：

def get_encoding(filename): 
    """ 
    返回文件编码格式 
    """ 
    with open(filename,'rb') as f: 
        return chardet.detect(f.read())['encoding']

保存为utf-8编码xlsx格式文件，支持csv, xls, xlsx 格式的文件乱码处理。需要注意，如果读入文件为csv格式，保存时要使用xlsx格式：

def to_utf8(filename): 
    """ 
    保存为 to_utf-8 
    """ 
    encoding = get_encoding(filename) 
    ext = os.path.splitext(filename) 
    if ext[1] =='.csv': 
        if 'gb' in encoding or 'GB' in encoding: 
            df = pd.read_csv(filename,engine='python',encoding='GBK') 
        else: 
            df = pd.read_csv(filename,engine='python',encoding='utf-8') 
        df.to_excel(ext[0]+'.xlsx') 
    elif ext[1]=='.xls' or ext[1] == '.xlsx': 
        if 'gb' in encoding or 'GB' in encoding: 
            df = pd.read_excel(filename,encoding='GBK') 
        else: 
            df = pd.read_excel(filename,encoding='utf-8') 
        df.to_excel(filename) 
    else: 
        print('only support csv, xls, xlsx format')

上面函数实现单个文件转化，下面batch_to_utf8 实现目录 path 下所有后缀为ext_name文件的批量乱码转化：

def batch_to_utf8(path,ext_name='csv'): 
    """ 
    path下，后缀为 ext_name的乱码文件，批量转化为可读文件 
    """ 
    for file in os.listdir(path): 
        if os.path.splitext(file)[1]=='.'+ext_name: 
            to_utf8(os.path.join(path,file))

调用：

if __name__ == '__main__': 
  batch_to_utf8('.') # 对当前目录下的所有csv文件保存为xlsx格式,utf-8编码的文件

文件读写时乱码问题，经常会遇到，相信今天这篇文章里的to_utf8，batch_to_utf8函数会解决这个问题，你如果后面遇到，不妨直接引用这两个函数尝试下。

文章详情

csv 文件读写乱码问题的一个简单解决方法

软考中级精品资料免费领

相关文章

猜你喜欢

csv 文件读写乱码问题的一个简单解决方法

如何解决csv文件读写乱码问题

python 写入csv乱码问题解决方法

jsp中文乱码问题的简单解决方法

读写json中文ASCII乱码问题的解决方法

Java读写.properties文件解决中文乱码问题

java读写html文件乱码解决方法

Mysql 导入导出csv 中文乱码问题的解决方法

PHP写入txt文件时出现乱码问题的解决方法

.Net Core读取文件时中文乱码问题的解决方法分享

Android读取本地json文件的方法(解决显示乱码问题)

node 读取文件乱码的解决方法

解决中文乱码问题的matplotlib方法

php读文件内容乱码的解决方法

Graphics2D中写图片中文乱码问题及解决方法

Android Studio的中文乱码问题解决方法

VScode查看pythonf.write()的文件乱码问题及解决方法

解决PHP Dompdf中文乱码问题的方法

drupal6上传中文文件名附件乱码问题解决方法

解决Navicat for Oracle(MySQL)导入csv文件时出现中文乱码的问题