Python修改csv文件编码格式怎么做?Python如何批量修改csv文件编码

csv之中文件格式python数据分析和处理程序中经常会碰到的,而它有时读取或者写入的数据会变成乱码,这是因为它的编码格式不是支持中文的。所以下面文章内容就是,python批量修改csv文件编码格式为中文utf-8的方法教程,想学习就继续阅读吧。

1.那么首先是需要将内置模块os导入,因为还需要使用它的方法获取文件路径下所有的csv文件。那么这个功能可以定义函数来实现,只需要传入文件路径作为参数就可以了。

函数内声明空列表后,调用walk()方法就可以获取指定路径下面所有文件以及文件夹路径,再去迭代这些文件并判断其是否以及.csv作为后缀名。是的话就拼接文件名和路径添加到空列表内返回,详细代码如下所示:

import os
from chardet.universaldetector import UniversalDetector
def get_filelist(path):
    Filelist = []
    for home, dirs, files in os.walk(path):
        for filename in files:
            if ".csv" in filename:
                Filelist.append(os.path.join(home, filename))
  return Filelist

2.接下来还需要去定义一个函数,这个函数的作用就是将文件打开读取内容,然后将其转为utf-8编码格式再写入。该函数中只需要去调用方法来先解码再编码即可,详细代码如下:

def convert_encode2utf8(file, original_encode, des_encode):
    file_content = read_file(file)
    file_decode = file_content.decode(original_encode, 'ignore')
    file_encode = file_decode.encode(des_encode)
    with open(file, 'wb') as f:
        f.write(file_encode)

3.那么到此还没有结束,因为此时还需要去定义一个函数在这函数中会调用一个函数获取文件路径下所有csv文件,然后在for循环内对其进行操作。操作的方法就是调用第二个函数来将打开的文件转换编码格式为utf-8,最后调用函数即可,代码如下:

def read_and_convert(path):
Filelist = get_filelist(path=path)
for filename in Filelist:
  convert_encode2utf8(filename, encode_info, 'utf-8')
if __name__ == "__main__":
    path = './'
    read_and_convert(path)

以上就是关于“Python修改csv文件编码格式怎么做?Python如何批量修改csv文件编码”的全部内容了,希望对你有所帮助。

相关文章

功能概要:(目前已实现功能)公共展示部分:1.网站首页展示...
大体上把Python中的数据类型分为如下几类: Number(数字) ...
开发之前第一步,就是构造整个的项目结构。这就好比作一幅画...
源码编译方式安装Apache首先下载Apache源码压缩包,地址为ht...
前面说完了此项目的创建及数据模型设计的过程。如果未看过,...
python中常用的写爬虫的库有urllib2、requests,对于大多数比...