Python将大的csv文件拆分多个小的csv文件

#ecoding=utf-8
import os
import time
# 2019/9/8 将大的csv文件拆分多个小的csv文件

def mkSubFile(lines,head,srcName,sub):
    [des_filename,extname] = os.path.splitext(srcName)
    filename = des_filename + _ + str(sub) + extname
    print(make file: %s % filename)
    fout = open(filename,w)
    try:
        fout.writelines([head])
        fout.writelines(lines)
        return sub + 1
    finally:
        fout.close()


def splitByLineCount(filename,count):
    fin = open(filename,encoding="utf-8")
    try:
        head = fin.readline()
        buf = []
        sub = 1
        for line in fin:
            buf.append(line)
            if len(buf) == count:
                sub = mkSubFile(buf,filename,sub)
                buf = []
        if len(buf) != 0:
            sub = mkSubFile(buf,sub)
    finally:
        fin.close()


if __name__ == __main__:
    begin = time.time()
    splitByLineCount(training-inspur.csv,1000)#每个小的csv文件存放1000条
    end = time.time()
    print(time is %d seconds  % (end - begin))

分享图片

相关文章

功能概要:(目前已实现功能)公共展示部分:1.网站首页展示...
大体上把Python中的数据类型分为如下几类: Number(数字) ...
开发之前第一步,就是构造整个的项目结构。这就好比作一幅画...
源码编译方式安装Apache首先下载Apache源码压缩包,地址为ht...
前面说完了此项目的创建及数据模型设计的过程。如果未看过,...
python中常用的写爬虫的库有urllib2、requests,对于大多数比...