python – 熊猫:如何加载包含多个txt文件的zip文件?

我的路径中存储了很多zip文件

> mypath / data1.zip
> mypath / data2.zip
>等

每个zip文件包含三个不同的txt文件.例如,在data1.zip中有:

> data1_a.txt
> data1_b.txt
> data1_c.txt

我需要从每个压缩文件(即data1_c.txt,data2_c.txt,data3_c.txt等)加载datai_c.txt并将它们连接成一个数据帧.

不幸的是我无法使用read_csv这样做,因为它只适用于单个压缩文件.

有什么想法怎么做?谢谢!

解决方法

因此,您需要一些其他代码才能进入zip文件.下面是O’Reilly的 Python Cookbook的修改代码

import zipfile
import pandas as pd
## make up some data for example
x = pd.DataFrame({"A": [1,2],"B": [3,4]}) 
x.to_csv('a.txt',sep="|",index=False) 
(x * 2).to_csv('b.txt',index=False)

with zipfile.ZipFile('zipfile.zip','w') as myzip:
    myzip.write('a.txt')
    myzip.write('b.txt')
    for filename in z.namelist( ): print 'File:',filename,insideDF = pd.read_csv(StringIO(z.read(filename)))
         df = pd.concat([df,insideDF])
print df

相关文章

功能概要:(目前已实现功能)公共展示部分:1.网站首页展示...
大体上把Python中的数据类型分为如下几类: Number(数字) ...
开发之前第一步,就是构造整个的项目结构。这就好比作一幅画...
源码编译方式安装Apache首先下载Apache源码压缩包,地址为ht...
前面说完了此项目的创建及数据模型设计的过程。如果未看过,...
python中常用的写爬虫的库有urllib2、requests,对于大多数比...