问题描述
两个文本文件分别是a.txt和b.txt,如何使用第一个文件的第二列和第二个文件的第一列作为key列,用python合并两个文件并输出第三个文件形式?因为key列有重复值,如何保留所有的可能性?a.txtb.txtc.txt
解决方法
你会用熊猫吗?
运行:
import pandas as pd;
a = pd.read_csv('a.txt',names=['chr','capletter','number'])
b = pd.read_csv('b.txt',names=['capletter','letter'])
c = a.merge(b,left_on='capletter',right_on='capletter')
c.to_csv('c.txt',header=False,index=False)
来自 a.txt:
chr1,A,1
chr2,B,2
chr3,3
CHR3,C,4
和b.txt:
A,a
B,b
B,c
你会得到 c.txt:
chr1,1,a
chr2,2,b
chr2,c
chr3,3,b
chr3,c