问题描述
对于下面给出的示例,我想为“导演”和“明星”列表创建一个表格。这个想法是迭代句子,检测单词“Director:”和“Stars:”之间存在的单词并放入各自的单元格中。
句子。
Director:
Peter
Jackson,John
Marsh
Stars:
Elijah
Wood,Ian
McKellen,Orlando
Bloom,Sean
Bean
完整的单词列表 https://justpaste.it/3qjc4
要创建的表
导演 | 星星 |
---|---|
彼得杰克逊 | 以利亚伍德 |
约翰·马什 | 伊恩·麦克莱恩 |
奥兰多布鲁姆 | |
肖恩·宾 |
解决方法
试试这个:
import pandas as pd
l=[]
with open('yourtxtfile.txt') as f:
for i in f:
l.append(i)
l=[i.replace('\n','') for i in l]
Director=l[1:l.index('Stars')]
Stars=l[l.index('Stars')+1:]
for i in range(len(Director)-len(Stars)):
Director.append('')
df=pd.DataFrame({'Director':Director,'Stars':Stars})