如何通过在python中迭代句子中的单词来创建表格?

问题描述

对于下面给出的示例,我想为“导演”和“明星”列表创建一个表格。这个想法是迭代句子,检测单词“Director:”和“Stars:”之间存在的单词并放入各自的单元格中。

句子。

Director:
Peter
Jackson,John
Marsh
Stars:
Elijah
Wood,Ian
McKellen,Orlando
Bloom,Sean
Bean

完整的单词列表 https://justpaste.it/3qjc4

要创建的表

导演 星星
彼得杰克逊 以利亚伍德
约翰·马什 伊恩·麦克莱恩
奥兰多布鲁姆
肖恩·宾

解决方法

试试这个:

import pandas as pd

l=[]
with open('yourtxtfile.txt') as f:
    for i in f:
        l.append(i)

l=[i.replace('\n','') for i in l]

Director=l[1:l.index('Stars')]
Stars=l[l.index('Stars')+1:]

for i in range(len(Director)-len(Stars)):
    Director.append('')

df=pd.DataFrame({'Director':Director,'Stars':Stars})