将文本列的行分成多行

问题描述

我有一个像这样的数据集: how the dataset looks like

我想要的是将状态信息列及其名称分开,以创建一个新列,一个用于显示当前名称,另一个用于其各自的注释,然后相应地填充其余的列,如下所示:

desired outcome

我能够清除标点符号和数字的文本,并从状态信息列中创建一个字典,其名称为键,注释为值,但是它仍然显示所有名称的全部内容。

这是我到目前为止尝试过的代码:

names = ['tom','robin']
months = ['jan','feb','mar','apr','may','jun','jul','aug','sep','oct','nov','dec','january','february','march','april','june','july','august','september','october','november','december']


a = data['Status information'][3].lower()
b = [char for char in a if char not in string.digits]
b = ''.join(b)

for i in months:
    if b.find(i) != -1:
        b= b.replace(i,' ')

for i in string.punctuation:
    if b.find(i) != -1:
        b= b.replace(i,' ')
x={} 
for i in names:
    if b.find(i) != -1:
        x[i] = b.split(i)
        
print(b)
print(x)

输出:

tom  i want only server    robin cal busy    robin reg for server
{'tom': ['   ','  i want only server    robin cal busy    robin reg for server'],'robin': ['   tom  i want only server    ',' cal busy    ',' reg for server']}

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...