问题描述
我正在尝试使用docx-python和pandas在Python3中编写脚本,以执行以下操作:
- 从csv文件中获取输入
- 合并C列的通用值并将每个值添加到docx
- 导出docx
我的原始csv如下:
SN. Name Instance Severity
1 Name1 file1:line1 CRITICAL
2 Name1 file2:line3 CRITICAL
3 Name2 file1:line1 Low
4 Name2 file1:line3 Low
and so on...
,我希望我的docx更好: ` [1]:https://i.stack.imgur.com/1xNc0.png
我无法弄清楚如何使用熊猫根据“名称”过滤“实例”,然后打印到docx中。
谢谢。
解决方法
下面的代码将选择相关的列,并根据“名称”和“严重性”进行分组,并将实例添加在一起
df2 = df[["Name","Instance","Severity"]]
df2["Instance"] = df2.groupby(['Name','Severity'])['Instance'].transform(lambda x: '\n'.join(x))
最后,删除重复项并进行转换以获得所需的输出
df2 = df2.drop_duplicates()
df2 = df2.T