将列转换为行以在pyspark

问题描述

我正在研究一种多类分类模型来进行实体识别。我在Databricks平台上使用python,所以使用pyspark软件包。我在Google电子表格中包含了一个打开数据集的链接https://docs.google.com/spreadsheets/d/1np9jMThzOy4pf-DR6D869ZkHT-pQRp1m89rH0HNjKL4/edit?usp=sharing

必须对表格进行转换,以便将每个实体(ingredient_tokens,strength_tokens,form_tokens,volume_tokens)的列放置在其自己的行中,并带有适当的标签,即“成分,强度,形式,体积”。谁能帮助我实现这种转换,以便我可以继续使用分类模型并在分类模型上工作?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)