问题描述
我正在尝试使用基因-疾病关联列表制作一个不安情节。我假设我根本不明白需要哪种数据类型作为输入,因为大多数示例使用人工创建的数据类型为“int64”的数据集。
Upsetplot:https://buildmedia.readthedocs.org/media/pdf/upsetplot/latest/upsetplot.pdf 和 https://pydigger.com/pypi/UpSetPlot
我复制了上面链接中给出的示例,它们工作得很好。当我尝试自己的数据集时,我收到错误消息:AttributeError: 'Index' object has no attribute 'levels'
我用作输入的数据是一个带有布尔信息的数据框(参见附件“mydata.png”mydata boolean df)。所以我将疾病作为列,基因作为行,然后是关于与该疾病相关的特定基因的布尔语句(如果需要,我可以使这听起来更具计算性)。 可以在文档或屏幕截图“upsetplot_data_example.png”upsetplot_data_example 中找到有效的示例数据集。文档中说了一些关于“类别成员资格”的内容,但我不太明白那是什么数据类型。
我认为这是不了解需要什么“格式”的基本问题。如果有人知道我需要做什么,请告诉我。我欢迎所有反馈。我不希望有人真正为我编写代码,但是有些建议会很有帮助。
谢谢大家!
解决方法
最近发布的 Data Format Guide 可能会有所帮助。也许您需要在传入之前将这些布尔列设置为数据框的索引,但最终,使用 from_contents
或 from_memberships
来描述您的数据可能更容易。
然而,扰乱情节 will hopefully make the input format easier in a future version。