问题描述
我是AWS开发的新手,正在研究如何在我的EC2实例上使用TCGA数据(https://registry.opendata.aws/tcga/)。
-
$ aws s3 ls s3://tcga-2-open/
给了我数百万个文件。但是,XML文件http://tcga-2-open.s3.amazonaws.com仅显示1000个条目。是否有完整的文件列表,希望能描述它们的层次结构,以便我可以查找该资源的覆盖范围? -
所有TCGA文件都有前缀,并且它们似乎是GDC UUID(https://docs.gdc.cancer.gov/Encyclopedia/pages/UUID/)。但是,有些文件具有我无法从原始来源找到的UUID。从https://portal.gdc.cancer.gov/repository下载“清单”会给我一个UUID列表及其含义。但是,清单文件和XML文件中的某些UUID是互斥的。那么,当我从地面真相清单文件中找不到'00002fe8-ec8e-4e0e-a174-35f039c15d06'时,我怎么知道是什么文件,例如http://tcga-2-open.s3.amazonaws.com/00002fe8-ec8e-4e0e-a174-35f039c15d06/6057825020_R01C01_Grn.idat?
-
是否有在AWS上使用Open Data的分步教程?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)