问题描述
我有以下API从中提取数据: https://www.business-humanrights.org/en/api/internal/explore/?format=json&search=nike
我已经使用json提取了API结果(请参见下文),但是API的结构似乎相当复杂,而且我不了解如何提取与我相关的信息并将其存储到pandas数据框中。我感兴趣的信息是以下键的值
“翻译标题” “追溯” “翻译的摘要” “ translated_url”
r = requests.get("https://www.business-humanrights.org/en/api/internal/explore/?format=json&search=nike")
rjson = r.json()
users_locs = [webPage for webPage in rjson['results']]
users_locs
更一般地说,如果我能指出如何从字典中的列表中的数据,字典中的列表等中提取数据的逻辑,那将是很棒的。
我的预期输出是新闻级别的数据集,其中我为每一行报告翻译的标题,翻译的摘要和回溯日期。请参见以下结构:
df = pd.DataFrame([{"translated_title" : "Chine : La pression augmente contre Nike,Apple et d’autres à mesure que le boycott lié aux allégations de travail forcé s’intensifie","translated_abstract":'..',"backdate": "2020-07-24"},{"translated_title" : "..","backdate": ".."}])
谢谢!
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)