问题描述
我有大约 2000 个推文 ID,我必须提取相应的推文。首先,excel 不允许我以与预期相同的格式保存这些推文 ID,并且推文 ID 的最后四位数字被截断为 0000。
例如:tweet id 572330170108922545 被截断为 572330170108920000 。
我想使用 twitter 的 tweepy 库来提取推文..但似乎最初的问题是不让我开始工作。我是否仍然可以使用 .txt 文件格式通过使用 with open(filename.txt,'r) as tweet_id 来逐行读取每个推文 ID:?
如果有任何解决办法,请告诉我。
解决方法
这是由于 IEEE 标准在 Excel 中只允许 15 位精度。要解决此问题,您可以将它们存储为字符串 ('572330170108922545') 而不是数字。 See here 了解更多详情
,如果您的问题只是是否可以做到,那么答案当然是肯定的。您只需要弄清楚这些数据的结构。如果你一行一行地去,你可以使用.split()
或re
(正则表达式运算)来找到这些行的相关部分。