如何从段落中提取日期字符串“2019 年 3 月 11 日 • 3:26AM”并将其转换为 python 中的日期时间格式 (dd/mm/yy)

问题描述

我有一个段落,其中包含我需要提取并单独列的日期和评论等详细信息。该段落位于我从中提取日期的列中,如下所示:

'故事\n常见问题\n更新 2\n评论 35\n作者:Antaio Inc\n2019 年 3 月 11 日 • 凌晨 3:26\n2 年前\n感谢大家的精彩开始!\n大家好,\n我们只想感谢你们一切都是为了一个很棒的开始!这是我们有史以来第一次 Indiegogo 活动,我们非常感谢您的支持,帮助我们取得了成功。\n在接下来的一段时间内,我们将致力于制作和运送很棒的 A-Buds 和 A-Buds东南。我们计划在下个月按照承诺将它们运送给您。\n我们将在接近关键生产日期时发送更多更新。\n敬请期待!\n此致,\nAntaio 团队\n来自 Antaio Inc\n2019 年 1 月 31 日• 凌晨 5:15\n 2 年前\n预生产更新\n亲爱的,\n我们想借此机会感谢大家对我们的早期支持。你们好棒! :)\n你可能已经注意到了,A-Buds 已经进入生产阶段,这意味着我们已经完成了所有的开发和测试,现在正在进行预生产。活动结束后,您不仅会收到经过全面测试和认证的出色 A-Buds,我们还承诺按时交付!我们真的很高兴能在您手中拥有这些出色的真正蓝牙 5.0 耳塞。我们相信你会爱上它们!\n所以这里是一个快速的先睹为快:\n更多。敬请关注! :)\n来自:Antaio 团队\n阅读更多'

此类段落出现在数据集的每一行中名为“Project_Updates_Description”的特定列中。我正在尝试提取每个条目中的第一个日期

我目前使用的代码是:

for i in df['Project_Updates_Description']:
if type(i) == str: 
    print(count)
    word = i.split('\n',7)
    count+=1
    if len(word) > 5:
        print(word[5])
        df['Date'] = word[5]

我现在遇到的问题是,当我从段落中提取日期时,我将其作为字符串获取作为字符串,当我尝试将它附加到新的“日期”列中时,我一直为所有条目获取相同的日期。有人能告诉我我做错了吗?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)