如何使用BeautifulSoup在Python中有效比较图像

问题描述

我正在尝试从存在双语数据的https://mongolia.gogo.mn/https://gogo.mn/抓取数据-同一篇文章的蒙古语和英语版本。但是,不可能自动抓取数据并映射对应于其蒙古文的英语文章,因为它们的URL完全不同。例如,https://mongolia.gogo.mn/r/162466https://gogo.mn/r/2e313。他们使用的图像是一样的。

我写了一个比较图像的代码

var=`compare -metric AE $1 $2 null: 2>&1`
echo $var

如果两个图像完全相同,则返回0。因此,我的计划是从蒙古语网站上获取所有带有其图片文章,并获取每一篇英文文章,一旦我有图片,就将它们进行比较。但是,该网站上包含大量文章,要花很长时间才能将蒙古语中的每张图片与英语中的每张图片进行比较。

如何从两侧映射文章并确保它们彼此对应?

最后我想要输出文件

https://gogo.mn/r/2e313,https://mongolia.gogo.mn/r/162466
another_article_en,another_article_mn

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)