问题描述
我正在尝试从存在双语数据的https://mongolia.gogo.mn/
和https://gogo.mn/
抓取数据-同一篇文章的蒙古语和英语版本。但是,不可能自动抓取数据并映射对应于其蒙古文的英语文章,因为它们的URL完全不同。例如,https://mongolia.gogo.mn/r/162466
和https://gogo.mn/r/2e313
。他们使用的图像是一样的。
var=`compare -metric AE $1 $2 null: 2>&1`
echo $var
如果两个图像完全相同,则返回0。因此,我的计划是从蒙古语网站上获取所有带有其图片的文章,并获取每一篇英文文章,一旦我有了图片,就将它们进行比较。但是,该网站上包含大量文章,要花很长时间才能将蒙古语中的每张图片与英语中的每张图片进行比较。
如何从两侧映射文章并确保它们彼此对应?
https://gogo.mn/r/2e313,https://mongolia.gogo.mn/r/162466
another_article_en,another_article_mn
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)