问题描述
几个月前,我从https://dumps.wikimedia.org/enwiki/latest/enwiki-latest-pages-articles-multistream.xml.bz2
下载了Wikipedia最新的转储。但是,我找不到该转储已创建的日期。
- 创建时标题中没有信息:
$ bzcat tmp/wikipedia/enwiki-latest-pages-articles-multistream.xml.bz2 | head -n 5
<mediawiki xmlns="http://www.mediawiki.org/xml/export-0.10/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.mediawiki.org/xml/export-0.10/ http://www.mediawiki.org/xml/export-0.10.xsd" version="0.10" xml:lang="en"> <siteinfo> <sitename>Wikipedia</sitename> <dbname>enwiki</dbname> <base>https://en.wikipedia.org/wiki/Main_Page</base> m.gawinecki@AMDC4139:~/projects/la-recommendations$ bzcat tmp/wikipedia/enwiki-latest-pages-articles-multistream.xml.bz2 | head -n 10 <mediawiki xmlns="http://www.mediawiki.org/xml/export-0.10/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.mediawiki.org/xml/export-0.10/ http://www.mediawiki.org/xml/export-0.10.xsd" version="0.10" xml:lang="en"> <siteinfo> <sitename>Wikipedia</sitename> <dbname>enwiki</dbname> <base>https://en.wikipedia.org/wiki/Main_Page</base> <generator>Mediawiki 1.35.0-wmf.21</generator> <case>first-letter</case> <namespaces> <namespace key="-2" case="first-letter">Media</namespace> <namespace key="-1" case="first-letter">Special</namespace>
-
ls -la
显示复制但未创建的日期 - 我看到的唯一解决方案是浏览https://dumps.wikimedia.org/enwiki/并找到一个大小相同的文件(可以选择比较文件MD5哈希值)
还有其他选择吗?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)