背景
使用magenetico抓取磁力链接,由于它使用的是sqlite3, 文件会越来越大,而且不支持分布式;所以需要将其改造成MysqL,在迁移之前需要将已经抓取的15G数据导入到MysqL
从sqlite3文件dump出sql
sqlite3 database.sqlite3 sqlite3> .output /path/to/dump.sql sqlite3> .dump sqlite3> .exit
切分文件
文件比较大的时候,很有导入到一半的时候失败,这个时候需要从失败的行开始切分出一个新的sql文件来
awk '{if (NR>=6240863) print $0>dump_part.sql}' dump.sql
MysqL参数修改
[MysqLd]max_allowed_packet = 100M
sql兼容, 符号替换
# 1. 删除不包含 INSERT INTO 的行# 2. 替换表名 wrap# 3. 替换 hexsed '/INSERT INTO/!d;s/table1/`table1`/;s/table2/`table2`/;s/,X/,/' dump.sql
导入到MysqL
# 加上 force 参数, 防止部分有问题的sql阻止导入MysqL -uroot -p -f magnet < dump.sql