python – 文本文件之间的交集

如何根据原始文本计算两个文本文件之间的交集?解决方案是使用shell命令还是用Python,Elisp或其他常用脚本语言表达并不重要.

我知道comm和grep -Fxv -f file1 file2.两者都假设我对线的交叉感兴趣,而我对字符的交集感兴趣(在计算匹配所需的字符数上最少).

奖励点为效率.

如果文件1包含

foo bar baz-fee

和文件2包含

fee foo bar-faa

那我想看看

> foo吧
>费用

假设最小匹配长度为3.

解决方法:

您正在寻找Python的difflib模块(在标准库中),特别是difflib.SequenceMatcher.

相关文章

用的openwrt路由器,家里宽带申请了动态公网ip,为了方便把2...
#!/bin/bashcommand1&command2&wait从Shell脚本并行...
1.先查出MAMP下面集成的PHP版本cd/Applications/MAMP/bin/ph...
1、先输入locale-a,查看一下现在已安装的语言2、若不存在如...
BashPerlTclsyntaxdiff1.进制数表示Languagebinaryoctalhexa...
正常安装了k8s后,使用kubect工具后接的命令不能直接tab补全...