问题描述
给定两个字符串
s1 = 'abcdef'
s2 = 'bbcdefg'
目标是找到 s1 和 s2 之间的汉明距离,不仅要计算不同字符的差异,还要计算要添加到最终计数中的任何额外字符。在 s2 中,第一个字符是 'b',而不是像 s1 中的 'a',因此计数加一。但是,s2 也有 'g',而 s1 没有,使 s1 的长度多一个字符,导致它们的汉明距离计数等于 2。
理想情况下,代码应该是一行。
到目前为止我所拥有的是:
def hamming_distance(s1,s2):
return sum(c1 != c2 for c1,c2 in zip(s1,s2))
hamming_distance('abcdef','bbcdefg')
1
我使用的是 Python 3.8.5 版
解决方法
您可以尝试使用 itertools.zip_longest 来避免 zip() 停在最短的字符串上。
from itertools import zip_longest
def hamming_distance(s1,s2):
return sum(c1 != c2 for c1,c2 in zip_longest(s1,s2))
hamming_distance('abcdef','bbcdefg') # 2
hamming_distance('book','tooth') # 3