找出两个长度不等的字符串之间的差异

问题描述

给定两个字符串

s1 = 'abcdef'
s2 = 'bbcdefg'

目标是找到 s1 和 s2 之间的汉明距离,不仅要计算不同字符的差异,还要计算要添加到最终计数中的任何额外字符。在 s2 中,第一个字符是 'b',而不是像 s1 中的 'a',因此计数加一。但是,s2 也有 'g',而 s1 没有,使 s1 的长度多一个字符,导致它们的汉明距离计数等于 2。

理想情况下,代码应该是一行。

到目前为止我所拥有的是:

def hamming_distance(s1,s2):
    return sum(c1 != c2 for c1,c2 in zip(s1,s2))

hamming_distance('abcdef','bbcdefg')

1

我使用的是 Python 3.8.5 版

解决方法

您可以尝试使用 itertools.zip_longest 来避免 zip() 停在最短的字符串上。

from itertools import zip_longest

def hamming_distance(s1,s2):
    return sum(c1 != c2 for c1,c2 in zip_longest(s1,s2))

hamming_distance('abcdef','bbcdefg')  # 2
hamming_distance('book','tooth')      # 3