问题描述
有一个 df 列,其中包含字符串(带有额外空格)和 NaN。
我想从字符串中删除多余的空格并将 NaN 保留在它们所在的位置。
我使用了以下代码,但出现语法错误:
a = pd.DataFrame({'col':[np.nan,np.nan,'Java','Java']})
a['col2'] = [i.strip() for i in a.loc[:,'col'] if isinstance(i,str) else i]
a
## The error I'm getting on using else
#> a['col2'] = [i.strip() for i in a.loc[:,str) else i]
#> SyntaxError: invalid Syntax ^
## Removing "else i" prevents the error,but then does not include the NaNs
in the result which gives the following error:
#> ValueError: Length of values (2) does not match length of index (5)
问题
解决方法
else
的位置不正确,整个 if/else 东西都在 for
之前。这是一个工作示例:
a = pd.DataFrame({'col':[np.nan,np.nan,'Java','Java']})
a['col2'] = [i.strip() if isinstance(i,str) else i for i in a.loc[:,'col']]
,
顺序不对。试试
a['col2'] = [i.strip() if isinstance(i,'col']]
如果没有 else 的话,在理解式的末尾放置一个 if 语句可以正常工作。如果两者都有,则需要放在前面。令人困惑?是的,总是让我绊倒。