Python - 在包含 NaN 的列/列表上使用 if-else 进行列表理解

问题描述

一个 df 列,其中包含字符串(带有额外空格)和 NaN。
我想从字符串中删除多余的空格并将 NaN 保留在它们所在的位置。
我使用了以下代码,但出现语法错误

a = pd.DataFrame({'col':[np.nan,np.nan,'Java','Java']})
a['col2'] = [i.strip() for i in a.loc[:,'col'] if isinstance(i,str) else i]
a
## The error I'm getting on using else
#> a['col2'] = [i.strip() for i in a.loc[:,str) else i]
#> SyntaxError: invalid Syntax                                         ^
## Removing "else i" prevents the error,but then does not include the NaNs 
in the result which gives the following error:
#> ValueError: Length of values (2) does not match length of index (5)

问题

  1. 在列表理解中包含 'else ' 正常工作。为什么在这种情况下它不起作用?
  2. 还有其他方法可以去除一列多余的空格吗?

解决方法

else 的位置不正确,整个 if/else 东西都在 for 之前。这是一个工作示例:

a = pd.DataFrame({'col':[np.nan,np.nan,'Java','Java']})
a['col2'] = [i.strip() if isinstance(i,str) else i for i in a.loc[:,'col']]
,

顺序不对。试试

a['col2'] = [i.strip() if isinstance(i,'col']]

如果没有 else 的话,在理解式的末尾放置一个 if 语句可以正常工作。如果两者都有,则需要放在前面。令人困惑?是的,总是让我绊倒。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...