问题描述
我正在尝试读出一些人口普查数据。它由大约 53 个月的行组成,我的一个函数似乎以二次方的方式增加了计算时间。我想过滤所有有区域供热的地区。这个小小的列表理解让计算时间爆炸:
selection_dh = [x in ids_dh for x in ids_all]
ids_dh 是包含区域供热的区域 ID 列表,ids_all 是所有区域 ID 的列表。 ids_dh 大约是 ids_all 长度的十分之一。
知道如何更快地编写此代码吗?
谢谢!
census_dh= census_all.loc[census_all.Expression== "district Heating",:]
ids_all = list(census_all.Grid_ID_100m)
ids_dh = list(census_dh.Grid_ID_100m)
selection_dh = [x in ids_dh for x in ids_all]
解决方法
怎么样
selection_dh = np.isin(ids_all,ids_dh)