问题描述
我正在寻找一种方法来允许在解析 geopy gecode.reverse 时免除丢失的字典键。我正在使用 Lambda 将字典写入列 df['Street'] 以解析另一列的经纬度。
geo = Nominatim(user_agent = "Standard_Road",timeout = 10)
geocode = RateLimiter(geo.geocode,min_delay_seconds = .75)
tqdm.pandas()
df['geom'] = df['Latitude'].map(str) + ',' + df['Longitude'].map(str)
df['geom'][0]
df['Street'] = df['geom'].progress_apply(lambda x: geo.reverse(x,language = 'en').raw['address']['road'])
这将返回字典中的道路值,直到关键“道路”不存在。所以我试图用一个简单的 if else 语句处理豁免,以在列中返回 None 或 "" 值,但是,我在下面尝试的是引发相同的 KeyError。
df['Street'] = df['geom'].progress_apply(lambda x: geo.reverse(x,language = 'en').raw['address']['road']
if df['geom'].get(geo.reverse(x,language = 'en').raw['address']['road'])
else geo.reverse(x,language = 'en').raw['address']['road'] == None)
对此的任何帮助将不胜感激!
解决方法
已修复,但也许有人有更好的解决方案。
我创建了一个变量,它只包含整个字典。那时我可以调用 .get 在数据框中创建新列。这允许填充我需要的街道数据的 None 豁免,并在字典中不存在键的地方留下空白值。
### Geo search for consistent street & zip. Creating new columns 'Street' & 'Zip Code'
geo = Nominatim(user_agent = "Standard_Road",timeout = 10)
geocode = RateLimiter(geo.reverse,min_delay_seconds = 2)
tqdm.pandas()
g = df['Latitude'].map(str) + ',' + df['Longitude'].map(str)
g[0]
d = g.progress_apply(lambda x: geo.reverse(x).raw['address'])
df['Street'] = [d.get('road') for d in d]
df['Zip Code'] = [d.get('postcode') for d in d]