问题描述
我有一个 CSV 位置的地理坐标,以度分秒格式表示,但没有像这样的分隔符:
updateConfiguration
我有另一个 CSV 位置的地理坐标,格式为度分分钟,如下所示:
df <- data.frame(name = c("farm_1","farm_2","seabrook_1","rocks_road"),lat = c(425319.3,425317,425317.1,425323.3),long = c(705045.5,705101.1,705145.4,705219.8))
name long lat
farm_1 425319.3 705045.5
farm_2 425317 705101.1
seabrook_1 425317.1 705145.4
rocks_road 425323.3 705219.8
我想解析每个数据框中的坐标并将它们转换为十进制纬度和经度。例如,第一个数据框看起来像这样:
df_2 <- data.frame(name = c("exeter_road","hampton_hill","portsmouth_ave","pebble_ln"),GPS_cordinates_DMM = c("N42 58.855 W70 56.473","N42 58.666 W70 54.981","N42 56.579 W70 52.550","N42 55.949 W70 53.631"))
name GPS_cordinates_DMM
exeter_road N42 58.855 W70 56.473
hampton_hill N42 58.666 W70 54.981
portsmouth_ave N42 56.579 W70 52.550
pebble_ln N42 55.949 W70 53.631
第二个数据框看起来像这样:
df_dec <- data.frame(name = c("farm_1",latitude = c(42.88869444,42.88805556,42.88808333,42.88980556),longitude = c(70.84597222,70.85030556,70.86261111,70.87216667))
name latitude longitude
farm_1 42.88869 70.84597
farm_2 42.88806 70.85031
seabrook_1 42.88808 70.86261
rocks_road 42.88981 70.87217
然后我最终可以组合和映射/分析它们。
是否有可以解析和转换这些坐标类型的包或函数?
如果没有,您如何建议编写一个健壮的并且可以处理诸如第一个数据集第二行纬度中没有小数的问题?
解决方法
使用 substr
,您可以根据字符串的位置(substring
因此不需要结束位置)从字符串中刮取度、分和秒的数值,将它们转换为数字,然后计算。
f1 <- function(x) (as.numeric(substr(x,1,2))*60^2 + as.numeric(substr(x,3,4))*60 +
as.numeric(substring(x,5)))/60^2
res1 <- data.frame(name=df$name,lapply(df[-1],f1))
res1
# name lat long
# 1 farm_1 42.88869 70.84597
# 2 farm_2 42.88806 70.85031
# 3 seabrook_1 42.88808 70.86261
# 4 rocks_road 42.88981 70.87217
我们可以在 N、S、E 或 W 处分割第二个样本。使用 strsplit
并且基本上与第一个相同。
tmp <- as.data.frame(
gsub("\\D","",do.call(rbind,strsplit(df_2$GPS_cordinates_DMM,"[NSEW]"))[,-1]))
f2 <- function(x) as.numeric(substr(x,2)) +
as.numeric(substring(x,3))/1e3/60
res2 <- data.frame(name=df_2$name,setNames(lapply(tmp,f2),c("lat","lon")))
res2
# name lat lon
# 1 exeter_road 42.98092 70.94122
# 2 hampton_hill 42.97777 70.91635
# 3 portsmouth_ave 42.94298 70.87583
# 4 pebble_ln 42.93248 70.89385