错误分布:R中单个栅格文件的标准偏差

问题描述

我有一个要为其计算的栅格

  1. 均方根误差(RMSE)
  2. 平均值错误
  3. 绝对平均误差
  4. 标准偏差
require(dplyr)

# Diference max that you want
diference_max <- 2

# Create dumy data frame
day_after_reopening <- c(108,109,107,50,51,68,69,67,108,55,56,57,100,101,56)
df <- data.frame(day_after_reopening = day_after_reopening,index = seq(1:length(day_after_reopening)))

# Order the interesting columm
df <- df[order(df$day_after_reopening),]
df$test <- c(diff(df$day_after_reopening,lag = 1),0)

# Create the breaks where the diference value is grather tham a selected value
breaks <- df[df$test > diference_max,]
breaks$test <- "here"
df <- rbind(breaks,df)
df <- df[order(df$day_after_reopening,df$test),]

# Create the split points and grouping
 df <- df %>% 
        mutate(split_point = test < "here",breaks = with(rle(split_point),rep(seq_along(lengths),lengths))) %>%
        filter(split_point) %>% 
        group_by(breaks) %>%
        summarise(day_after_reopening_mean = mean(day_after_reopening))
 
    > df
# A tibble: 5 x 2
  breaks day_after_reopening_mean
   <int>                    <dbl>
1      1                     50.5
2      3                     56  
3      5                     68  
4      7                    100. 
5      9                    108. 

对于RMSE和(绝对)平均误差,我需要某种预测值(?)如何计算/获取它们?

对于标准偏差,我可以写

library(r)
r <- raster(system.file("external/test.Grd",package="raster"))

但这给了我错误

sd(r)

我已经寻找了一段时间,仅发现适用于栅格堆栈的解决方案,然后将返回另一个栅格。但是我不想要那个。对于这4个测量值中的每一个,我都希望有一个数字返回给我计算出的值。

解决方法

让我们创建具有已知标准偏差的数据:

set.seed(69)

m <- matrix(rnorm(10000),nrow = 100)

sd(m)
#> [1] 0.9979821

现在我们可以将其转换为栅格了:

library(raster)

r <- raster(m)

r
#> class      : RasterLayer 
#> dimensions : 100,100,10000  (nrow,ncol,ncell)
#> resolution : 0.01,0.01  (x,y)
#> extent     : 0,1,1  (xmin,xmax,ymin,ymax)
#> crs        : NA 
#> source     : memory
#> names      : layer 
#> values     : -3.507427,3.669151  (min,max)

如果要获取原始数据的值,可以使用data插槽:

sd(r@data@values)
#> [1] 0.9979821

或更紧凑地说,使用子设置运算符[]

sd(r[])
#> [1] 0.9979821

reprex package(v0.3.0)于2020-08-21创建

,

同时

sd(r[])

经过某种努力,它返回了NA,但是通过添加“ na.rm = TRUE”,它可以正常工作。 另一个答案可能是:

sd(as.matrix(r),na.rm = TRUE)
我认为

基本上是一样的。第一个选项读取数据,第二个选项将数据转换为矩阵。

,

有一种[3,2,4] 方法

cellStats

或者使用set.seed(69) m <- matrix(rnorm(10000),nrow = 100) sd(m) #[1] 0.9979821 library(raster) r <- raster(m) cellStats(r,sd) #[1] 0.9979821 使用terra方法

global