问题描述
我想根据数据集绘制平滑曲线,该数据集跨越 x 中的 13 个数量级 [1E-9:1E4],y 中跨越 4 个数量级 [1E-6:1e-2]。>
MWE:
set log x
set log y
set xrange [1E-9:1E4]
set yrange [1E-6:1e-2]
set samples 1000
plot 'data.txt' u 1:3:(1) smooth csplines not
平滑曲线在 x=10 以上看起来不错。下面,它只是一条直线到 x=1e-9 的点。
当将样本增加到 1e4 时,平滑在 x=1 之上效果很好。对于样本 1e5,平滑在 x=0.1 等情况下效果很好。
关于如何在不将样本设置为 1e10 的情况下将平滑应用于较低数据点的任何想法(无论如何都不起作用......)?
谢谢和最好的问候! 日文
解决方法
据我所知,gnuplot 中的采样是线性的。我不知道,但也许 gnuplot 中有一个我还没有找到的对数采样。
这里有一个解决方法的建议,虽然它还不完美,但可以作为一个起点。
例如,我们的想法是将您的数据分成几十年,并分别对它们进行平滑处理。
缺点是范围之间可能存在一些重叠。当您使用 set samples
和 every ::n
时,您可以以某种方式最小化或隐藏它们,或者可能有另一种方法来消除重叠。
代码:
### smoothing over several orders of magnitude
reset session
# create some random test data
set print $Data
do for [p=-9:3] {
do for [m=1:9:3] {
print sprintf("%g %g",m*10**p,(1+rand(0))*10**(p/12.*3.-2))
}
}
set print
set logscale x
set logscale y
set format x "%g"
set format y "%g"
set samples 100
pMin = -9
pMax = 3
set table $Smoothed
myFilter(col,p) = (column(col)/10**p-1) < 10 ? column(col) : NaN
plot for [i=pMin:pMax] $Data u (myFilter(1,i)):2 smooth cspline
unset table
plot $Data u 1:2 w p pt 7 ti "Data",\
$Smoothed u 1:2 every ::3 w l ti "cspline"
### end of code
结果:
添加:
感谢@maij 指出它可以通过简单地将整个范围映射到线性空间来简化。与@maij 的解决方案相比,我会让 gnuplot 处理对数轴,并通过一些表格图的额外努力使实际的绘图命令尽可能简单。
代码:
### smoothing in loglog plot
reset session
# create some random test data
set print $Data
do for [p=-9:3] {
do for [m=1:9:3] {
print sprintf("%g %g",(1+rand(0))*10**(p/12.*3.-2))
}
}
set print
set samples 500
set table $SmoothedLog
plot $Data u (log10($1)):(log10($2)) smooth csplines
set table $Smoothed
plot $SmoothedLog u (10**$1):(10**$2) w table
unset table
set logscale x
set logscale y
set format x "%g"
set format y "%g"
set key top left
plot $Data u 1:2 w p pt 7 ti "Data",\
$Smoothed u 1:2 w l lc "red" ti "csplines"
### end of code
结果:
,使用对数刻度基本上意味着绘制值的对数而不是值本身。 Ord<A>
命令告诉 gnuplot 自动执行此操作:
- 读取数据,仍然是线性世界,还没有对数
- 计算等距网格 (
set logscale
) 上的样条曲线,仍然是线性世界 - 计算并绘制对数 (
smooth csplines
)
关键点是等距网格。假设有人选择了 set logscale
和 set xrange [1E-9:10000]
。在线性世界中,1e-9 与 10000 相比近似为 0,结果网格将是 1E-9 ~ 0,100,200,300,...,9800,9900,10000。第一个网格点在 0,第二个是 100,gnuplot 将在它们之间画一条直线。之后绘制数字的对数时,这不会改变。
这就是您在问题中已经注意到的:您需要多 10 倍的点才能获得较小指数的平滑曲线。
作为一个解决方案,我建议切换对数的计算和样条的计算。
set samples 101
结果如下: