我应该使用哪种聚类算法和数据可视化工具来定位和可视化地理天气数据

问题描述

我正在研究天气相关数据中的统计异常值。更具体地说,我有在特定时间记录温度的 10000 个数据点的温度和位置(经度和纬度)。定位与地理天气相关的异常值并以异常值变得明显可见的方式可视化数据的最佳方法是什么?对于可视化部分,python 工具将是最受赞赏的,而定位异常值部分的算法或技术将是最有用的。 (我在考虑集群)

解决方法

这真的取决于你将如何使用它。您确实提到了异常值,因此可以使用 DBSCAN(它本质上是创建集群,不在集群中的点被视为异常值)。

如果您只关心哪些点是异常值,而不是哪些点是聚类的,则可以使用例如 Isolation Forrest

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...