如何使用具有 dkb 值的聚类算法?

问题描述

我有一个带有几何字段的数据框。 我想在几何字段上运行聚类算法(在本例中为 hdbscan)。

我正在尝试执行以下步骤:

  1. 加载 df
  2. 创建类似的函数,将字符串转换wkb 并返回两点之间的距离。

代码如下:

import pandas as pd
import hdbscan
from shapely import wkb



def load_df():
    # load dataframe with geometry column (values are in wkb format)

def sim(x,y):
    wkb_x = wkb.loads(bytes.fromhex(x))
    wkb_y = wkb.loads(bytes.fromhex(y))
    return wkb_x.distance(wkb_y)


def main():

    df = load_df()
    clusterer = hdbscan.HDBSCAN(metric=sim)
    clusterer.fit(df['geometry'])
    print("finsie")


if __name__ == "__main__":
    main()

但我收到错误(在 fit 行):

ValueError: Could not convert string to float: '010...."

如何在 wkb 值上运行 hdbscan(或任何其他集群算法)?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)