如何使用数组为散点图中的群集着色?

问题描述

我正在使用sklearn noisy_circles function(如链接中的1500点)来创建2个圆圈。
我有一个点引用数组,其中每个值都应该是不同的簇颜色:

nbrs_array = [ 88,88,973,984,992,972,88]

数组中有5个唯一值,因此应该有5种不同的颜色。但是当我使用以下方式绘制它时:

plt.figure(figsize=(10,10))
plt.scatter(x,y,c=nbrs_array)
plt.show()

输出

enter image description here

解决方法

类似的事情应该可以完成:

import numpy as np
from matplotlib import cm
from matplotlib import pyplot as plt
from matplotlib.colors import Normalize,to_hex
from sklearn import datasets


def get_colors(arr,cmap='viridis'):
    cmap = cm.get_cmap(cmap)
    n = len(np.unique(arr))
    colornorm = Normalize(vmin=1,vmax=n)
    hex_map = dict()
    for i,cl in enumerate(np.unique(arr)):
        hex_map[cl] = to_hex(cmap(colornorm(i + 1)))
    colors = list(map(lambda x: hex_map[x],arr))
    return colors


n_samples = 1500
data,_ = datasets.make_circles(n_samples=n_samples,factor=.5,noise=.05)
x,y = data[:,0],data[:,1]
nbrs_array = [...]

plt.figure(figsize=(10,10))
plt.scatter(x,y,c=get_colors(nbrs_array))
plt.show()