根据其他向量生成全新的向量

问题描述

假设我有四个向量(v1,v2,v3,v4),我想创建一个新向量(vec_new),该向量与这四个向量中的任何一个都不接近。我在考虑内插法和外推法。您认为它们合适吗?它们是否也申请矢量并生成一个假设为300维的矢量?另一个可能的选择是转换矩阵。但我不确定是否适合我的关注。我认为平均和串联不是很好的选择,因为我可能接近那些四个向量。

根据我的问题,想象一下我将向量分为两类。我需要找到一个不属于这些类别的向量。

还有其他想法吗?

解决方法

根据我的评论,我不希望创建合成的“遥远”示例对现实目标有用。

即使单词反义词彼此之间也不存在最大的余弦差异,因为在所有单词含义可能的领域中,反义词彼此非常相似。例如,“热”和“冷”被认为是相反的,但它们是同一种单词,描述了相同的温度属性,并且通常可以在同一句子中相互替换。因此,尽管它们可能在字向量空间中显示出有趣的对比,但“差异的方向”并不会通过原点,而是会产生最大的余弦相异性。

在分类环境中,即使是简单的2类分类器也将需要实际的“负”示例。仅通过积极的例子,“向量空间”就不必对假设的,但不是实际存在的消极例子建模。 (如果没有训练示例显示真实的“边界”,几乎不可能将空间分为两类。)

不过,有一种简单的方法可以使向量与另一个向量最大不同:取反。这样会创建一个与原始方向完全相反的向量,因此其余弦相似度为-1.0

如果要对多个向量求最大相似的向量,我怀疑您做不到求所有向量的平均值要好得多。也就是说,对向量求平均值,然后求和该平均值向量,以找出指向与平均值完全相反的向量。

祝你好运!