LBG向量量化-分裂因子

问题描述

我目前正在编写语音识别程序。在使用LBG(Linde-Buzo-Gray)算法生成密码本的步骤中,我读到分裂因子epsilon = 0.01(通常)

分裂因子用于根据公式分裂语音特征的质心(训练集)

Yn + = Yn *(1 + epislon)

Yn- = Yn *(1-ε)

其中n是要分割的给定代码字/质心的indes,而Yn是代码字。

此外,在生成密码本之后,将为每个语音特征向量(训练集)搜索最近的邻居,并更新质心(基本上是特征聚类)。直到编码簿的失真小于epsilon为止。

尽管我的程序似乎运行良好,但我很想知道为什么拆分因子通常设置为0.01。

感谢您的帮助。这是我第一次使用密码本和矢量量化。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)