问题描述
我目前正在编写语音识别程序。在使用LBG(Linde-Buzo-Gray)算法生成密码本的步骤中,我读到分裂因子epsilon = 0.01(通常)
分裂因子用于根据公式分裂语音特征的质心(训练集)
Yn + = Yn *(1 + epislon)
Yn- = Yn *(1-ε)
其中n是要分割的给定代码字/质心的indes,而Yn是代码字。
此外,在生成密码本之后,将为每个语音特征向量(训练集)搜索最近的邻居,并更新质心(基本上是特征聚类)。直到编码簿的失真小于epsilon为止。
尽管我的程序似乎运行良好,但我很想知道为什么拆分因子通常设置为0.01。
感谢您的帮助。这是我第一次使用密码本和矢量量化。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)