问题描述
我正在https://console.actions.google.com/
的网络视图上为Google Assistant建立自定义操作- 容易理解“请发送一封信给”
然后
- 很难理解地址(带有英国邮政编码的字母和数字,例如“ XX12 1XX”,以及街道名称含糊不清)
然后
- 容易理解“并且请...查询...”
所有这些都在给定场景的欢迎提示的Yaml中定义:
candidates:
- first_simple:
variants:
- speech: |-
Please ... where the address is ... ... and please ... enquiry ...
有没有一种方法可以微调这种“语音”?还是有其他方法可以让Google助手在中间部分以较慢的速度说出这些恒定的文字?
解决方法
是的,您可以使用SSML发送回信而不是文本,而文本是使用更简单的“文本转语音”模型进行转换的。
此SSML可以在您发送的部分内容中包含prosody tag with a rate属性,因此说起来慢些。
所以看起来可能像
candidates:
- first_simple:
variants:
- speech: |-
<speak>Please ... where the address is <prosody rate="30%"> ... ...</prosody> and please ... enquiry ...</speak>
您可能还希望查看say-as tag来拼写地址中的字符。 SSML中的特定部分可能看起来像
<say-as interpret-as="characters">XX12 1XX</say-as> somewhere street