问题描述
我在 python Flask 中有一个 websocket,它可以监听 twilio 调用。通话开始时,我想说“你好”,这是代码。
if data['event'] == "start":
speakBytes = speaker.speak("Hello") // using micrsoft cognitive service to convert the text to bytes
convertedBytes = ap.lin2ulaw(speakBytes.audio_data,1)
ws.send(responseString.format(base64.b64encode(convertedBytes),str(data['streamSid'])))
但是上面的方法不起作用。我检查了微软认知服务语音 sunthesizer 以 WAV 格式返回字节,所以我使用了 lin2ulaw
form python audioop
模块。
需要帮助。提前致谢。
解决方法
如果您使用 Twilio 连接号码,则需要使用 TwiML 回复来电:
from twilio.twiml.voice_response import VoiceResponse
response = VoiceResponse()
response.say('Hello')
return str(response)
请参阅 <Say></Say
的文档。
如果您想使用您创建的 .wav
,则需要将其保存在可访问的位置(例如 Amazon S3 存储桶),然后您可以使用 TwiML <Play></Play>
。
这里是 Twilio 开发者布道者。
您似乎正确地创建了要发送到 Twilio Media Stream 的音频,但我认为您发送的格式不正确。
Twilio Media Streams 期望媒体消息是具有以下属性的 JSON 对象:
- 事件:值“媒体”
- streamSid:流的 SID
- media:具有“payload”属性的对象,然后包含 base64 编码的 mulaw/8000 音频
这样的事情可能会奏效:
SELECT t.CityID,t.Name,COALESCE(c.CountryID,ct.CountryID) CountryID,COALESCE(c.Name,ct.Name) Name
FROM LIST l
LEFT JOIN CITY t ON l.AreaID = t.CityID
LEFT JOIN COUNTRY c ON l.AreaID = c.CountryID
LEFT JOIN COUNTRY ct ON t.CountryID = ct.CountryID
,
谢谢大家的回答。结果证明是一个小小的改变。
我不得不将 ap.lin2ulaw(speakBytes.audio_data,1)
更改为 ap.lin2ulaw(speakBytes.audio_data,4)
并且效果很好。好像是microsoft text to speech和twilio格式的兼容性。