文本转语音服务配置
小幻助理支持多种文本转语音服务,请根据子标题索引,跳转到你想要配置的服务段落查看。
Open AI
文档 | https://platform.openai.com/docs/api-reference/chat/create |
API 令牌 | https://platform.openai.com/account/api-keys |
Open AI 的配置相对来说很简单,只要你将 API Key 填入设置中的 访问密钥
即可。
Azure Open AI
文档 | https://learn.microsoft.com/azure/ai-services/openai/overview |
Azure 服务 | https://azure.microsoft.com/en-us/products/ai-services/openai-service |
Microsoft 与 Open AI 的关系较为特殊,有种 Open AI 特许经销商的感觉,所以你能够在 Azure 这个云服务平台创建 Open AI 资源,并按需部署 tts
, tts-hd
等 Open AI 模型。
虽然它们的模型一致,但是网络请求格式却不尽相同,所需要的配置项也不一样。
当你部署了 Open AI 资源后,你能在资源页面的 资源管理
-> 密钥和终结点
中找到所需的密钥(两个密钥任选其一即可)与终结点。
添加自定义模型
Azure Open AI 相较于 Open AI,最大的不同在于你需要手动部署需要的模型。
在应用中,Azure Open AI 不提供预置模型,仅仅填写密钥和终结点并不能让配置生效,我们还需要创建自定义模型。
在 Azure OpenAI Studio 中,你可以从模型库里部署特定的模型。
每个模型有自己的 Id,比如 Dall·E 3 的 Id 就是 dall-e-3。
在你部署模型时,Azure 会要求你提供 部署名,这个很重要,我们通过 API 与服务进行交互式,模型的标识符不是模型 ID,而是你部署模型时的部署名。
我推荐在部署模型时尽量使用和模型 ID 相同的部署名,以减少歧义。
Azure TTS
文档 | https://learn.microsoft.com/azure/ai-services/speech-service/text-to-speech |
Azure 服务 | https://azure.microsoft.com/zh-cn/products/ai-services/text-to-speech |
Azure 的语音服务本身包含了语音合成的能力,我们可以根据文档自行部署。
然后将对应资源的 访问密钥
和 区域
填写进应用设置即可。
火山引擎语音技术
文档 | https://www.volcengine.com/docs/6561/1257543 |
控制台 | https://console.volcengine.com/speech/service/10007 |
具体的服务付费规则请查看官方文档,新人注册有一定的免费额度。
小幻助理仅选取了 语音合成大模型
中的几个有代表性的音色,如果你需要的音色不在小幻助理的音色列表内,请提 issue。
腾讯云语音合成
文档 | https://cloud.tencent.com/document/product/1073/37995 |
API密钥 | https://console.cloud.tencent.com/cam/capi |
具体的服务付费规则请查看官方文档,新人注册有一定的免费额度。
小幻助理选取了 大模型音色
,精品音色
中的几个有代表性的音色,如果你需要的音色不在小幻助理的音色列表内,请提 issue。
Edge TTS
改自 edge-tts,免费使用,但可能会被部分地区的部分服务供应商阻止。
Windows 语音
通过 Windows.Media.SpeechSynthesis API 调用的 Windows 本机语音合成功能,完全免费,速度很快,就是质量不太够看。