Skip to content

文本转语音服务配置

小幻助理支持多种文本转语音服务,请根据子标题索引,跳转到你想要配置的服务段落查看。

Open AI

文档https://platform.openai.com/docs/api-reference/chat/create
API 令牌https://platform.openai.com/account/api-keys

Open AI 的配置相对来说很简单,只要你将 API Key 填入设置中的 访问密钥 即可。

Azure Open AI

文档https://learn.microsoft.com/azure/ai-services/openai/overview
Azure 服务https://azure.microsoft.com/en-us/products/ai-services/openai-service

Microsoft 与 Open AI 的关系较为特殊,有种 Open AI 特许经销商的感觉,所以你能够在 Azure 这个云服务平台创建 Open AI 资源,并按需部署 tts , tts-hd 等 Open AI 模型。

虽然它们的模型一致,但是网络请求格式却不尽相同,所需要的配置项也不一样。

当你部署了 Open AI 资源后,你能在资源页面的 资源管理 -> 密钥和终结点 中找到所需的密钥(两个密钥任选其一即可)与终结点。

密钥与终结点

添加自定义模型

Azure Open AI 相较于 Open AI,最大的不同在于你需要手动部署需要的模型。

在应用中,Azure Open AI 不提供预置模型,仅仅填写密钥和终结点并不能让配置生效,我们还需要创建自定义模型。

Azure OpenAI Studio 中,你可以从模型库里部署特定的模型。

每个模型有自己的 Id,比如 Dall·E 3 的 Id 就是 dall-e-3。

Azure 模型部署

在你部署模型时,Azure 会要求你提供 部署名,这个很重要,我们通过 API 与服务进行交互式,模型的标识符不是模型 ID,而是你部署模型时的部署名。

我推荐在部署模型时尽量使用和模型 ID 相同的部署名,以减少歧义。

Azure TTS

文档https://learn.microsoft.com/azure/ai-services/speech-service/text-to-speech
Azure 服务https://azure.microsoft.com/zh-cn/products/ai-services/text-to-speech

Azure 的语音服务本身包含了语音合成的能力,我们可以根据文档自行部署。

然后将对应资源的 访问密钥区域 填写进应用设置即可。

火山引擎语音技术

文档https://www.volcengine.com/docs/6561/1257543
控制台https://console.volcengine.com/speech/service/10007

具体的服务付费规则请查看官方文档,新人注册有一定的免费额度。

小幻助理仅选取了 语音合成大模型 中的几个有代表性的音色,如果你需要的音色不在小幻助理的音色列表内,请提 issue。

腾讯云语音合成

文档https://cloud.tencent.com/document/product/1073/37995
API密钥https://console.cloud.tencent.com/cam/capi

具体的服务付费规则请查看官方文档,新人注册有一定的免费额度。

小幻助理选取了 大模型音色精品音色 中的几个有代表性的音色,如果你需要的音色不在小幻助理的音色列表内,请提 issue。

Edge TTS

改自 edge-tts,免费使用,但可能会被部分地区的部分服务供应商阻止。

Windows 语音

通过 Windows.Media.SpeechSynthesis API 调用的 Windows 本机语音合成功能,完全免费,速度很快,就是质量不太够看。

基于 GPLv3 许可发布