Skip to content

对话服务配置

小幻助理支持多种主流 AI 对话服务,这些服务配置各异,这篇文档会对所支持的 AI 服务如何配置进行说明。

请根据子标题索引,跳转到你想要配置的服务段落查看。

Open AI

文档https://platform.openai.com/docs/api-reference/chat/create
API 令牌https://platform.openai.com/account/api-keys

Open AI 的配置相对来说很简单,只要你将 API Key 填入设置中的 访问密钥 即可。

代理与 API 兼容

现在 Open AI 的接口数据结构几乎成为了一种通用标准,有很多的 AI 服务在暴露接口时为了更易用,都会选择以 Open AI 相似的接口地址和数据结构发布。这就是所谓的 Open AI 兼容接口

如果你正在使用的 AI 服务不在小幻助理的支持列表中,但又恰好使用了 Open AI 兼容接口,那么你就可以把该服务的地址写入 Open AI 设置区块的 终结点(API) 文本框中。

当然,还有另一种使用场景。

由于 Open AI 在部分国家或地区不可用,用户会尝试以代理服务器的方式使用 Open AI 服务,比如 Open AI API Proxy

你依然需要使用自己的 API 密钥,但不直接访问 OpenAI 服务器,而是交由代理服务进行访问,从而避免被墙或者封号。

你可以将对应的服务地址填入 终结点(API) 中,以实现 API 代理功能。比如上面的代理服务,需要填入的地址就是:https://api.openai-proxy.com/v1

WARNING

上文提到的 Open AI API Proxy 仅用作说明该使用场景,开发者不对其安全性负责,使用者需要自行辨别服务的可靠性并为之负责。

TIP

对于代理来说,版本号通常是有必要的,比如 https://api.openai-proxy.com/v1 中的 v1。 因为 API 输入框还需要兼容其它 API 服务,有些服务并不见得会在请求路径中使用版本号。

Azure Open AI

文档https://learn.microsoft.com/azure/ai-services/openai/overview
Azure 服务https://azure.microsoft.com/en-us/products/ai-services/openai-service

Microsoft 与 Open AI 的关系较为特殊,有种 Open AI 特许经销商的感觉,所以你能够在 Azure 这个云服务平台创建 Open AI 资源,并按需部署 GPT 3.5 , GPT 4o 等 Open AI 模型。

虽然它们的模型一致,但是网络请求格式却不尽相同,所需要的配置项也不一样。

当你部署了 Open AI 资源后,你能在资源页面的 资源管理 -> 密钥和终结点 中找到所需的密钥(两个密钥任选其一即可)与终结点。

密钥与终结点

将对应的值填入应用设置中。

你可能会对 API 版本感到好奇,这里是 文档,通常情况下不需要改动。

添加自定义模型

Azure Open AI 相较于 Open AI,最大的不同在于你需要手动部署需要的模型。

在应用中,Azure Open AI 不提供预置模型,仅仅填写密钥和终结点并不能让配置生效,我们还需要创建自定义模型。

Azure OpenAI Studio 中,你可以从模型库里部署特定的模型。

每个模型有自己的 Id,比如 GPT 3.5 Turbo 的 Id 就是 gpt-35-turbo。

Azure 模型部署

在你部署模型时,Azure 会要求你提供 部署名,这个很重要,我们通过 API 与服务进行交互式,模型的标识符不是模型 ID,而是你部署模型时的部署名。

我推荐在部署模型时尽量使用和模型 ID 相同的部署名,以减少歧义。但也存在例外情况,比如你部署了多个 gpt 3.5 turbo,但是它们的模型版本不同,那么你的部署名可能会是 gpt-35-turbo-1106gpt-35-turbo-0613,那么在应用中创建自定义模型时,你可以按下图所示创建:

自定义聊天模型

Gemini

文档https://ai.google.dev/gemini-api/docs
API 令牌https://ai.google.dev/gemini-api/docs/api-key

Open AI 类似,获取访问密钥后,将其填入 访问密钥 中即可。

代理

Gemini 作为谷歌提供的 AI 服务,国内用户如果要访问,也可能需要代理,这一点和 OpenAI 是一致的,请参考 Open AI 的配置方式,配置 Gemini 的代理服务。需要注意的是,Gemini 中的代理终结点不要加版本号,目前应用使用 v1-beta

Anthropic

文档https://docs.anthropic.com/zh-CN/docs/intro-to-claude
API 令牌https://console.anthropic.com/account/keys

Open AI 类似,获取访问密钥后,将其填入 访问密钥 中即可。

月之暗面

即 Moonshot。

文档https://platform.moonshot.cn/docs/api/chat#api-说明
API 令牌https://platform.moonshot.cn/console/api-keys

Open AI 类似,获取访问密钥后,将其填入 访问密钥 中即可。

智谱 AI

ChatGLM 即出于此。

文档https://open.bigmodel.cn/dev/howuse/introduction
API 令牌https://open.bigmodel.cn/usercenter/apikeys

Open AI 类似,获取访问密钥后,将其填入 访问密钥 中即可。

零一万物

文档https://platform.lingyiwanwu.com/docs
API 令牌https://platform.lingyiwanwu.com/apikeys

Open AI 类似,获取访问密钥后,将其填入 访问密钥 中即可。

DeepSeek

文档https://platform.deepseek.com/api-docs/zh-cn
API 令牌https://platform.deepseek.com/api_keys

Open AI 类似,获取访问密钥后,将其填入 访问密钥 中即可。

通义千问

文档https://help.aliyun.com/zh/dashscope/developer-reference/activate-dashscope-and-create-an-api-key
API 令牌https://dashscope.console.aliyun.com/apiKey

通义千问是阿里公开的大语言模型,它托管在阿里云的灵积平台,所以这要求你注册并开通阿里灵积服务。

阿里灵积本身是有自己的 API 接口和数据结构的,但是比较好的一点是,阿里灵积同时提供了 Open AI 适配接口,小幻助理在这里直接使用了阿里灵积提供的适配接口,即:

https://dashscope.aliyuncs.com/compatible-mode/v1

所以它支持的模型是有限的,具体参考这篇文档:OpenAI接口兼容

文心一言

文档https://cloud.baidu.com/doc/WENXINWORKSHOP/s/flfmc9do2
API 令牌https://console.bce.baidu.com/qianfan/ais/console/applicationConsole/application

文心一言是百度提供的大语言模型,它托管在百度云的千帆大模型平台。它有着自己的托管步骤,甚至对于不同的模型需要单独开通服务,这一点请在其文档中查阅。

在千帆大模型平台创建应用后,将 API Key 填入 API 密钥(API Key),将 Secret Key 填入 密文密钥(Secret Key) 即可。

自定义模型

千帆大模型平台支持非常多常见的大语言模型,如果你打算使用的模型不在预定义模型列表中,请在千帆平台的模型列表内确认模型 ID,然后在应用内创建自定义模型。

比如你想要使用 Meta-Llama-3-8B 这个模型,那么就可以按照以下步骤来操作:

  1. 在千帆模型平台控制台的 在线服务 板块中找到 Meta-Llama-3-8B,从提示显示的服务地址可知,其模型 ID 是 llama_3_8b

    千帆 Meta-Llama-3-8B

  2. 根据模型 ID 创建自定义模型

    自定义聊天模型

腾讯混元

文档https://cloud.tencent.com/document/product/1729/105701
API 令牌https://console.cloud.tencent.com/cam/capi

混元大模型托管在腾讯云上,你需要在 API 密钥管理 中创建一个密钥。

需要注意的是,由于安全限制,密钥的 Secret Key 仅在创建密钥时可见。

在应用中,设置项的对应关系是:

  • Secret Key -> 密文密钥(Secret Key)
  • Secret Id -> 密文 ID(Secret ID)

讯飞星火

文档https://www.xfyun.cn/doc/spark/Web.html
API 令牌https://console.xfyun.cn/services/bm35

星火大模型是科大讯飞推出的大语言模型,在使用该模型家族前,你需要在 讯飞开放平台 先注册一个应用,然后开通对应的模型服务。

未开通的模型将无法使用。

注册后,你能在 星火认知大模型 的模型页中找到 服务接口认证信息,这些是你需要填入应用中的设置项,具体对应关系如下:

  • APPID -> 应用 ID
  • APISecret -> 密文(Secret)
  • APIKey -> API 密钥(API Key)

字节豆包

文档https://www.volcengine.com/docs/82379/1263482
API 令牌https://console.volcengine.com/ark/region:ark+cn-beijing/apiKey

豆包大模型是字节跳动推出的大语言模型,在使用该模型前,你需要在 火山引擎 注册账户,然后在火山方舟的模型推理页面 创建推理接入点.

你必须手动部署模型接入点,火山引擎没有提供预设的推理接入点。

之后,你需要在 API Key 管理 中创建一个 API Key,将其填入应用中的设置项。

自定义模型

请参照 创建推理接入点 先部署模型。

然后在应用中点击创建自定义模型,将推理接入点 ID(ep-xxxxxxx)粘贴进模型 ID,然后给自定义模型取一个易读的名称,这样就创建好了一个自定义模型,然后就可以开始和这个模型聊天了。

Silicon Flow

文档https://openrouter.ai/docs/quick-start
API 令牌https://docs.siliconflow.cn/docs/4-api调用

Open AI 类似,获取访问密钥后,将其填入 访问密钥 中即可。

OpenRouter

文档https://openrouter.ai/docs/quick-start
API 令牌https://openrouter.ai/keys

Open AI 类似,获取访问密钥后,将其填入 访问密钥 中即可。

Together AI

文档https://docs.together.ai/docs/quickstart
API 令牌https://api.together.xyz/settings/api-keys

Open AI 类似,获取访问密钥后,将其填入 访问密钥 中即可。

Groq

文档https://console.groq.com/docs/quickstart
API 令牌https://console.groq.com/keys

Open AI 类似,获取访问密钥后,将其填入 访问密钥 中即可。

Perplexity

文档https://docs.perplexity.ai/docs/getting-started
API 令牌https://www.perplexity.ai/settings/api

Open AI 类似,获取访问密钥后,将其填入 访问密钥 中即可。

Mistral AI

文档https://docs.mistral.ai/
API 令牌https://console.mistral.ai/api-keys/

Open AI 类似,获取访问密钥后,将其填入 访问密钥 中即可。

Ollama

文档https://github.com/ollama/ollama/blob/main/README.md#quickstart
服务地址默认为 http://localhost:11434/v1
API 令牌默认为 ollama

Ollama 是一个热门的本地模型托管服务,它自身的使用已经足够写一篇万余字的文档,这里不再赘述,请自行学习。

小幻助理支持以 API 接口的形式访问 Ollama,Ollama 提供了 Open AI 适配接口,使得小幻助理可以简单地接入。

相应的,由于是在本地运行大模型,应用没有内置任何初始模型,你需要根据当前 ollama 已经拉取到本地的模型创建自定义模型。

创建自定义模型

假设你刚刚安装 ollama,并打算运行 Qwen 2(通义千问 2) 大模型,你需要按如下步骤操作:

  1. 通过 ollama 拉取模型到本地(这里以 qwen2 0.5b 举例)

    shell
    ollama pull qwen2:0.5b
  2. 调用以下命令确认模型已经下载到本地:

    shell
    ollama list

    它应该返回类似下面的内容:

    shell
    NAME                    ID              SIZE    MODIFIED
    qwen2:0.5b              6f48b936a09f    352 MB  36 seconds ago
  3. 在应用中根据模型名称创建自定义模型:

    自定义聊天模型

基于 GPLv3 许可发布