Skip to content

💰 AI 模型价格

Chat Nio 官方站 有两种计费方式。一种是随用随付的弹性计费,一种是订阅计划。

💰 官方站 1 人民币 兑换 10 点数 💰

⭐ API 中转仅支持弹性计费, 不涵盖订阅配额 ⭐

⚠ 其他站点请参阅其站点的信息,与官方站计费无关 ⚠

🎉 全部模型支持 OpenAI API 格式调用 (类似 One API) 🎉

最新的订阅计划配额请前往官方站查看,下列仅列出弹性计费价格:

最低余额限制

为了防止超出余额的部分过多,同时为了防止滥用,Chat Nio 设定了特定模型的最低余额预检,当小于该余额时,不可发起请求。

  • ✨ 按次计费模型:单次调用费用
  • ✨ Token 计费模型:1K 输入 Token 费用 + 1K 输出 Token 费用

OpenAI / Azure OpenAI

⭐ OpenAI 全部官方模型支持 Function Calling

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
gpt-3.5-turbo (0301, 0613)1 元 1 刀0.0150.02
gpt-3.5-turbo-11061 元 1 刀0.010.02
gpt-3.5-turbo-01251 元 1 刀0.0050.015
gpt-3.5-turbo-16k1 元 1 刀0.030.04
gpt-4 (0314, 0613)1 元 1 刀0.30.6
gpt-4-32k (0314, 0613)1 元 1 刀0.61.2

gpt-4-turbo

3 元 1 刀0.30.9

gpt-4-turbo-preview (1106, 0125)

1 元 1 刀0.10.3

gpt-4-vision-preview

1 元 1 刀0.10.3
dall-e-21 元 1 刀 (512x512)-0.18 / 次
dall-e-31 元 1 刀 (HD 1024x1024)-0.8 / 次

gpt-4-v

gpt-4-dalle

gpt-4-all

0.1 元一次-1 / 次

gpt-4o

0.05 元一次-0.5 / 次
azure-gpt-3.5-turbo0.4 元 1 刀 (0613)0.0060.008
azure-gpt-3.5-turbo-16k0.4 元 1 刀 (0613)0.0120.016
azure-gpt-4 (0314, 0613)0.8 元 1 刀0.240.48
azure-gpt-4-32k (0314, 0613)0.8 元 1 刀0.480.96
azure-gpt-4-turbo-preview (1106, 0125)0.8 元 1 刀0.080.24
azure-gpt-4-vision-preview0.8 元 1 刀0.080.24

gpt-3.5-free

gpt-3.5-16k-free

1 元 5000 次 (1 点数 500 次)-0.002 / 次

模型声明

  • GPT-3.5 Free 系列为逆向模型,不保证稳定性。
  • 除 GPT-4 0613 模型和逆向模型外,全部支持 Function Calling 调用。

快速接入

除常规标准格式外, Chat Nio 同时适配了更多 Developers Friendly 的调用方式:

  • GPT-4 Turbo / GPT-4 Vision Preview 支持 ⭐ 直接在输入框中输入图片 URL / Base64 进行调用 (正则实现, 推荐 URL 中不含空格, 文本内容和 URL 中不要粘连以避免提取错误)。
  • DALL-E 系列绘图模型支持 ⭐ Chat Completions 接口 (/v1/chat/completions) 调用。
  • GPT-4 DALLE 支持 ⭐ Images 接口 (/v1/images) 调用。

Tip: 除上述格式外同时也同时并优先兼容标准格式,比如 DALL-E 绘图模型优先支持 /v1/images 调用。

Midjourney & SDXL

⭐ 由 Midjourney Proxy Plus 提供支持

模型价格(点数)信息
midjourney1 / 次Relax 模式 (2~5 分钟出图)
midjourney-fast2 / 次Fast 模式 (30 秒 ~ 1 分钟出图)
midjourney-turbo4 / 次Turbo 模式 (30 秒内出图)
stable-diffusion0.25 / 次Stable Diffusion XL (不稳定)

快速接入

所有绘图模型 API 调用格式兼容:

  1. ⭐ Images 接口 (/v1/images)
  2. ⭐ Chat Completions 接口 (/v1/chat/completions)

Anthropic Claude

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)

claude-1-100k, claude-1,

claude-1.3,

cluade-slack (废弃)

对齐官网计费0.080.27
claude-2, claude-2.1对齐官网计费0.82.7
claude-3-opus-20240229价格同 gpt-4-32k
claude-3-sonnet-20240229价格同 gpt-4
claude-3-haiku-20240307价格同 gpt-3.5-turbo-16k

模型声明

  • Claude-1 / Claude-2 系列为逆向模型,不保证稳定性。
  • Claude-3 系列 支持 Function Calling 调用
  • Claude-3 OpusClaude-3 Sonnet 模型支持识别图片,调用格式同 GPT-4 Vision Preview

SparkDesk 讯飞星火

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)

spark-desk-v3

对齐官网计费 (V3.5) 0.30.3

spark-desk-v3

对齐官网计费 (V3.1) 0.30.3

spark-desk-v2

对齐官网计费 (V2.1) 0.30.3
spark-desk-v1.5 对齐官网计费 (V1.5) 0.150.15

ChatGLM 智谱清言

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
glm-4 对齐官网计费 11
glm-4v 对齐官网计费 11
glm-3-turbo 对齐官网计费 0.050.05

模型声明

  • glm-4v 模型支持识别图片,调用格式同 GPT-4 Vision Preview
  • 智谱将 API 格式从 V3 升级至 V4, 原 V3 模型将逐步废弃:
    • zhipu-chatglm-turbo (同 glm-3-turbo)
    • zhipu-chatglm-pro (已废弃)
    • zhipu-chatglm-std (已废弃)
    • zhipu-chatglm-lite (已废弃)
模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
zhipu-chatglm-turbo 对齐官网计费 0.050.05
zhipu-chatglm-pro(废弃) 对齐官网计费 0.10.1
zhipu-chatglm-std(废弃) 对齐官网计费 0.050.05
zhipu-chatglm-lite(废弃) 对齐官网计费 0.050.05

Moonshot 月之暗面

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
moonshot-v1-8k对齐官网计费0.120.12
moonshot-v1-32k对齐官网计费0.240.24
moonshot-v1-128k对齐官网计费0.60.6

DeepSeek 深度求索

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
deepseek-chat对齐官网计费0.010.02
deepseek-coder对齐官网计费0.010.02

DashScope 通义千问

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
qwen-plus对齐官网计费0.20.2
qwen-plus-net对齐官网计费0.20.2
qwen-turbo对齐官网计费0.080.08
qwen-turbo-net对齐官网计费0.080.08

INFO

  • -net 后缀模型为开启 DashScope 联网选项模型。

Google Gemini / PaLM2

模型费率回答 Token (点数 / 次数)
gemini-1.5-pro-latest1 元 200 次0.05 / 次
gemini-1.5-flash-latest1 元 200 次0.05 / 次
gemini-pro-vision1 元 200 次0.05 / 次
gemini-pro1 元 200 次0.05 / 次
chat-bison-001 (已废弃)1 元 200 次0.05 / 次

INFO

  • Gemini Pro Vision / Gemini 1.5 Pro Latest / Gemini 1.5 Flash Latest 模型支持识别图片,调用格式同 GPT-4 Vision Preview
  • Gemini Pro Vision 不支持多轮对话 (Multi Turn) 且强制输入携带图片。
  • Chat Bison 001 不支持中文对话,已被 Google 废弃。

New Bing

模型回答 Token (点数 / 次数)
bing-creative0.1 / 次
bing-balanced0.1 / 次
bing-precise0.1 / 次

New Bing 为逆向模型,不保证稳定性,出现错误为正常现象

Meta LLaMa

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)

llama-3-70b

llama-2-70b

code-llama-34b

算力平均值0.250.25

llama-3-8b

llama-2-13b

llama-2-7b

code-llama-13b

code-llama-7b

算力平均值0.10.1

LLaMa 模型不保证高速和稳定性,吐字速度随当前可用性能影响

腾讯混元

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
hunyuan对齐官网计费11

360 智脑

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
360-gpt-v9对齐官网计费0.120.12

百川 AI

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
baichuan-53b对齐官网计费0.20.2

火山方舟(抖音豆包)

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
skylark-lite-public对齐官网计费0.040.04
skylark-plus-public对齐官网计费0.080.08
skylark-pro-public对齐官网计费0.110.11
skylark-chat对齐官网计费0.110.11

Pika Text To Video (文生视频)

模型费率价格 (点数)
pika-text-to-video官网平均计费5 / 次 (一元 2 次)

Suno (文生音乐)

模型费率价格 (点数)
suno-v3官网平均计费2 / 次 (一元 5 次)

Token 计算方式

🔔 Chat Nio 的 Token 计费方式完全参照 OpenAI 官方保持一致 🔔

Tokenizer 的计算方法请查看 OpenAI Cookbox,后端使用 Tiktoken Go 库进行计算。

pkoukk / tiktoken-gogo version of tiktoken

询问模型自己使用了多少 Token 是不可行的,模型大概率只会得出错误答案。 Token 计算方法请前往 OpenAI 官方 Token 计算器 Tokenizer - OpenAI Platform 进行计算。

每次发送将产生一次请求。在一次请求中,分为 输入 Tokens输出 Tokens

  • 输入 Tokens请求的问题携带历史上下文对话 消息的 Token 数量总和。
  • 输出 Tokens:模型返回的回答消息的 Token 数量。

💰 计算步骤

  1. 每一条输入消息按照 ROLE_TOKENS + CONTENT_TOKENS + NAME_TOKENS 计算,并加入权 TokensPerMessage 参数 (一般为 3) 并相加计算总 Tokens。
  2. 输出消息的 CONTENT_TOKENS 计算输出 Tokens。
  3. 价格 = (输入 Tokens / 1000 * 输入费率) + (输出 Tokens / 1000 * 输出费率)

🔍 请求案例

假设一轮对话中,使用 GPT-4 1106 Preview 模型,且用户的对话界面类似于:

用户 > 你好
回复 < 你好!有什么我可以帮助你的吗?
用户 > 你是谁

我是一个人工智能助手,由 OpenAI 创建,旨在帮助人们回答问题、提供信息、解决问题或者进行闲聊。如果你有任何疑问或需要帮助,随时告诉我!

在本轮对话中,一共请求两次,我们挑第二次请求作为示例进行计算:

输入 Token 的结构体应类似于:

json
{
  "model": "gpt-4-1106-preview",
  "messages": [
    { "role": "user", "content": "你好" },
    { "role": "assistant", "content": "你好!有什么可以帮助你的吗?" },
    { "role": "user", "content": "你是谁" }
  ]
}
  1. 计算输入 Token (总计 6 + 21 + 8 + 3 = 38 tokens)
    • 第一条消息 内容: 你好 (2 tokens), 角色: user (1 token), 权重 (3 tokens) - 总计 6 tokens
    • 第二条消息 内容: 你好!有什么可以帮助你的吗? (17 tokens), 角色: assistant (1 token), 权重 (3 tokens) - 总计 21 tokens
    • 第三条消息 内容: 你是谁 (4 tokens), 角色: user (1 token), 权重 (3 tokens) - 总计 8 tokens
    • Reply 的前缀携带 <|im_start|>assistant<|im_sep|> (3 tokens)
  2. 计算输出 Token (总计 71 tokens)
    • 输出 内容: 我是... (71 tokens)
  3. 计算价格
    • 从上面的 gpt-4-1106-preview 价格可知,输入 Token 为 0.1 点数 / 1k token,输出 Token 为 0.3 点数 / 1k token
    • 计算价格为 (38 / 1000 * 0.1) + (71 / 1000 * 0.3) = 0.0038 + 0.0213 = 0.0251 点数

校对站点的使用记录,找到此请求的记录:

记录

输入 Token, 输出 Token 和价格全部与计算结果相符。

LightXi Inc. All Rights Reserved