大模型 API 定价

探索我们模型 API 的定价。通过透明的费率和灵活的选项,找到适合您需求的正确方案。

Anthropic logo

Anthropic

Anthropic的Claude模型提供先进的安全AI能力,专注于有用、无害、诚实的AI助手体验,并具备强大的推理和对话能力。

模型名称Input Token Range上下文输入(/Mt)缓存写入(/Mt)缓存读取(/Mt)输出(/Mt)Actions
claude-haiku-4-5-202510011-2,00020,000$5$13(5m)$12$10去体验
2,000-10,00020,000$3$8(5m)$8$4去体验
claude-sonnet-4-5-202509291-2,000200,000$2$4(5m)·$8(1h)$4$2去体验
2,000-20,000200,000$4$6(5m)·$10(1h)$6$4去体验
claude-3-7-sonnet-20250219-200,000$3$3.75(5m)$0.3$15去体验
claude-sonnet-4-20250514-200,000$3$3.75(5m)·$6.6(1h)$0.3$15去体验
claude-opus-4-20250514-200,000$15$18.75(5m)$1.5$75去体验
claude-opus-4-1-20250805-200,000$15$18.75(5m)$1.5$75去体验
claude-3-5-sonnet-20241022-200,000$3$3.75(5m)$0.3$15去体验
claude-3-haiku-20240307-200,000$0.25--$1.25去体验
claude-3-5-haiku-20241022-200,000$0.8--$4去体验
OpenAI

OpenAI

OpenAI的GPT系列模型提供最先进的语言理解和生成能力,在多种任务中表现出色,是业界领先的AI模型。

模型名称上下文输入(/Mt)缓存写入(/Mt)缓存读取(/Mt)输出(/Mt)操作
gpt-5-codex400,000$1.25-$0.125$10去体验
OpenAI GPT OSS 120B131,072$0.1--$0.5去体验
OpenAI: GPT OSS 20B131,072$0.05--$0.2去体验
gpt-5400,000$1.25$0.1(5m)·$0.2(1h)$0.125$10去体验
gpt-5-mini400,000$0.25-$0.025$2去体验
gpt-5-nano400,000$0.05-$0.005$0.4去体验
gpt-5-pro400,000$15$1(1h)-$120去体验
gpt-5-chat-latest400,000$1.25-$0.125$10去体验
gpt-4.1-mini1,047,576$0.4-$0.1$1.6去体验
gpt-4.1-nano1,047,576$0.1-$0.025$0.4去体验
gpt-4.11,047,576$2-$0.5$8去体验
gpt-4o-mini131,072$0.15-$0.075$0.6去体验
gpt-4o131,072$2.5-$1.25$10去体验
Gemini logo

Gemini

Google的Gemini模型提供高质量的语言处理能力,在各种NLP任务中表现出色,并具备强大的多模态能力。

模型名称上下文输入(/Mt)缓存写入(/Mt)缓存读取(/Mt)输出(/Mt)操作
Gemma3 12B131,072$0.05--$0.1去体验
gemini-2.5-flash1,048,576$0.3$0.083(5m)$0.075$2.5去体验
gemini-2.5-pro1,048,576$1.25$0.375(5m)$0.3125$10去体验
Gemma 3 27B32,768$0.119--$0.2去体验
gemini-3.1-flash-lite-preview1,000,000$1$2(5m)·$2(1h)$1$2去体验
gemini-2.5-flash-lite-preview-09-20251,048,576$0.1$0.083(5m)$0.01$0.4去体验
gemini-2.0-flash-lite1,048,576$0.075$0.083(5m)$0.0188$0.3去体验
gemini-2.5-flash-lite1,048,576$0.1$0.083(5m)$0.025$0.4去体验
gemini-2.5-flash-lite-preview-06-171,048,576$0.1--$0.4去体验
gemini-2.5-flash-preview-05-201,048,576$0.15--$3.5去体验
gemini-2.5-pro-preview-06-051,048,576$1.25--$10去体验
gemini-2.0-flash-202506091,048,576$0.15--$0.6去体验
Llama logo

Llama

Meta的Llama模型提供最先进的语言理解能力,采用开放架构设计,适用于多样化应用场景。

模型名称上下文输入(/Mt)输出(/Mt)操作
Llama 3.1 8B Instruct16,384$0.02$0.05去体验
Llama 3.3 70B Instruct131,072$0.13$0.39去体验
Llama 4 Maverick Instruct1,048,576$0.17$0.85去体验
Llama 4 Scout Instruct131,072$0.1$0.5去体验
Llama 3.2 3B Instruct32,768$0.03$0.05去体验
Qwen logo

Qwen

Qwen系列模型提供高效的语言处理能力,具有多种参数规模,涵盖从轻量级到企业级的解决方案。

Wenxin

Baidu

百度的ERNIE模型提供先进的中文语言理解和多模态能力,针对中文应用进行了优化,并具备具有竞争力的价格。

模型名称上下文输入(/Mt)输出(/Mt)操作
ERNIE 4.5 VL 424B A47B123,000$0.42$1.25去体验
ERNIE 4.5 300B A47B123,000$0.28$1.1去体验
ChatGLM

THUDM

来自清华大学的GLM系列模型,具备先进的中文语言理解和生成能力。

模型名称上下文输入(/Mt)输出(/Mt)操作
GLM-4.5131,072$0.6$2.2去体验
GLM 4.5V65,536$0.6$1.8去体验
GLM 4.1V 9B Thinking65,536$0.035$0.138去体验
Sao10K logo

Sao10K

专门针对创意和角色扮演应用优化的微调模型,具有增强的故事叙述能力。

模型名称上下文输入(/Mt)输出(/Mt)操作
L3 70B Euryale V2.1 8,192$1.48$1.48去体验
Sao10k L3 8B Lunaris 8,192$0.05$0.05去体验
L3 8B Stheno V3.28,192$0.05$0.05去体验
L31 70B Euryale V2.28,192$1.48$1.48去体验
Mistralai logo

Mistralai

来自Mistral AI的高效强大语言模型,专为商业和开源应用而设计。

模型名称上下文输入(/Mt)输出(/Mt)操作
Mistral Nemo60,288$0.04$0.17去体验
Mistral 7B Instruct32,768$0.029$0.059去体验
Deepseek logo

Deepseek

来自DeepSeek的先进AI模型,为企业级和研究应用提供前沿的推理能力和具有竞争力的价格。

模型名称Input Token Range上下文输入(/Mt)缓存写入(/Mt)缓存读取(/Mt)输出(/Mt)Actions
deepseek/deepseek-v3.1-test-20,000免费--免费去体验
DeepSeek V3.1-163,840$20$1(5m)$1$100去体验
DeepSeek R1 05281-32,768163,840$1.5$0.6(5m)$0.9$6去体验
131,072-204,800163,840$3$0.7(5m)$0.5$6去体验
32,768-131,072163,840$8$0.5(5m)$0.3$4去体验
DeepSeek V3 0324-163,840$0.28$0.14(5m)$0.14$1.14去体验
MiniMax logo

MiniMax

MiniMax AI的先进语言模型提供强大的对话AI能力,在客户服务、内容生成和创意应用中表现优异,并具备强大的多语言支持和企业级可扩展性。

模型名称上下文输入(/Mt)输出(/Mt)操作
MiniMax M11,000,000$0.55$2.2去体验
Gryphe logo

Gryphe

来自Gryphe的创新AI模型,提供专业的语言理解能力,专注于效率和适应性,适用于利基应用。

模型名称上下文输入(/Mt)输出(/Mt)操作
Mythomax L2 13B4,096$0.09$0.09去体验

Mixture of Expert

最先进AI模型的高级集合,具备高级推理、数学证明能力以及跨多个领域的前沿语言理解能力。

模型名称Input Token Range上下文输入(/Mt)缓存写入(/Mt)缓存读取(/Mt)输出(/Mt)Actions
DeepSeek V3.1-163,840$20$1(5m)$1$100去体验
OpenAI GPT OSS 120B-131,072$0.1--$0.5去体验
GLM-4.5-131,072$0.6--$2.2去体验
Qwen3 235B A22b Thinking 2507-131,072$0.3--$3去体验
GLM 4.5V-65,536$0.6--$1.8去体验
OpenAI: GPT OSS 20B-131,072$0.05--$0.2去体验
MiniMax M1-1,000,000$0.55--$2.2去体验
DeepSeek R1 05281-32,768163,840$1.5$0.6(5m)$0.9$6去体验
131,072-204,800163,840$3$0.7(5m)$0.5$6去体验
32,768-131,072163,840$8$0.5(5m)$0.3$4去体验
Qwen3 235B A22B-40,960$0.2--$0.8去体验
Llama 4 Maverick Instruct-1,048,576$0.17--$0.85去体验
Llama 4 Scout Instruct-131,072$0.1--$0.5去体验
2221-200222$2$5(5m)$4$3去体验
200-50,000222$3$6(5m)$5$4去体验
50,000-250,000222$4$7(5m)$6$5去体验
ERNIE 4.5 VL 424B A47B-123,000$0.42--$1.25去体验
ERNIE 4.5 300B A47B-123,000$0.28--$1.1去体验
Qwen3 32B-40,960$0.1--$0.45去体验
Qwen3 30B A3B-40,960$0.09--$0.45去体验
Kimi K2 Instruct-131,072$0.57--$2.3去体验
DeepSeek V3 0324-163,840$0.28$0.14(5m)$0.14$1.14去体验
test-model-jiekou-21-32,00065,000$5.1$8.1(5m)$7.1$6.1去体验
32,000-128,00065,000$5.3$8.3(5m)$7.3$6.3去体验
128,000-256,00065,000$5.2$8.2(5m)$7.2$6.2去体验
联系我们