| tags: [ AI LLM ] categories: [ Development ]
LLM API 提供商
Nvidia
- 主页: https://build.nvidia.com/
- API 地址: https://integrate.api.nvidia.com/v1
- 可用模型:
| 模型名 | 延迟 | 发布日期 |
|---|---|---|
| z-ai/glm5 | 7s,常超时 | 2026-2-11 |
| z-ai/glm4.7 | 7s | 2025-12-22 |
| moonshotai/kimi-k2.5 | 超时 | |
| moonshotai/kimi-k2-thinking | 9.6s | 2025-12-08 |
| moonshotai/kimi-k2-instruct-0905 | 1s | 2025-09-05 |
| 1s | ||
| minimaxai/minimax-m2.5 | 1s | 2026-02-12 |
| qwen/qwen3.5-397b-a17b | 24s,常超时 | 2026-02-16 |
| qwen/qwen3.5-122b-a10b | 15s | 2026-02-24 |
| 1.2s | ||
| 0.7s | ||
| 3.8s | ||
| 2.7s | ||
| deepseek-ai/deepseek-v3.2 | 1m10s,常超时 | 2025-12-01 |
| deepseek-ai/deepseek-v3.1-terminus | 2s | 2025-08-21 |
| 1.5s | ||
| stepfun-ai/step-3.5-flash | 1.4s | 2026-02 |
| nvidia/nemontron-3-super-120b-a12b | 2.4s | 2026-03-11 |
| openai/gpt-oss-120b | 1s | 2025-08-05 |
| 0.7s |
注:延迟为发送 hello 消息收到完整响应的耗时,并不稳定。质量排名参考 https://artificialanalysis.ai 。
腾讯
- 主页: https://www.codebuddy.cn/
- 赠送:5500 积分,有效期一年
- 模型:
| ID | Name | Price |
|---|---|---|
| glm-5.0 | GLM-5.0 | x0.80 |
| glm-5.0-turbo | GLM-5.0-Turbo | x0.95 |
| glm-4.7 | GLM-4.7 | x0.23 |
| minimax-2.7 | MiniMax-M2.7 | x0.26 |
| minimax-m2.5 | MiniMax-M2.5 | x0.18 |
| kimi-k2.5 | Kimi-K2.5 | x0.45 |
| deepseek-v-2-volc | DeepSeek-V3.2 | x0.29 |
| hunyuan-2.0-thinking | Tencent HY 2.0 Think | x0.04 |
美团
- 主页: https://longcat.chat/platform/usage
- API 地址: https://api.longcat.chat/openai , https://api.longcat.chat/anthropic
- 模型: LongCat-Flash-Chat, LongCat-Flash-Thinking, LongCat-Flash-Lite, LongCat-Flash-Omni-2603;
- 赠送:公测中,每天 5000w tokens 用于 LongCat-Flash-Lite,50w tokens 用于其它模型;
智谱
- 主页: https://bigmodel.cn
- API 地址: https://open.bigmodel.cn/api/anthropic , https://open.bigmodel.cn/api/coding/paas/v4
- 模型:GLM 系列
- 赠送:200w tokens,有效期三个月;
超算互联网
- 主页: https://www.scnet.cn/
- API 地址: https://api.scnet.cn/api/llm/v1
- 模型: MiniMax-M2.5, Qwen3;
- 赠送:1000w tokens,有效期两周;