OpenRouter、Anthropic、火山引擎、Siliconflow 使用指南
在 AI 应用开发中,选择合适的 LLM API 服务至关重要。无论你是在构建智能对话系统、开发 AI Agent,还是参加 AI Hackathon,本文都将为你提供全面的 API 使用指南,涵盖 OpenRouter、Anthropic API、火山引擎和 Siliconflow 等主流服务。
为什么需要多个 API 服务?
不同的 LLM 模型有各自的优势,特别是在开发 AI Agent 时,需要根据具体场景选择合适的模型:
- Claude(Anthropic):擅长复杂推理、编程和 Agent 任务,特别适合需要深度思考的场景
- Gemini(Google):在长文本处理、多模态理解方面表现出色,适合处理图片、视频等多媒体内容
- GPT(OpenAI):图片理解和数学推理能力强,日常对话体验优秀
- 豆包(字节跳动):国内访问速度快,语音对话体验好,特别适合实时交互场景
- 开源模型:成本低,可定制性强,适合大规模部署
OpenRouter:一站式访问所有模型
OpenRouter 是我最推荐的服务,它提供了统一的 API 接口来访问各种模型,无需担心地域限制。对于 AI Agent 开发者来说,这意味着可以轻松切换和组合不同的模型。
优势
- 无地域限制:可以直接从国内访问各种模型
- 统一接口:使用 OpenAI 格式的 API,简化编程
- 模型丰富:支持 Claude、Gemini、GPT、Grok 等主流模型
- 便于 Agent 开发:可以在一个系统中灵活调用不同能力的模型
使用示例
1 | from openai import OpenAI |
AI Agent 开发的模型选择策略
在开发 AI Agent 时,不同的任务需要不同的模型:
- 编程和 Agent 核心逻辑(工具调用):
anthropic/claude-sonnet-4
- 长文本分析、报告生成、多模态:
google/gemini-2.5-pro
- 实时响应(快思考):
google/gemini-2.5-flash
- 日常对话:
openai/gpt-4o
Anthropic 官方 API
虽然 OpenRouter 很方便,但某些场景下还是需要使用官方 API,比如使用 Claude Code 或 Computer Use 功能。
注意事项
⚠️ 重要:Anthropic API key 不要在国内和香港 IP 使用,需要使用海外 IP 访问。
使用场景
- Claude Code
- Computer Use(让 Agent 操作计算机)
⚠️ 特殊功能提示:Claude 在 Agent 开发中的工具调用(Tool Use)和思考模式(Thinking Mode)需要特殊的语法格式。请参考 Anthropic 官方文档 获取最新的使用方法。
火山引擎:豆包模型
火山引擎提供的豆包模型在国内访问延迟低,特别适合对响应速度要求高的实时 Agent 应用。
AI Agent 开发的模型选择
火山引擎提供了三种不同能力的豆包模型,适合不同的 AI Agent 场景:
1. 快慢思考架构
在开发 “快慢思考” 架构的 Agent 时:
快思考模型(低延迟)- doubao-seed-1-6-flash-250615
:
1 | response = client.chat.completions.create( |
慢思考模型(深度推理)- doubao-seed-1-6-thinking-250615
:
1 | response = client.chat.completions.create( |
2. 多模态 Agent
适合需要处理图片的 Agent - doubao-seed-1-6-250615
:
1 | import os |
Siliconflow:开源模型的最佳选择
Siliconflow 为 AI Agent 开发提供了完整的模型生态,包括 LLM、TTS(文本转语音)和 ASR(语音识别)。
LLM 模型
推荐用于 Agent 开发的模型:
- Kimi K2 Instruct:
moonshotai/Kimi-K2-Instruct
- DeepSeek R1 0528:
deepseek-ai/DeepSeek-R1
- Qwen3 235B:
Qwen/Qwen3-235B-A22B-Instruct-2507
1 | import requests |
语音 Agent 开发套件
TTS 文本转语音
使用 Fish Audio 或 CosyVoice 进行语音合成:
1 | import requests |
ASR 语音识别
使用 SenseVoice 进行语音识别:
1 | from openai import OpenAI |
使用 AI 辅助开发 Agent
在开发 AI Agent 时,推荐使用 Cursor 等 AI 辅助编程工具,实践 “用 Agent 开发 Agent”:
- 文档先行:先让 AI 生成设计文档,迭代优化后再编码
- 选对模型:使用带思考能力的模型(如 Claude 4 Sonnet)
- 测试驱动:让 AI 为代码编写测试用例
AI 代码编辑器选择
除了 Cursor、Windsurf、Trae 这些需要氪金的 AI 代码编辑器,你还可以使用 OpenRouter API key 在其他编辑器中获得类似体验:
- Void AI 编辑器:支持直接使用 OpenRouter API key,功能与 Cursor 类似
- VSCode Cline 插件:可以配置 OpenRouter API key,在 VSCode 中实现 AI 辅助编程
使用 OpenRouter 的优势是可以在同一个 API key 下切换不同的模型,找到最适合你编程风格的 AI 助手。
总结
选择合适的 LLM API 服务是构建优秀 AI Agent 的关键:
- 地域限制:优先使用 OpenRouter 避免访问问题
- 任务需求:根据 Agent 的具体功能选择擅长的模型
- 延迟要求:实时交互选择低延迟模型,深度思考选择能力强的模型
- 成本考虑:平衡性能和成本,合理使用开源模型
- 架构设计:采用混合模型架构,发挥不同模型的优势
快速参考:常用模型列表
用途 | 推荐模型 | 特点 |
---|---|---|
编程/Agent 开发 | anthropic/claude-sonnet-4 |
代码能力强,工具调用稳定 |
深度推理 | anthropic/claude-sonnet-4 |
支持思考过程输出 |
快速响应 | google/gemini-2.5-flash |
延迟极低,适合实时交互 |
长文本处理 | google/gemini-2.5-pro |
上下文窗口大,理解能力强 |
平衡性能 | openai/gpt-4o |
各方面能力均衡 |
成本优化 | google/gemini-2.5-flash |
性价比高 |
国内低延迟 | doubao-seed-1-6-flash-250615 |
国内访问快 |
通过合理组合使用这些 API 服务,你可以构建出功能强大、响应迅速的 AI Agent。记住,优秀的 Agent 不是依赖单一模型,而是懂得在合适的场景使用合适的工具。
祝你在 AI Agent 开发之旅中取得成功!