OpenRouter、Anthropic、火山引擎、Siliconflow 使用指南
在 AI 应用开发中,选择合适的 LLM API 服务至关重要。无论你是在构建智能对话系统、开发 AI Agent,还是参加 AI Hackathon,本文都将为你提供全面的 API 使用指南,涵盖 OpenRouter、Anthropic API、火山引擎和 Siliconflow 等主流服务。
为什么需要多个 API 服务?
不同的 LLM 模型有各自的优势,特别是在开发 AI Agent 时,需要根据具体场景选择合适的模型:
- Claude(Anthropic):擅长复杂推理、编程和 Agent 任务,特别适合需要深度思考的场景
- Gemini(Google):在长文本处理、多模态理解方面表现出色,适合处理图片、视频等多媒体内容
- GPT(OpenAI):图片理解和数学推理能力强,日常对话体验优秀
- 豆包(字节跳动):国内访问速度快,语音对话体验好,特别适合实时交互场景
- 开源模型:成本低,可定制性强,适合大规模部署
OpenRouter:一站式访问所有模型
OpenRouter 是我最推荐的服务,它提供了统一的 API 接口来访问各种模型,无需担心地域限制。对于 AI Agent 开发者来说,这意味着可以轻松切换和组合不同的模型。
优势
- 无地域限制:可以直接从国内访问各种模型
- 统一接口:使用 OpenAI 格式的 API,简化编程
- 模型丰富:支持 Claude、Gemini、GPT、Grok 等主流模型
- 便于 Agent 开发:可以在一个系统中灵活调用不同能力的模型
使用示例
1 | from openai import OpenAI |
AI Agent 开发的模型选择策略
在开发 AI Agent 时,不同的任务需要不同的模型:
- 编程和 Agent 核心逻辑(工具调用):
anthropic/claude-sonnet-4
- 长文本分析、报告生成、多模态:
google/gemini-2.5-pro
- 实时响应(快思考):
google/gemini-2.5-flash
- 日常对话:
openai/gpt-4o
Anthropic 官方 API
虽然 OpenRouter 很方便,但某些场景下还是需要使用官方 API,比如使用 Claude Code 或 Computer Use 功能。
注意事项
⚠️ 重要:Anthropic API key 不要在国内和香港 IP 使用,需要使用海外 IP 访问。
使用场景
- Claude Code
- Computer Use(让 Agent 操作计算机)
⚠️ 特殊功能提示:Claude 在 Agent 开发中的工具调用(Tool Use)和思考模式(Thinking Mode)需要特殊的语法格式。请参考 Anthropic 官方文档 获取最新的使用方法。
火山引擎:豆包模型
火山引擎提供的豆包模型在国内访问延迟低,特别适合对响应速度要求高的实时 Agent 应用。
AI Agent 开发的模型选择
火山引擎提供了三种不同能力的豆包模型,适合不同的 AI Agent 场景:
1. 快慢思考架构
在开发 “快慢思考” 架构的 Agent 时:
快思考模型(低延迟)- doubao-seed-1-6-flash-250615
:
1 | response = client.chat.completions.create( |
慢思考模型(深度推理)- doubao-seed-1-6-thinking-250615
:
1 | response = client.chat.completions.create( |
2. 多模态 Agent
适合需要处理图片的 Agent - doubao-seed-1-6-250615
:
1 | import os |
Siliconflow:开源模型的最佳选择
Siliconflow 为 AI Agent 开发提供了完整的模型生态,包括 LLM、TTS(文本转语音)和 ASR(语音识别)。
LLM 模型
推荐用于 Agent 开发的模型:
- Kimi K2 Instruct:
moonshotai/Kimi-K2-Instruct
- DeepSeek R1 0528:
deepseek-ai/DeepSeek-R1
- Qwen3 235B:
Qwen/Qwen3-235B-A22B-Instruct-2507
⚠️ 重要提示:不建议使用 DeepSeek 进行工具调用(Tool Calling),DeepSeek 在工具调用方面的能力相对较弱。如果需要工具调用功能,建议选择 Claude、Gemini 系列模型,或 OpenAI o3/GPT-4.1、Grok-4。如果只能使用国内模型,建议使用 Kimi K2。
1 | import requests |
语音 Agent 开发套件
TTS 文本转语音
使用 Fish Audio 或 CosyVoice 进行语音合成:
1 | import requests |
ASR 语音识别
使用 SenseVoice 进行语音识别:
1 | from openai import OpenAI |
使用 AI 辅助开发 Agent
在开发 AI Agent 时,推荐使用 Cursor 等 AI 辅助编程工具,实践 “用 Agent 开发 Agent”:
- 文档先行:先让 AI 生成设计文档,迭代优化后再编码
- 选对模型:使用带思考能力的模型(如 Claude 4 Sonnet)
- 测试驱动:让 AI 为代码编写测试用例
⚠️ 重要提醒:LLM 自动生成的模型名字通常比较老,用法也经常错误,这是因为 LLM 的训练数据较老,而模型进展非常快。因此写 LLM 调用相关代码时,一定要:
- 让 Cursor 按照最新的官方文档编写代码
- 在 prompt 中明确指定模型类型和版本
- 不要尝试让 Cursor 自己随意生成模型调用代码
- 主动提供最新的 API 文档链接给 AI 助手参考
AI 代码编辑器选择
除了 Cursor、Windsurf、Trae 这些需要氪金的 AI 代码编辑器,你还可以使用 OpenRouter API key 在其他编辑器中获得类似体验:
- Void AI 编辑器:开源,支持直接使用 OpenRouter API key,功能与 Cursor 类似
- VSCode Cline 插件:可以配置 OpenRouter API key,在 VSCode 中实现 AI 辅助编程
使用 OpenRouter 的优势是可以在同一个 API key 下切换不同的模型,找到最适合你编程风格的 AI 助手。
AI Agent 调试技巧
在开发 AI Agent 过程中,调试是最重要的环节之一。以下是一些实用的调试建议:
理解 LLM 的工作方式
要把 LLM 想象成一个人,还得是没有任何要做的事情背景,但足够聪明,有很多通用知识的人(类似:一个清华姚班刚毕业的学生)。此时必须给他足够清晰的 instruction,足够完整的 context。
完整检查输入内容
发给 LLM 的 context 在调试阶段最好完整的看一遍,确保:
- 结构化内容格式正确:JSON、XML 等结构化数据都正确格式化
- System Prompt 正确:指令清晰明确,没有歧义
- 历史轨迹完整:Agent 执行的历史轨迹包含:
- 用户说的话
- LLM 内部思考过程
- 给用户的回复
- Tool Call 和 Tool Call Result
- 顺序正确:所有交互记录按时间顺序排列,没有遗漏或错乱
调试最佳实践
- 逐步验证:从简单场景开始,逐步增加复杂度
- 日志详细:记录完整的输入输出,便于问题定位
- 模型对比:在不同模型上测试,找出最适合的模型组合
总结
选择合适的 LLM API 服务是构建优秀 AI Agent 的关键:
- 地域限制:优先使用 OpenRouter 避免访问问题
- 任务需求:根据 Agent 的具体功能选择擅长的模型
- 延迟要求:实时交互选择低延迟模型,深度思考选择能力强的模型
- 成本考虑:平衡性能和成本,合理使用开源模型
- 架构设计:采用混合模型架构,发挥不同模型的优势
快速参考:常用模型列表
用途 | 推荐模型 | 特点 |
---|---|---|
编程/Agent 开发 | anthropic/claude-sonnet-4 |
代码能力强,工具调用稳定 |
低延迟响应 | google/gemini-2.5-flash |
延迟极低,适合实时交互 |
长文本处理 | google/gemini-2.5-pro |
上下文窗口大,理解能力强 |
文档写作 | google/gemini-2.5-pro |
思考深入,语言简洁流畅 |
平衡性能 | openai/gpt-4o |
各方面能力均衡 |
成本优化 | google/gemini-2.5-flash |
性价比高 |
低成本 Agent 开发 | moonshotai/Kimi-K2-Instruct |
开源模型,成本低,效果也不错 |
国内低延迟响应 | doubao-seed-1-6-flash-250615 |
国内延迟极低,适合实时交互 |
中文创意写作 | deepseek-ai/DeepSeek-R1 |
中文表达能力强 |
语音识别 | FunAudioLLM/SenseVoiceSmall |
延迟低,成本低 |
语音合成 | fishaudio/fish-speech-1.5 |
延迟低,成本低 |
通过合理组合使用这些 API 服务,你可以构建出功能强大、响应迅速的 AI Agent。记住,优秀的 Agent 不是依赖单一模型,而是懂得在合适的场景使用合适的工具。
祝你在 AI Agent 开发之旅中取得成功!