Skip to content

性能优化

减少延迟、降低成本、监控指标。

减少延迟

1. 使用更快的模型

glm-4.7gpt-4

2. 减少上下文

定期清理无关内容

3. 缓存结果

利用 Agent 的记忆

降低成本

1. 选择合适的模型

简单任务用小模型

2. 批量操作

合并多个请求

3. 限制工具调用

避免不必要的 API 调用

监控指标

bash
# 查看会话统计
/stats

# 查看模型使用情况
/status

性能优化清单

速度优化

  • [ ] 选择了合适的模型
  • [ ] 控制对话长度
  • [ ] 减少上下文
  • [ ] 启用了缓存

成本优化

  • [ ] 使用了经济模型
  • [ ] 简化了提问
  • [ ] 避免重复
  • [ ] 设置了预算

← 上一节:安全模型 | 下一节:故障排查 →