性能优化
减少延迟、降低成本、监控指标。
减少延迟
1. 使用更快的模型
glm-4.7 比 gpt-4 快
2. 减少上下文
定期清理无关内容
3. 缓存结果
利用 Agent 的记忆
降低成本
1. 选择合适的模型
简单任务用小模型
2. 批量操作
合并多个请求
3. 限制工具调用
避免不必要的 API 调用
监控指标
bash
# 查看会话统计
/stats
# 查看模型使用情况
/status性能优化清单
速度优化
- [ ] 选择了合适的模型
- [ ] 控制对话长度
- [ ] 减少上下文
- [ ] 启用了缓存
成本优化
- [ ] 使用了经济模型
- [ ] 简化了提问
- [ ] 避免重复
- [ ] 设置了预算