性能优化

减少延迟、降低成本、监控指标。

减少延迟

1. 使用更快的模型

glm-4.7 比 gpt-4 快

2. 减少上下文

定期清理无关内容

3. 缓存结果

利用 Agent 的记忆

降低成本

1. 选择合适的模型

简单任务用小模型

2. 批量操作

合并多个请求

3. 限制工具调用

避免不必要的 API 调用

监控指标

bash

# 查看会话统计
/stats

# 查看模型使用情况
/status

性能优化清单

速度优化

[ ] 选择了合适的模型
[ ] 控制对话长度
[ ] 减少上下文
[ ] 启用了缓存

成本优化

[ ] 使用了经济模型
[ ] 简化了提问
[ ] 避免重复
[ ] 设置了预算

← 上一节：安全模型 | 下一节：故障排查 →