Skip to content
On this page

### 减少延迟

1. 使用更快的模型 - 如 glm-4.7gpt-4

2. 减少上下文 - 定期清理无关内容

3. 缓存结果 - 利用 Agent 的记忆

### 降低成本

1. 选择合适的模型 - 简单任务用小模型

2. 批量操作 - 合并多个请求

3. 限制工具调用 - 避免不必要的 API 调用

### 监控指标

```bash

# 查看会话统计

/stats

# 查看模型使用情况

/status

```

---