Max模式
对比
常规模式与Max模式的主要区别在于上下文处理机制:Max模式针对最大化上下文利用进行了优化。具体表现为:
- 更大的上下文窗口
- 支持多达200次工具调用(无需请求续接)
- 文件读取工具可处理最多750行代码
上下文窗口对比
不同规模的上下文窗口在实际应用中的处理能力示例(基于真实代码库案例):
令牌数 | 规模 | 实际案例 | 可容纳内容 |
---|---|---|---|
10,000 | 小型 | 单一工具库 | Underscore.js类工具库,或若干React组件 |
60,000 | 中型 | 工具集合 | Lodash等中型库的主要部分 |
120,000 | 大型 | 完整库 | 完整工具库或大型框架核心模块 |
200,000 | 超大型 | Web框架 | Express等完整框架或Tokio等运行时库 |
1,000,000 | 巨型 | 框架核心 | Django等主流框架核心(不含测试) |
定价
Max模式按令牌数计费,Cursor按模型供应商API价格加收20%利润。费用包含所有输入内容:消息、代码文件、文件夹、工具调用及其他提供给模型的上下文。详见模型定价
通过账户面板查看令牌用量。
令牌类型
模型供应商提供分级定价(依据缓存等能力)。不同令牌类型说明如下(可使用OpenAI令牌化工具查看示例,注:实际采用不同分词机制):
类型 | 说明 | 示例 | 成本 |
---|---|---|---|
输入 | 模型首次处理的令牌 | 新消息 | 高 |
输入(缓存) | 模型曾处理并缓存的令牌 | 聊天历史消息 | 低 |
输出 | 模型返回的令牌 | 代码为主的响应 | 高 |
启用Max模式
操作步骤:
- 打开模型选择器
- 切换
Max模式
- 从下拉菜单选择兼容模型
常见问题
何时使用Max模式?
Max模式特别适用于需要深度推理的复杂问题,常规任务仍推荐使用标准模式。
为何非所有模型支持Max模式?
Max模式专为需要超大上下文的高强度操作设计。上下文窗口≤100k令牌的模型使用该模式将产生收益递减效应。