Max模式
對比
常規模式與Max模式的主要區別在於上下文處理機制:Max模式針對最大化上下文利用進行了最佳化。具體表現為:
- 更大的上下文視窗
- 支援多達200次工具呼叫(無需請求續接)
- 檔案讀取工具可處理最多750行程式碼
上下文視窗對比
不同規模的上下文視窗在實際應用中的處理能力示例(基於真實程式碼庫案例):
| 令牌數 | 規模 | 實際案例 | 可容納內容 |
|---|---|---|---|
| 10,000 | 小型 | 單一工具庫 | Underscore.js類工具庫,或若干React元件 |
| 60,000 | 中型 | 工具集合 | Lodash等中型庫的主要部分 |
| 120,000 | 大型 | 完整庫 | 完整工具庫或大型框架核心模組 |
| 200,000 | 超大型 | Web框架 | Express等完整框架或Tokio等執行時庫 |
| 1,000,000 | 巨型 | 框架核心 | Django等主流框架核心(不含測試) |
定價
Max模式按令牌數計費,Cursor按模型供應商API價格加收20%利潤。費用包含所有輸入內容:訊息、程式碼檔案、資料夾、工具呼叫及其他提供給模型的上下文。詳見模型定價
透過賬戶面板檢視令牌用量。
令牌型別
模型供應商提供分級定價(依據快取等能力)。不同令牌型別說明如下(可使用OpenAI令牌化工具檢視示例,注:實際採用不同分詞機制):
| 型別 | 說明 | 示例 | 成本 |
|---|---|---|---|
| 輸入 | 模型首次處理的令牌 | 新訊息 | 高 |
| 輸入(快取) | 模型曾處理並快取的令牌 | 聊天曆史訊息 | 低 |
| 輸出 | 模型返回的令牌 | 程式碼為主的響應 | 高 |
啟用Max模式
操作步驟:
- 開啟模型選擇器
- 切換
Max模式 - 從下拉選單選擇相容模型
常見問題
何時使用Max模式?
Max模式特別適用於需要深度推理的複雜問題,常 規任務仍推薦使用標準模式。
為何非所有模型支援Max模式?
Max模式專為需要超大上下文的高強度操作設計。上下文視窗≤100k令牌的模型使用該模式將產生收益遞減效應。