Skip to content

令牌(Token)

一、是什么?

一句话定义

Token 是 AI 大模型处理文本的最小单位,也是计费的基本单位。它不等于一个字,也不等于一个词,而更像一种「语义碎片」。

二、工作原理

AI 不能直接「读」文字,它需要先把文本转换成数字序列,这个过程叫 Tokenization

三、Token 与计费

  • 中文通常更费 Token
  • 英文通常更省 Token
  • 输入和输出一般都要分别计费

四、为什么长对话会特别贵?

因为系统经常会把前文历史一起重新发送给模型,所以 Token 成本会越聊越高。

五、通俗比喻

  • Token 像拼图碎片
  • Token 像出租车计价器
  • 上下文窗口像油箱

六、实用建议: 如何省 Token?

方法具体做法
精简提问去掉废话,直奔主题
指定回答长度如「用 100 字以内回答」
适时开新对话历史太长时不要硬拖
使用记忆压缩先总结前文
按需使用模型简单问题用便宜模型

七、你现在只需要记住什么

  • Token 是模型处理文本和计费的基本单位
  • 成本和上下文窗口都与 Token 直接相关
  • 很多工程优化,本质上都是在「让有限的 Token 更值钱」

八、推荐阅读

From Zero, To Next