2026年4月30日 · TrueLLMs
Logprobs 如何悄悄暴露模型身份
30 行 tokenizer 边界测试即可判断中转是真跑 GPT-5 还是悄悄切到更便宜模型。
TrueLLMs 十二个检测维度中,仅有一项独自约占 20% 权重:logprobs。其余维度都为 logprobs 不可用而备。本篇解释原因。
logprobs 实际返回什么
在 chat-completions 调用设 logprobs: true、top_logprobs: 5。响应每个位置返回被选 token 及五个最可能备选,各带对数概率。被选 token 无趣;五个备选可诊断。
不同模型族词表不同。GPT-4o 与 GPT-5 用 o200k_base——约 20 万 BPE merge。GPT-3.5 与 GPT-4 用 cl100k_base——约 10 万 merge。Claude 自有词表,公开名称不详。Gemini 又一个。各词表在不常见字符处切分边界略有不同。
30 行测试即可分辨
发送稳定 prompt 触发已知 unicode 密集补全(中文地名、带 emoji 键的 JSON)。每位置收集 top_logprobs,观察备选 token 串。
- 见带前导空格的 " the" 与 " The" 作备选?cl100k_base 或 o200k_base——OpenAI 系。
- 见多字节碎片被拆成 3 字节块?较老 cl100k_base。
- 见中文整字单 token(如「北京」)?可能 o200k_base 或中文调优词表。
- 几乎不见前导空格备选?可能 Claude。
中转为何有时剥离 logprobs
三类真实原因:
- 上游模型确实不提供。
- logprobs 增大响应体积与成本,省成本的网关默认剥掉。
- 返回 logprobs 会让偷换更易检测。剥离是最便宜地废掉半数公开指纹术的手段之一。
在审计者位置你无法区分三者。故 TrueLLMs 将不可用视为黄旗而非定论——但若被剥则最终置信度封顶 70。其余维仍可把 verdict 推到「可能被替换」,但到不了「确认」。
亲自试
TrueLLMs 就跑这套测试。打开审计工具,粘贴 Base URL 与密钥,点「快速」。Logprobs 指纹卡片会告诉你推断的 tokenizer 族是否与声称模型一致。
完整算法与阈值表见 /dimensions/logprobs-fingerprint。