2026年4月30日 · TrueLLMs

Logprobs 如何悄悄暴露模型身份

30 行 tokenizer 边界测试即可判断中转是真跑 GPT-5 还是悄悄切到更便宜模型。

TrueLLMs 十二个检测维度中，仅有一项独自约占 20% 权重：logprobs。其余维度都为 logprobs 不可用而备。本篇解释原因。

logprobs 实际返回什么

在 chat-completions 调用设 logprobs: true、top_logprobs: 5。响应每个位置返回被选 token 及五个最可能备选，各带对数概率。被选 token 无趣；五个备选可诊断。

不同模型族词表不同。GPT-4o 与 GPT-5 用 o200k_base——约 20 万 BPE merge。GPT-3.5 与 GPT-4 用 cl100k_base——约 10 万 merge。Claude 自有词表，公开名称不详。Gemini 又一个。各词表在不常见字符处切分边界略有不同。

发送稳定 prompt 触发已知 unicode 密集补全（中文地名、带 emoji 键的 JSON）。每位置收集 top_logprobs，观察备选 token 串。

三类真实原因：

在审计者位置你无法区分三者。故 TrueLLMs 将不可用视为黄旗而非定论——但若被剥则最终置信度封顶 70。其余维仍可把 verdict 推到「可能被替换」，但到不了「确认」。

TrueLLMs 就跑这套测试。打开审计工具，粘贴 Base URL 与密钥，点「快速」。Logprobs 指纹卡片会告诉你推断的 tokenizer 族是否与声称模型一致。