TrueLLMstruellms.com

Token 用量与模型身份审计 · OpenAI 兼容

维度 · 计分权重 0%

自我识别探测

本维度检测什么

问模型“你是谁”仍保留展示，因为用户会期待看到，但它明确只是诊断。system prompt 或代理改写几乎可以强制任意答案。

算法

发送直接身份问题，扫描响应是否包含声称模型或冲突模型家族。原文作为轶事证据保存。

阈值

条件	对 verdict 的贡献
提到声称模型	诊断匹配
提到其他模型	诊断异常
未提到模型	诊断证据不足

局限

该信号极易伪造，绝不能作为身份或偷换证明。

返回完整方法论

免责声明 · 关于检测信号的解读

任何单一信号都不能证明恶意行为。中转站可能因合法原因（区域路由、A/B 测试、降级策略、缓存优化）导致部分指标异常。
Token ratio 偏差可能源自 ChatML 包装、系统提示注入或 tokenizer 版本差异——不一定是有意虚报。
模型身份判定基于统计指纹匹配，不是密码学证明。量化、微调、后处理都可能改变指纹特征。
MMD 分布检验对 temperature、采样参数和系统提示敏感。显著的 p 值意味着分布差异，不是偷换的证明。
Logprobs 不可用在 2025-2026 年越来越常见（许多提供商默认禁用），本身不构成欺骗证据。
ITT 节奏指纹是一项早期技术。网络抖动、TCP 合并、网关缓冲都可能产生假信号。
本工具生成的是参考级证据链，不是法律结论。请勿仅凭本报告对任何服务方做出定性指控。

报告中的措辞均为统计意义上的「偏离」或「信号不一致」，请勿据此对任何服务方做出诈骗、欺诈等定性指控。