检测维度
TrueLLMs 当前展示 12 个维度详情页:前 5 个为合计 100 分的计分维度,后 7 个为计分权重 0 的诊断维度。每页说明测量对象、何时计分,以及可被什么方式误导。
- 01切词器家族指纹计分权重 35%
- 02能力地板计分权重 20%
- 03MMD 分布等价检验计分权重 20%
- 04缓存重放检测计分权重 15%
- 05Sparse-Token 压力测试计分权重 10%
- 06LLMmap 指纹计分权重 0%
- 07ITT 节奏指纹计分权重 0%
- 08响应延迟与速率计分权重 0%
- 09自我识别探测计分权重 0%
- 10金丝雀 Prompt计分权重 0%
- 11上下文窗口探测计分权重 0%
- 12风格计量计分权重 0%
免责声明 · 关于检测信号的解读
- 任何单一信号都不能证明恶意行为。中转站可能因合法原因(区域路由、A/B 测试、降级策略、缓存优化)导致部分指标异常。
- Token ratio 偏差可能源自 ChatML 包装、系统提示注入或 tokenizer 版本差异——不一定是有意虚报。
- 模型身份判定基于统计指纹匹配,不是密码学证明。量化、微调、后处理都可能改变指纹特征。
- MMD 分布检验对 temperature、采样参数和系统提示敏感。显著的 p 值意味着分布差异,不是偷换的证明。
- Logprobs 不可用在 2025-2026 年越来越常见(许多提供商默认禁用),本身不构成欺骗证据。
- ITT 节奏指纹是一项早期技术。网络抖动、TCP 合并、网关缓冲都可能产生假信号。
- 本工具生成的是参考级证据链,不是法律结论。请勿仅凭本报告对任何服务方做出定性指控。
报告中的措辞均为统计意义上的「偏离」或「信号不一致」,请勿据此对任何服务方做出诈骗、欺诈等定性指控。