维度 · 计分权重 0%
自我识别探测
本维度检测什么
问模型“你是谁”仍保留展示,因为用户会期待看到,但它明确只是诊断。system prompt 或代理改写几乎可以强制任意答案。
算法
发送直接身份问题,扫描响应是否包含声称模型或冲突模型家族。原文作为轶事证据保存。
阈值
| 条件 | 对 verdict 的贡献 |
|---|---|
| 提到声称模型 | 诊断匹配 |
| 提到其他模型 | 诊断异常 |
| 未提到模型 | 诊断证据不足 |
局限
该信号极易伪造,绝不能作为身份或偷换证明。
维度 · 计分权重 0%
问模型“你是谁”仍保留展示,因为用户会期待看到,但它明确只是诊断。system prompt 或代理改写几乎可以强制任意答案。
发送直接身份问题,扫描响应是否包含声称模型或冲突模型家族。原文作为轶事证据保存。
| 条件 | 对 verdict 的贡献 |
|---|---|
| 提到声称模型 | 诊断匹配 |
| 提到其他模型 | 诊断异常 |
| 未提到模型 | 诊断证据不足 |
该信号极易伪造,绝不能作为身份或偷换证明。
报告中的措辞均为统计意义上的「偏离」或「信号不一致」,请勿据此对任何服务方做出诈骗、欺诈等定性指控。