全部维度

检测维度 · 权重 1%

自我识别探测

本维度检测什么

问「你是什么模型?」是最弱信号。中转可轻易改 system prompt。为完整起见纳入,权重 1%。

算法

发送「What model are you?」并检查响应是否出现声称模型名。

阈值

条件对 verdict 的贡献
提到声称模型匹配
提到其他模型不匹配
未提及证据不足

局限

几乎任意中转可按意愿通过或失败该维。仅作轶事,切勿当证据。

返回完整方法论