检测维度 · 权重 15%
LLMmap 主动探测
本维度检测什么
LLMmap 是主动探测指纹技术。USENIX Security 2025 原论文(Pasquini et al.)在 8 类 prompt 族、42 个 LLM 版本上训练深度对比分类器,报告约 95% 厂商识别。本版本为启发式近似——非训练分类器——不声称论文 95%。宜作下界信号。
算法
最多发送 8 则 LLMmap 族探针,从每条响应提取少量词法/结构特征(拒绝模板族、含糊频率、签名 token、结构模式),与按厂商模板匹配。探针覆盖 < 6 或第一名未显著甩开第二名时分类器返回 Unknown。合成与冲突处理两类探针默认关闭,以减少对安全调优中转的假阳性。
阈值
| 条件 | 对 verdict 的贡献 |
|---|---|
| ≥ 6/8 探针覆盖 + 顶分 ≥ 0.18 + 间隔 ≥ 0.04 | 输出厂商猜测 |
| 否则 | Unknown(开集拒绝) |
局限
仅启发式——非训练分类器。指纹化厂商(及大致代次),非精确模型名。区分 GPT-5 与 GPT-5-mini 仍需 logprobs 或 ITT。
参考文献
- Pasquini et al. LLMmap: Fingerprinting Large Language Models. USENIX Security 2025. arXiv:2407.15847