配置面板
API 凭据与采样参数。所有数据仅在浏览器内存中。
Stream启用以测量 TTFT
Logprobs最强身份证据
Context Probe耗 token 较多
保存日志详情入表
测试集
选择启用的探测项。每组可独立开关。
已启用 22/27
|

运行区直连
预检 → Usage → Identity 三阶段执行
待运行0 / 55
实时日志0
尚无日志
MMD baseline未记录
Model Equality Testing(Gao et al., ICLR 2025)使用双样本 Maximum Mean Discrepancy 检验两组响应是否来自同一分布。先从可信端点录制 baseline,再运行审计对比。Baseline 存储在 localStorage 中,永不上传。
MMD 检验需要 temperature > 0 才能采到分布差异。当前 temperature = 0.
Dashboard A · Token Usage 审计
平均 Prompt Ratio
1.000
正常
平均 Completion Ratio
1.000
正常
固定偏移估计
0.0
tokens / 请求
高风险样本
0
/ 0 样本
综合风险等级
正常
模式: 未见显著偏差
线性回归证据

样本数不足,无法可靠识别模式(至少需要 3 个有效样本)

Dashboard B · Model Identity 审计
综合判定
证据不足
基于 12 个加权信号汇总。不可用维度的权重已按比例转移给其他维度。
0
异常置信度
0/100
越高越偏离声称模型
模型对比
声称:gpt-4o
推测:unknown
12 维度信号灯
Tokenizer 边界
0% 20%
LLMmap 指纹
0% 18%
MMD 分布等价检验
0% 15%
ITT 节奏指纹
0% 10%
响应延迟与速率
0% 2%
自我识别探测
0% 1%
金丝雀 Prompt
0% 8%
拒绝边界探测
0% 1%
上下文窗口
0% 7%
缓存命中检测
0% 10%
Sparse-Token 压力测试
0% 5%
风格计量
0% 3%
证据链
展开每个维度查看完整推理过程与原始证据

可视化图表
核心散点图揭示偏差模式:固定偏移产生平移,比例上浮产生倾斜
详细结果
名称类别本地 Pt远端 PtP Ratio本地 Ct远端 CtC RatioTTFTtok/sLogp风险
尚无结果