维度 · 计分权重 0%
响应延迟与速率
本维度检测什么
TTFT 与吞吐量可提示路由或缓存异常,但太依赖环境,当前模型不把它计分。
算法
收集各探针的请求延迟、可用时的首 token 时间与 tokens/s。与粗略期望区间比较,将偏离作为诊断上下文展示。
阈值
| 条件 | 对 verdict 的贡献 |
|---|---|
| 位于粗略期望区间 | 诊断匹配 |
| 大幅偏离或分布不稳定 | 诊断异常 |
| 任意结果 | 计分贡献始终为 0 |
局限
延迟主要受地理位置、厂商负载、排队、网关缓冲、客户端网络与缓存状态影响。它能辅助解释,但不应决定身份。
参考文献
- TrueLLMs lib/fingerprints/latency.ts