全部维度

维度 · 计分权重 0%

响应延迟与速率

本维度检测什么

TTFT 与吞吐量可提示路由或缓存异常,但太依赖环境,当前模型不把它计分。

算法

收集各探针的请求延迟、可用时的首 token 时间与 tokens/s。与粗略期望区间比较,将偏离作为诊断上下文展示。

阈值

条件对 verdict 的贡献
位于粗略期望区间诊断匹配
大幅偏离或分布不稳定诊断异常
任意结果计分贡献始终为 0

局限

延迟主要受地理位置、厂商负载、排队、网关缓冲、客户端网络与缓存状态影响。它能辅助解释,但不应决定身份。

参考文献

  • TrueLLMs lib/fingerprints/latency.ts

返回完整方法论