维度 · 计分权重 0%

响应延迟与速率

本维度检测什么

TTFT 与吞吐量可提示路由或缓存异常，但太依赖环境，当前模型不把它计分。

收集各探针的请求延迟、可用时的首 token 时间与 tokens/s。与粗略期望区间比较，将偏离作为诊断上下文展示。

延迟主要受地理位置、厂商负载、排队、网关缓冲、客户端网络与缓存状态影响。它能辅助解释，但不应决定身份。