I/O 比 + Batch/Cache 折扣结构 (研究维度 H + K)

折扣结构本身是投资信号 — cache hit 折扣越深,反映厂家对 prefill 优化越自信(基础设施效率)。

Output / Input 价比 随时间

典型值 4-5。越高说明 output 相对越贵(反映 decode 比 prefill 算力密集)。

Batch 折扣 vs Cache read 折扣

Observation (当前数据)

Plan 4.1+ 回填历史后,可以画 batch/cache 折扣随时间的演变(预计折扣深度在扩大,反映 prefill 成本占比下降)。