I/O 比 + Batch/Cache 折扣结构 (研究维度 H + K)
- H: output / input 价比 — 是否随时间扩大或缩小?
- K: batch 折扣率 + cache_read 折扣率
折扣结构本身是投资信号 — cache hit 折扣越深,反映厂家对 prefill 优化越自信(基础设施效率)。
Output / Input 价比 随时间
典型值 4-5。越高说明 output 相对越贵(反映 decode 比 prefill 算力密集)。
Batch 折扣 vs Cache read 折扣
Observation (当前数据)
- Batch API: 所有支持的厂家都是 50% off (行业标准)
- Cache read: 厂家差异显著 — Anthropic 90%,OpenAI 50%,DeepSeek 75%,Google 75%
Plan 4.1+ 回填历史后,可以画 batch/cache 折扣率随时间的演变(预计折扣深度在扩大,反映 prefill 成本占比下降)。