标签: Inference

1 篇文章

GLM-5.2引发的效率争议：更强但更“慢”的前沿大模型

围绕GLM-5.2在接近前沿能力的同时出现推理耗时与token成本过高的问题，讨论大模型性能与效率之间的新矛盾。

2026年6月18日

LLM Inference Optimization

← 查看所有标签