GLM-5.2引发的效率争议:更强但更“慢”的前沿大模型 围绕GLM-5.2在接近前沿能力的同时出现推理耗时与token成本过高的问题,讨论大模型性能与效率之间的新矛盾。 2026年6月18日 LLM Inference Optimization