科学家揭秘大语言模型底层推理机制 科学家揭秘大语言模型底层推理机制。 研究发现中间层负责大模型的逻辑加工。这打破了注意力均匀分布 的传统认知。查看大模型推... LLaMA-3Transformer中间层可解释性 2026-05-24