DeepSeek-R1后又一推理训练里程碑:用递归重构Transformer

让模型在预训练阶段就能具有深度推理的能力