最新发现,每参数3.6比特,语言模型最多能记住这么多

Meta摸清大模型何时放弃死记硬背,开始学习规律