R2还没来,但DeepSeek的秘密武器已经“剧透”了

DeepSeek和北京大学的NativeSparseAttention技术获ACL最佳论文奖,通过模仿人类阅读策略优化大模型注意力机制,显著提升长文本处理速度和性能,推理加速高达11倍,未来将整合到DeepSeek模型,使AI更快速高效。顶级奖项:在ACL会议获最佳论文荣誉。创新机制:NSA模仿人类粗读摘要、......