DeepSeek开源新模型,但不是R2

admin 1 0

凤凰网科技讯 4月30日,DeepSeek刚刚在全球最大AI开源社区Hugging Face发布了一个名为DeepSeek-Prover-V2-671B的新模型。

从命名上看,这款参数高达 6710 亿的模型可能是去年发布的数学AI模型 Prover-V1.5 的升级版。

DeepSeek开源新模型,但不是R2

DeepSeek-Prover 是DeepSeek团队开发的一系列专注于数学定理证明的开源大语言模型,通过大规模合成数据训练并结合强化学习(RL)与蒙特卡洛树搜索(MCTS)等优化技术,在形式化定理证明领域取得了显著进展。

DeepSeek开源新模型,但不是R2

DeepSeek-Prover通过创新的训练框架与高效的推理策略,在形式化数学证明领域树立了新标杆。其结合合成数据、强化学习与树搜索的技术路径,不仅提升了模型性能,也为AI在严谨数学推理中的应用开辟了新方向。

  • 评论列表

留言评论