DeepSeek在对其下一代模型的期望中推出了新的AI推理方法

中国人工智能（AI）初创公司DeepSeek推出了一种新的推理方法，因为市场继续预期发布其下一代模型。据报道，该公司刚刚引入了一种新颖的方法，该方法将有助于大型语言模型（LLMS）的推理能力，因为公众正在等待发布其新模型。

根据报告，最近发表的一篇论文揭示了这一壮举是通过Tsinghua University与AI创业公司的研究人员之间的合作实现的。根据该论文，DeepSeek能够开发一种将所谓的生成奖励建模（GRM）和自称调整的方法结合在一起的技术。双重方法将使LLM能够为一般查询提供更好，更快的结果。

DeepSeek揭示了新的AI推理方法

根据研究人员的说法，由此产生的DeepSeek-Grm模型能够胜过现有的方法，并通过强大的公共奖励模型实现了竞争性能。奖励建模是一个帮助LLM确定人类偏好的过程。研究人员提到，AI初创公司打算将GRM模型开源，但该公司尚未为开发提供时间表。

已发表的学术研究论文正在追踪有关该初创公司潜在的下一步行动的猜测，此前它享有其从DeepSeek V3基金会模型和R1推理模型中引起的全球关注。当时，今年早些时候发布的R1模型在发现其性能要好于某些较旧型号（包括OpenAI First Chatgpt模型）之后，它具有突出性。

考虑到该模型是开源的事实，并且以其他AI模型中使用的成本的一小部分完成，R1模型的发布也使硅谷措手不及。尽管注意力似乎正在放缓，但人工智能行业的竞争对手公司在竞争对手方面取得了显着进步，这表明该行业的竞争是一个年龄段之一。

但是，路透社上个月的一份报告提到，全球庆祝的R1的继任者DeepSeek-2可能正在进行中。根据该报告，该公司可能希望在本月底释放它，因为它希望利用其在AI行业不断增长的知名度。另一方面，DeepSeek对R2型号保持沉默，并在官方公共渠道上保持沉默，并有一个客户服务帐户拒绝与商业客户的谣言。

V3模型的开发继续

总部位于杭州的DeepSeek由企业家Liang Wenfeng于2023年成立，并在过去几个月中出于正确的理由而成为全球关注的焦点。但是，该公司拒绝进行公共沟通，决定将所有时间和精力集中在研发上。虽然有谣言，虽然该公司对AI行业有什么待遇，但它肯定是在做饭。

上个月，该公司宣布了它一直在进行的开发项目，向全球显示了其升级的V3型号，名为DeepSeek-V3-0324。该公司称，升级的模型提供了“增强的推理能力，优化的前端网络开发以及升级的中国写作能力”。 2月，该公司超越了其五个代码存储库，使开发人员可以审查并为其软件开发做出贡献。这家初创公司提到，它将“以完全透明度的真诚进展”。

同月，Liang发表了一项有关本地稀疏注意的技术研究，该研究用于提高LLM在处理大量数据方面的效率。这位40岁的Liang还是DeepSeek母公司高级Quant的创始人，这是对冲基金，该基金提供了财务能力，以资助AI初创公司技术进步。在2月下旬，企业家是一个集会技术企业家的研讨会的一部分，中国总统习近平主持了他们。总统称赞启动面对美国遏制中国人工智能进步的举动，该国的韧性标志。

加密大都会学院：即将推出 - 一种新的方式，在2025年通过DEFI赚取被动收入。了解更多

Open the app to read the full article

You Might Be Interested In

DeepSeek揭示了新的AI推理方法

V3模型的开发继续