Liang Wenfeng和Yang Zhilin再次“ RAN”_爆料黑料网站-爆料快手网红黑料网站-快手抖音网红爆料网站

Liang Wenfeng和Yang Zhilin再次“ RAN”

2025-05-06

文字｜《中国企业家》记者Yan Junken 在2月的“碰撞”纸之后，Liang Wenfeng和Yang Zhilin在另一个大型模型轨道上相遇。 4月30日，DeepSeek启动了DeepSeek-Prover-V2的新模型，这是一种用于证明定理的特殊模型。 Prover-V2参数量表进一步扩展到671B（6710亿个标准参数），与上一代版本的V1.5的7B量表相比，它的量表增加了近一百倍，这使其在数学测试集中变得更好，更正确。例如，该模型的minif2f的传递速率达到88.9％，并且还从putnambnch（putnam Test）解决了49个问题。顺便说一句，在4月中旬，月球的黑暗面还推出了一个大型模型Kimina-Prover，以进行正式的定理证明，这是Kimi Team和Numina共同生产的大型模型。该产品还具有开放的资源模型，该模型将1.5B和7B参数的版本提炼。该模型的minif2f通过率为80.7％，Putnambnchy测试标记为10个问题。与这两个相比，DeepSeek-Prover-V2发布了Minif2F测试率和Putnam测试的Kimine-Pro-Pro-Pro-Pro-Pro-Prover版本。值得注意的是，两家公司都在其技术报告中提到了对加强的研究。例如，Deviceek的标题是“ DeepSeek-Prover-v2：通过通过亚物体研究研究的研究来促进正式的数学推理”，而本月黑暗部分的标题是“ Kimina-Prover Preview：基于刺激性研究技术的大型正式倾斜技术倾向趋势”。在2月的两篇“碰撞”论文中，Liang Wenfeng和Yang Zhilin都是那些拥有套装的人，而相同的公司专注于变形金刚的关注架构的最基本机制，即如何使模型变得更好。作为中国嘲笑领域最受欢迎的企业家，两者也面临着各种挑战。 liR1模型推出三个月后，Ang Wenfeng以Deepseek的“魔术”吸引了外界的吸引力正在下降。开放的阿里巴巴模型很快就超过了DeepSeek。外界渴望期望其R2或V4模型可以提高其领先优势。对于Yang Zhilin和Yuezhi的黑暗面，Kimi因兽人和腾讯Yuanbao的怀疑面临挑战，并且还需要保持持续的变化。编程和数学，实施AGI的两种途径 DeepSeek的创始人Liang Wenfeng于2024年实施AGI Path，他在接受他们朝三个方向进行的未进行的采访时说：一个是数学和代码，第二个是多模式，第三个是自然语言本身。数学和代码是AGI测试的自然领域，例如GO，封闭式验证的系统可以通过自学实现高智能。另一方面，在现实世界中，需要参与学习。他们仍然存在ED对所有可能性开放。启动谚语V2模型允许各种DepSeek模型立即出现。箴言系列模型于2024年3月发布，该模型在2024年8月在DeepSeek-Prover-V1.5（后来称为Proverbs-V1.5）上进行了更新，并于2025年4月更新为DeepSeek-Prover-V2。 DeepSeek Code系列的模型于2024年4月开始更新，并于6月升级到Coder-V2-0614，并于7月升级。 9月，将DeepSeek-V2-Chat和DeepSeek-Coder-V2组合在一起。升级的新型号是Deviceek-V2.5。 2024年12月，该模型在V3上进行了更新，并于今年3月升级为V3-0324。由1月20日发布的R1模型代表的构想的一般模型是低价，具有强大的语言识别性能。它的性能与数学，代码，语言和其他活动的自然识别的OpenAI O1的官方版本相媲美。根据Prover-V2的技术报告，是关联与其他DEPSEK模型的演变有关。其中，DeepSeek-Prover-V2-671b使用DeepSeek-V3作为正确修复的主要模型。例如，在寒冷的开始阶段，DeepSeek-V3用一系列的子设备分解了问题，然后在思维过程的过程中合成了解决的子目标的证明，并伴随着深v3的逐步推理，最初的冷启动是为了进行辅助研究。算法工程师和Zhihu用户“小广告”告诉中国商人，当理解模型是推断时，他们需要做出复杂的想法。代码和数学模型可以尝试对模型的出色功能发展认识，因为已经证明了数学和代码结果。他认为，Prover-V2的启动与新R2或V4模型的启动没有必要的联系，这类似于独立模型的更新。他预言了R2模型与GPT-O1 TO的过程相似。例如，就提高增强能力而言，DeepSeek可能基于V3并改善了训练的影响，因此R2开发周期可能很短。但是V4是该更新的基本版本，R＆D周期可能更长，因为工程和培训方法的培训量可能会发生变化。目前，市场充满了对新DeepSeek模型的想象力和期望。有传言说，R2模型将根据华为Ascend系列GPU芯片推出，但内部行业表示，这一消息不是很可靠，并且仅限于NVIDIA H20芯片。之后，在市场上很难找到Asteng系列。 “对于Asteng来说，如果它用于大规模研究和模型开发，则可能不稳定。” 一家初创公司NA公司的另一个人告诉中国商人，华为升筹筹码用于大型型号，其效果是平均的。原因是生态系统不是完美的，但是大型模型的推理和扩展没有问题。 DeepSeek和Kimi仍然可以保持领先地位吗？大型公司追求并超越了月球的深色和黑暗部分。以Yuezhi黑暗面的子公司Kimi为例。根据QuestMobile数据，Kimi在线不到一年。 2024年11月，其每月活跃用户超过2000万，仅次于杜巴的5600万。 QuestMobile的数据显示，到2025年2月底，前三名Active AI Antial Apps从Dubao，Kimi和Wen Xiaoyan转变为DeepSeek，Dubao和Tencent Yuanbao，分别为194 Milon，1.16亿Milon，1.16亿和4200万。 2月中旬，Tencent Yuanbao宣布访问DeepSeek。随后，在一个多月以上，腾讯Yuanbao使用微信交通过多的产品吸引了交通和疯狂的交通购买和投资，这超过了Kimi的用户数量S，成为AI产品的第三级。根据AppRowing数据，在今年的第一季度，Tencent Yuanbao的投资成本为14亿元人民币，Kimi的规模超过1.5亿元。当前，Kimi的最新举措是测试社区的内部功能，以提高用户的粘合剂。 DeepSeek也无法避免追逐甚至被大公司压倒的挑战。最近，阿里巴巴与大型型号表现出了强烈的竞争。 4月29日，皮亚巴巴（Pialibaba）失去了新一代的汤蒂（Tongyi Qianwen）模型Qwen3。该模型称为第一个“混合推理模型”。这是与“快速思考”和“缓慢思考”集成的模型。参数量仅为DeepSeek-R1的1/3，其性能超过了诸如R1和OpenAI O1之类的同行产品。过去，Tsai Chongxin对DeepSeek发表了评论，后者告诉我们开放资源的价值。根据公共数据，阿里巴巴·塔利（Alibaba Talyi）开设了200多个型号，下载超过3亿全世界的S，超过100,000个Qianwen的衍生模型超过了美国，并成为了第一大开放资源模型。一位AI商人告诉中国的一位商人，DeepSeek受到了过多的关注，并获得了过多的组合。中国大型模型行业需要两个或三个顶部车型模型，而不是一种模型。目前，应该鼓励该领域的竞争和企业家精神。另一个重要的球员是百度。 4月25日，百度发布了Wenxin 4.5 Turbo和X1 Turbo的深层模型。这两个型号更强大，成本较低。李·扬洪（Li Yanhong）多次提到DeepSeek。据他说，DeepSang EK并不强大。它只能处理单个文本，并且不了解多媒体内容，例如声音，图片和视频。同时，枪的率相对较高，并且在许多情况下不能自信地使用。 “ DeepSeek最大的问题是缓慢而昂贵的。中国市场上的大多数API是更便宜，反应速度更快。尽管如此，百度还是决定找出DeepSeek。纽约（Nowyear）在2月，百度（Baidu）决定在6月30日开设Wenxin电影4.5系列的来源。越来越多的玩家参加了大型模型的公开资源竞赛，但是技术高级的玩家可以指定标准。