月之暗面杨植麟:大模型训练迈入AI主导新阶段，研发效率或指数级提升

Wednesday, Apr 22, 2026 | 1 minute read | 0 | Updated at Wednesday, Apr 22, 2026

@ BMSG

月之暗面创始人杨植麟在2026中关村论坛提出，大模型训练已经迈入AI主导的全新发展阶段，这意味着延续多年的人工主导研发模式正在被自主迭代体系替代。这一转变不仅能让大模型研发效率实现指数级提升，还将重构整个大模型产业的分工格局，改变数据标注、人才培养、算力分配等各个环节的原有逻辑，为通用人工智能的发展开辟了全新路径，值得所有行业参与者重视。

AI自己训练AI：大模型研发的范式革命正在发生

在2026年中关村论坛上，月之暗面创始人杨植麟提出的“大模型训练进入AI主导新阶段”观点，不止是对技术趋势的判断，更预示着一场影响深远的研发范式革命。短短几年间，大模型训练已经从“人类喂数据”的手工时代，快速进入到“AI自我进化”的自动化时代，这场变革带来的不仅是研发效率的指数级提升，更将彻底重构整个人工智能产业的价值链。

从人工到AI自主：大模型发展的三阶演进

杨植麟将大模型技术发展划分为三个清晰的阶段，这个划分实际上精准勾勒出大模型能力增长背后的逻辑变迁：

第一阶段是“数据投喂阶段”，大模型训练依赖互联网公开的天然语料，人类只需要做少量的标注和价值对齐工作，本质上还是“靠数据堆出能力”。这个阶段的核心矛盾是数据规模和质量，研发团队的核心竞争力在于能不能拿到更多、更好的文本数据。

第二阶段是“人类设计任务阶段”，也就是我们熟悉的RLHF（基于人类反馈的强化学习）时代。这个阶段中，研究人员开始主动设计训练任务、编写奖励模型，引导大模型朝着符合人类需求的方向优化，模型能力的提升越来越依赖人类研究者的设计能力。但这个模式的瓶颈也非常明显：人类的设计能力始终有限，很难突破自身的认知框架找到最优解。

而现在我们进入的第三阶段，就是AI主导的自主训练阶段：AI开始自主生成训练任务、构造验证环境、动态调整奖励机制，整个研发流程的核心决策从人类手中转移到了AI系统本身。人类研究者的角色从“设计师”变成了“场地管理员”——只需要统筹算力资源、设定底层目标，具体的探索和优化都交给AI完成。

AI自主训练为什么能带来指数级效率提升？

很多人会疑惑，让AI自己训练AI，真的能带来效率的指数级提升吗？答案其实藏在大模型的能力本质里：当大模型本身已经具备了超越普通人类的知识储备和逻辑推理能力，让它来做训练方案的设计，自然比纯人工效率高得多。

首先，AI自主训练突破了人类认知的边界。以往人类设计模型架构和训练任务，往往会陷入经验主义的陷阱，默认某些结构是“对的”，某些方向是“没有价值的”，很多潜在的最优解就这样被屏蔽了。而AI没有固有认知的束缚，它可以随机探索各种排列组合，反而有可能找到人类想不到的高效架构——去年DeepMind团队用AI发现新的大模型架构，已经验证了这个逻辑。

其次，AI自主迭代极大压缩了研发周期。原来一个大模型版本的迭代，从数据标注、任务设计到训练验证，往往需要几个月的时间，其中大部分时间都消耗在人工环节。而AI可以24小时不间断进行探索，一秒钟就能生成几十个训练方案，再通过快速验证筛选出有效方案，迭代周期从“月”级压缩到“小时”级，效率提升自然是指数级的。

最后，这种模式还解决了“数据枯竭”的行业痛点。现在互联网上的高质量天然数据已经被开发得差不多了，继续扩大数据规模带来的收益越来越低。而AI自主生成训练数据和任务，相当于打开了一个无限增长的数据来源，只要有足够的算力，模型就能一直进化下去，从根本上解决了大模型发展的数据瓶颈。

产业变革：谁会赢，谁会被淘汰？

AI主导训练的范式转变，不是只影响研发团队，它会引发整个产业连锁反应，重新定义各个环节的价值：

最直接的冲击就是传统人工标注产业。当AI可以自己生成高质量训练数据、自己完成反馈验证，对低成本人工标注的需求会快速下降，原来靠规模取胜的标注工厂必须转型——要么转向更高价值的AI辅助标注，要么退出这个市场。

与此同时，新的需求会在算力和系统领域爆发。AI自主训练对算力调度的要求远高于传统模式，如何动态分配算力给不同的探索任务，如何在保证探索效率的同时控制成本，会成为新的核心技术壁垒。对应的，懂大模型原理又懂系统架构的复合型人才会成为稀缺资源，就像杨植麟提到的，现在头部团队已经开始调整人才培养体系，适应新的研发模式。

对于创业公司来说，这其实是一次弯道超车的机会。原来大模型行业的竞争逻辑是“比谁钱多、比谁数据多”，中小团队很难追上巨头的步伐。但在AI自主训练模式下，核心竞争力变成了“自主迭代系统的设计能力”，只要技术路线正确，中小团队完全有可能用更少的资源追上甚至超越巨头，行业格局会重新洗牌。

展望：通向AGI的一条新路径

杨植麟提到，这种模式会为通用人工智能开辟新路径，这不是一句空话。原来我们发展通用人工智能的思路，是人类把自己的知识整理好喂给AI，让AI模仿人类的能力。但AI自主训练模式打开了另一种可能：让AI按照自己的进化逻辑，自主探索跨领域的知识迁移，突破人类能力的边界，最终生长出我们预想不到的通用能力。

当然，我们也不能忽视这种模式带来的新问题：当AI可以自主设计训练方案，如何保证它的进化方向始终符合人类的价值导向？如何控制自主探索带来的安全风险？这些问题都需要行业在发展过程中逐步找到答案。

不可否认的是，AI训练AI的时代已经来了。未来几年，我们会亲眼看到大模型研发效率的飞跃，也会看到整个产业在这场变革中完成重构。对于所有参与者来说，适应这个变化，抓住新范式带来的机会，才是在接下来的竞争中站稳脚跟的关键。

Previous page 大模型进展专栏第十六期｜聚焦2025年11月大模型前沿突破：AI从认知深化迈向生态共建与产业渗透

Next page “解题”到“出题” 北大与北京通用人工智能研究院团队获突破