
月之暗面创始人杨植麟在2026中关村论坛提出,大模型训练已经迈入AI主导的全新发展阶段,这意味着延续多年的人工主导研发模式正在被自主迭代体系替代。这一转变不仅能让大模型研发效率实现指数级提升,还将重构整个大模型产业的分工格局,改变数据标注、人才培养、算力分配等各个环节的原有逻辑,为通用人工智能的发展开辟了全新路径,值得所有行业参与者重视。
AI自己训练AI:大模型研发的范式革命正在发生
在2026年中关村论坛上,月之暗面创始人杨植麟提出的“大模型训练进入AI主导新阶段”观点,不止是对技术趋势的判断,更预示着一场影响深远的研发范式革命。短短几年间,大模型训练已经从“人类喂数据”的手工时代,快速进入到“AI自我进化”的自动化时代,这场变革带来的不仅是研发效率的指数级提升,更将彻底重构整个人工智能产业的价值链。
从人工到AI自主:大模型发展的三阶演进
杨植麟将大模型技术发展划分为三个清晰的阶段,这个划分实际上精准勾勒出大模型能力增长背后的逻辑变迁:
第一阶段是“数据投喂阶段”,大模型训练依赖互联网公开的天然语料,人类只需要做少量的标注和价值对齐工作,本质上还是“靠数据堆出能力”。这个阶段的核心矛盾是数据规模和质量,研发团队的核心竞争力在于能不能拿到更多、更好的文本数据。
第二阶段是“人类设计任务阶段”,也就是我们熟悉的RLHF(基于人类反馈的强化学习)时代。这个阶段中,研究人员开始主动设计训练任务、编写奖励模型,引导大模型朝着符合人类需求的方向优化,模型能力的提升越来越依赖人类研究者的设计能力。但这个模式的瓶颈也非常明显:人类的设计能力始终有限,很难突破自身的认知框架找到最优解。
而现在我们进入的第三阶段,就是AI主导的自主训练阶段:AI开始自主生成训练任务、构造验证环境、动态调整奖励机制,整个研发流程的核心决策从人类手中转移到了AI系统本身。人类研究者的角色从“设计师”变成了“场地管理员”——只需要统筹算力资源、设定底层目标,具体的探索和优化都交给AI完成。
AI自主训练为什么能带来指数级效率提升?
很多人会疑惑,让AI自己训练AI,真的能带来效率的指数级提升吗?答案其实藏在大模型的能力本质里:当大模型本身已经具备了超越普通人类的知识储备和逻辑推理能力,让它来做训练方案的设计,自然比纯人工效率高得多。
首先,AI自主训练突破了人类认知的边界。以往人类设计模型架构和训练任务,往往会陷入经验主义的陷阱,默认某些结构是“对的”,某些方向是“没有价值的”,很多潜在的最优解就这样被屏蔽了。而AI没有固有认知的束缚,它可以随机探索各种排列组合,反而有可能找到人类想不到的高效架构——去年DeepMind团队用AI发现新的大模型架构,已经验证了这个逻辑。
其次,AI自主迭代极大压缩了研发周期。原来一个大模型版本的迭代,从数据标注、任务设计到训练验证,往往需要几个月的时间,其中大部分时间都消耗在人工环节。而AI可以24小时不间断进行探索,一秒钟就能生成几十个训练方案,再通过快速验证筛选出有效方案,迭代周期从“月”级压缩到“小时”级,效率提升自然是指数级的。
最后,这种模式还解决了“数据枯竭”的行业痛点。现在互联网上的高质量天然数据已经被开发得差不多了,继续扩大数据规模带来的收益越来越低。而AI自主生成训练数据和任务,相当于打开了一个无限增长的数据来源,只要有足够的算力,模型就能一直进化下去,从根本上解决了大模型发展的数据瓶颈。
产业变革:谁会赢,谁会被淘汰?
AI主导训练的范式转变,不是只影响研发团队,它会引发整个产业连锁反应,重新定义各个环节的价值:
最直接的冲击就是传统人工标注产业。当AI可以自己生成高质量训练数据、自己完成反馈验证,对低成本人工标注的需求会快速下降,原来靠规模取胜的标注工厂必须转型——要么转向更高价值的AI辅助标注,要么退出这个市场。
与此同时,新的需求会在算力和系统领域爆发。AI自主训练对算力调度的要求远高于传统模式,如何动态分配算力给不同的探索任务,如何在保证探索效率的同时控制成本,会成为新的核心技术壁垒。对应的,懂大模型原理又懂系统架构的复合型人才会成为稀缺资源,就像杨植麟提到的,现在头部团队已经开始调整人才培养体系,适应新的研发模式。
对于创业公司来说,这其实是一次弯道超车的机会。原来大模型行业的竞争逻辑是“比谁钱多、比谁数据多”,中小团队很难追上巨头的步伐。但在AI自主训练模式下,核心竞争力变成了“自主迭代系统的设计能力”,只要技术路线正确,中小团队完全有可能用更少的资源追上甚至超越巨头,行业格局会重新洗牌。
展望:通向AGI的一条新路径
杨植麟提到,这种模式会为通用人工智能开辟新路径,这不是一句空话。原来我们发展通用人工智能的思路,是人类把自己的知识整理好喂给AI,让AI模仿人类的能力。但AI自主训练模式打开了另一种可能:让AI按照自己的进化逻辑,自主探索跨领域的知识迁移,突破人类能力的边界,最终生长出我们预想不到的通用能力。
当然,我们也不能忽视这种模式带来的新问题:当AI可以自主设计训练方案,如何保证它的进化方向始终符合人类的价值导向?如何控制自主探索带来的安全风险?这些问题都需要行业在发展过程中逐步找到答案。
不可否认的是,AI训练AI的时代已经来了。未来几年,我们会亲眼看到大模型研发效率的飞跃,也会看到整个产业在这场变革中完成重构。对于所有参与者来说,适应这个变化,抓住新范式带来的机会,才是在接下来的竞争中站稳脚跟的关键。





