自选
我的自选
查看全部
市值 价格 24h%
  • 全部
  • 产业
  • Web 3.0
  • DAO
  • DeFi
  • 符文
  • 空投再质押
  • 以太坊
  • Meme
  • 比特币L2
  • 以太坊L2
  • 研报
  • 头条
  • 投资

免责声明:内容不构成买卖依据,投资有风险,入市需谨慎!

谷歌DeepMind资深元老募集11亿美元研发非人类数据训练AI

2026-04-29 04:39:08
收藏

David Silver认为,强化学习而非大模型才是通往超智能的可行路径

DeepMind科学家David Silver在阿尔法围棋于2016年历史性地战胜世界围棋冠军李世石后,已筹集11亿美元创立了一家初创公司,他断言人工智能的下一时代将不会由当今的主导技术所引领。

Silver于今年一月创立的公司Ineffable Intelligence以51亿美元估值起步,并将赌注押在强化学习上。这是一种通过试错不断优化的人工智能系统训练方法。Silver指出,相比当前主导领域的大语言模型,强化学习为实现超级智能提供了一条更可信的路径。

“我认为我们的使命是与超级智能实现首次接触,”Silver表示,“我所说的超级智能意味着某种非凡的存在。它应当能自主发现新的科学形式、技术形态、治理模式或经济体系。”

“超级智能”这一概念经哲学家Nick Bostrom在其2014年著作《超级智能》中推广后广为人知,特指在几乎所有领域超越人类智能的人工智能;而人工通用智能则指能在广泛任务中达到人类水平推理能力的系统。

Silver认为大语言模型存在根本性局限,因为它们依赖于人类生成的数据进行学习,而非通过经验构建自身的理解体系。

“人类数据如同一种化石燃料,提供了惊人的捷径,”他解释道,“而自主学习系统则可视为可再生能源——能够永无止境地持续学习,没有边界。”

Silver职业生涯的大部分时间都在推进这一理念。阿尔法围棋融合了人类训练数据、强化学习与自我博弈,最终形成的策略令顶尖人类棋手都感到震惊,展示了人工智能如何在特定领域突破人类既有范式的可能性。

“我认为建立完全专注于这种方法的顶尖人工智能实验室至关重要,”他强调,“它不应只是大语言模型主导机构中的一个边缘部门。”

Ineffable Intelligence计划打造被Silver称为“超级学习者”的人工智能体——它们将被置于仿真环境中,通过追求目标、经历失败、不断适应与改进,突破静态人类数据集的限制。Silver未具体描述仿真环境的设计细节,但表示这种方法将使智能体能够自主协作并发展能力。

他指出,大语言模型受限于训练数据特性,并举例说明:若在所有人坚信地球是平的世界中训练模型,该系统很可能延续这一认知,除非能自主验证现实。而通过经验学习的系统则可能发现真相。

展开阅读全文
更多新闻