David Silver认为,强化学习而非大模型才是通往超智能的可行路径
DeepMind科学家David Silver在阿尔法围棋于2016年历史性地战胜世界围棋冠军李世石后,已筹集11亿美元创立了一家初创公司,他断言人工智能的下一时代将不会由当今的主导技术所引领。
Silver于今年一月创立的公司Ineffable Intelligence以51亿美元估值起步,并将赌注押在强化学习上。这是一种通过试错不断优化的人工智能系统训练方法。Silver指出,相比当前主导领域的大语言模型,强化学习为实现超级智能提供了一条更可信的路径。
“我认为我们的使命是与超级智能实现首次接触,”Silver表示,“我所说的超级智能意味着某种非凡的存在。它应当能自主发现新的科学形式、技术形态、治理模式或经济体系。”
“超级智能”这一概念经哲学家Nick Bostrom在其2014年著作《超级智能》中推广后广为人知,特指在几乎所有领域超越人类智能的人工智能;而人工通用智能则指能在广泛任务中达到人类水平推理能力的系统。
Silver认为大语言模型存在根本性局限,因为它们依赖于人类生成的数据进行学习,而非通过经验构建自身的理解体系。
“人类数据如同一种化石燃料,提供了惊人的捷径,”他解释道,“而自主学习系统则可视为可再生能源——能够永无止境地持续学习,没有边界。”
Silver职业生涯的大部分时间都在推进这一理念。阿尔法围棋融合了人类训练数据、强化学习与自我博弈,最终形成的策略令顶尖人类棋手都感到震惊,展示了人工智能如何在特定领域突破人类既有范式的可能性。
“我认为建立完全专注于这种方法的顶尖人工智能实验室至关重要,”他强调,“它不应只是大语言模型主导机构中的一个边缘部门。”
Ineffable Intelligence计划打造被Silver称为“超级学习者”的人工智能体——它们将被置于仿真环境中,通过追求目标、经历失败、不断适应与改进,突破静态人类数据集的限制。Silver未具体描述仿真环境的设计细节,但表示这种方法将使智能体能够自主协作并发展能力。
他指出,大语言模型受限于训练数据特性,并举例说明:若在所有人坚信地球是平的世界中训练模型,该系统很可能延续这一认知,除非能自主验证现实。而通过经验学习的系统则可能发现真相。

资金费率
资金费率热力图
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
账号安全
资讯收藏
自选币种