从扑克到盈利:DeepMind校友的AI实验室悄然交易数十亿股票与加密货币
三位曾是DeepMind研究员的专家,曾开发出击败职业扑克玩家的AI,如今将目光转向金融市场——这一策略似乎已见成效。他们创立的布拉格实验室EquiLibre Technologies在完成由Creandum领投的A轮融资后,估值已达5亿美元。风险投资公司Creandum向媒体证实了此消息。尽管未披露具体融资规模,但Creandum合伙人Cameron Sellers表示,这是该公司有史以来对单个公司进行的最大单笔投资。
强化学习在华尔街找到新舞台
扑克与股票交易之间的关联,在于一种名为“强化学习”的特定AI技术。这种方法通过奖励与惩罚机制训练自我学习模型——本质上是通过试错来学习最优策略。据EquiLibre首席执行官兼联合创始人Martin Schmid介绍,金融市场提供了极为清晰的反馈信号。“交易和市场的好处在于,评分非常简单:智能体赚了多少钱?”Schmid对媒体表示。
这并非理论练习。EquiLibre已与量化交易公司Tower Research Capital合作,将其算法部署到包括标普500和纳斯达克在内的美国主要股票指数中。该初创公司声称,其AI智能体每日交易量达数十亿美元,并且“自成立以来保持了完美记录,没有一个月出现亏损”——即每个日历月都以净正回报结束。该系统自2025年起也已活跃于加密货币市场。
在逐利行业中保持实验室本色
尽管身处高风险的对冲基金量化世界,EquiLibre却明确将自己定位为研究实验室而非金融公司。Schmid强调,他和联合创始人——首席技术官Rudolf Kadlec及首席战略官Matej Moravcik——并非出于优化市场效率的动机。“我这样做并不是因为我对提高市场效率感到兴奋,而是因为我们所有人都热衷于构建前所未有的新事物,这非常有趣,”他说。
这种实验室本色的定位引起了Creandum的共鸣。Sellers指出,AI驱动交易的市场总规模巨大,许多基金创造的利润“让大多数风投支持的成功案例相形见绌”。但他也承认,EquiLibre的创始人带来了罕见的深度强化学习专业知识,并愿意将其应用于自动化已相当成熟的领域。
从埃德蒙顿到布拉格:在AI热潮之外组建团队
三位创始人最初是在DeepMind位于加拿大阿尔伯塔省埃德蒙顿的办公室相识的——这是Alphabet首个国际AI研究地点,于2023年关闭。在那里,他们开发了DeepStack,这是第一个在无限注德州扑克中击败职业玩家的AI程序。他们还与Rich Sutton共事,后者因其对强化学习的奠基性贡献获得了2024年图灵奖,目前担任EquiLibre顾问委员会成员。
创始人没有留在北美,而是选择回到他们的祖国捷克共和国。“这里有很多我们曾合作过的人,而且在谷歌和其他地方有大量捷克侨民,”Schmid解释道。“这些人都是我们的朋友,所以我们告诉他们:‘嘿,伙计们,我们要搬回布拉格了,你们愿意加入吗?’”这一决定帮助该初创公司在2022年组建了一支25人的初始团队。Schmid认为这一地点仍是优势:“在这里留住优秀人才要容易得多,因为这里不是每两个月就冒出一个新的热门AI项目。”
扩展算力与竞争格局
EquiLibre计划利用A轮融资扩展其计算基础设施,目标是建成中欧和东欧最大的计算集群之一。根据Dealroom数据,该公司此前以1.4亿美元估值完成了由Blossom Capital领投的1000万美元种子轮融资。种子前投资来自专注于中欧和东欧的风险投资公司Credo,该公司也曾投资ElevenLabs和UiPath。
自EquiLibre成立以来,强化学习在交易领域获得了更广泛的认可。“当我们开始时,人们持怀疑态度,”Schmid表示。“因为我们四年前就起步了,我们相信自己处于领先地位。”尽管如此,竞争依然激烈。交易巨头Jane Street已宣称自己同时使用强化学习和大语言模型,并声称拥有数万块高端GPU。EquiLibre的目标是通过从更少的芯片中提取更高性能来实现差异化——正如Schmid所说,“以少胜多”。
Schmid并不认为市场是零和博弈。“这不是一个赢家通吃的市场,”他说。EquiLibre的目标是成为“交易领域的AI实验室”——这一声誉建立在研究成果和稳定的回报之上,而非追求赚取市场中的每一分钱。
结论
EquiLibre Technologies代表了前沿AI研究与实际金融应用的一次显著融合。其创始人曾在复杂、非完美信息环境中打造出超越人类水平的AI——如今他们正将同样的方法应用于条件相似的市场。该初创公司5亿美元的估值、与一家大型量化公司的合作,以及其宣称要建设中欧最大计算集群之一的目标,都表明强化学习或许已在量化金融领域找到了永久归宿。就目前而言,这一赌注似乎正在获得回报。
常见问题解答
问题1:什么是强化学习?为什么它对交易有用?
强化学习是一种AI训练技术,模型通过奖励和惩罚机制学习最优行为。在交易中,奖励信号清晰且可衡量:盈利与亏损。这使得金融市场成为强化学习的天然应用场景,因为AI可以根据结果不断优化策略。
问题2:EquiLibre Technologies的创始人是谁?
公司由Martin Schmid(首席执行官)、Rudolf Kadlec(首席技术官)和Matej Moravcik(首席战略官)共同创立。三人均曾是DeepMind埃德蒙顿办公室的访问博士生,并且是开发DeepStack的团队成员——DeepStack是第一个在无限注德州扑克中击败职业玩家的AI。
问题3:EquiLibre如何盈利?
EquiLibre将其强化学习算法应用于与量化对冲基金(包括Tower Research Capital)合作的股票和加密货币交易中。AI智能体在标普500和纳斯达克等主要指数上执行交易,通过强化学习学到的策略产生回报。

资金费率
资金费率热力图
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
账号安全
资讯收藏
自选币种