自选
我的自选
查看全部
市值 价格 24h%
  • 全部
  • 产业
  • Web 3.0
  • DAO
  • DeFi
  • 符文
  • 空投再质押
  • 以太坊
  • Meme
  • 比特币L2
  • 以太坊L2
  • 研报
  • 头条
  • 投资

免责声明:内容不构成买卖依据,投资有风险,入市需谨慎!

最新AI动态:HeyGen 推出新功能Avatar V,15秒面部复制与无限AI视频生成

2026-04-10 05:06:23
收藏

AI视频新作:HeyGen发布Avatar V,15秒生成数字分身

本周引发热议的最新AI视频工具是HeyGen于4月8日发布的Avatar V。该工具仅需一段15秒的网络摄像头录制,即可构建用户面部、声音与姿态的逼真数字孪生,并无需任何专业设备即可生成无限量的影棚级视频。

核心技术突破

Avatar V仅通过一段15秒视频便能捕捉用户独特的微表情、唇部几何结构、面部轮廓及自然动作,并在后续生成的每一段视频中——无论时长、视角、着装或场景如何变化——保持身份一致性。这解决了长期困扰AI分身技术的身份漂移问题,即多数AI分身数秒后质量显著下降。

创建数字孪生后,用户可选择一张基础照片作为身份参照,通过文字指令自由更换着装与环境,并以175种语言生成口型同步的视频内容。声音克隆为独立可选步骤,公司建议采用此功能以实现最佳真实感。

Avatar V现已成为HeyGen平台所有功能的基础架构,已与Seedance 2.0影视级视频生成系统整合,并在各付费订阅层级开放使用。

设计哲学与实践

官方介绍指出,Avatar V基于一个核心信念构建:产出质量必须达到用户愿意署名的标准——不是“AI级优秀”,而是真正意义上的优秀。

该模型采用基于时间锚定的身份嵌入技术进行训练,从15秒片段中提取构成个人辨识度的特定姿态与表情转换逻辑。无论是全景、中景还是特写镜头,都能保持同一录制源的连贯性。整个过程无需专业影棚灯光或摄制团队,标准手机或网络摄像头即可满足需求。

关键设计原则在于将身份特征与外观呈现分离:15秒视频定义人物动态特征,基础照片定义静态形象。用户可在保持专属动态特征的前提下,自由改变视觉呈现。

技术演进:解决早期模型局限

多数AI分身系统往往优化单帧效果——在模型理想条件下呈现惊艳的截图、短片或受控演示片段。这些系统可能在两秒内表现锐利,但二十秒后随着面部特征漂移即告崩溃。Avatar V专为全程稳定设计,确保视频全时段无身份漂移。公司将其定义为身份一致性:无论是30秒短片还是10分钟模块,从首帧到末帧始终保持相同面容、相同微表情、相同存在感。

实际应用场景

实际工作流程包含三步:录制15秒视频、可选录制独立声音克隆、选择作为场景生成身份参照的基础照片。基于此,用户可通过文字指令生成新着装、场景与风格,或调用平台素材库。成品视频支持175种语言,口型自动适配目标语言。官方建议录制时充分展现表现力,因为“注入的能量决定产出的能量”。

规模化内容创作意义

能够降低专业内容制作成本与时间的AI工具,正在直接影响企业人力配置决策。AI内容工具的普及程度,已成为机构投资者评估AI基础设施支出持续性的关键变量。Avatar V现已通过HeyGen付费计划全面开放,用户可使用平台全套模板、翻译及影棚工具。

展开阅读全文
更多新闻