LongCat-Video-Avatar— 美团开源的数字人视频生成模型

admin 百科 10

LongCat-Video-Avatar 是什么

longcat-video-avatar 是美团 longcat 团队研发的一款音频驱动型数字人动画生成模型。该模型可生成高度真实、唇形精准对齐的长时长视频,在整个生成过程中稳定维持人物身份特征与自然流畅的动作表现。它支持多种输入组合方式,涵盖音频+文本生成视频(at2v)、音频+文本+参考图像生成视频(ati2v),以及已有视频的智能续写功能。通过语音与动作解耦设计、冗余内容抑制策略及vae误差传播控制等关键技术,显著提升了长视频生成的质量与稳定性,广泛适用于虚拟演出、ai歌手、知识播客、营销演示及多角色协同交互等实际业务场景。

LongCat-Video-Avatar— 美团开源的数字人视频生成模型-第1张图片-佛山资讯网

标签: git github 编码 美团 ai 音乐

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~