LongCat-Video-Avatar 是什么
longcat-video-avatar 是美团 longcat 团队研发的一款音频驱动型数字人动画生成模型。该模型可生成高度真实、唇形精准对齐的长时长视频,在整个生成过程中稳定维持人物身份特征与自然流畅的动作表现。它支持多种输入组合方式,涵盖音频+文本生成视频(at2v)、音频+文本+参考图像生成视频(ati2v),以及已有视频的智能续写功能。通过语音与动作解耦设计、冗余内容抑制策略及vae误差传播控制等关键技术,显著提升了长视频生成的质量与稳定性,广泛适用于虚拟演出、ai歌手、知识播客、营销演示及多角色协同交互等实际业务场景。

版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。
还木有评论哦,快来抢沙发吧~