Kaleido— 智谱AI开源的多主体视频生成框架

admin 百科 13

Kaleido 是什么

kaleido 是智谱ai推出的开源多智能体视频生成框架,专注于攻克多主体视频生成中的核心挑战——主体身份一致性与背景信息解耦。该框架依托自主研发的数据构造流程及 r-rope(reference rotary positional encoding)机制,精准剥离主体特征与场景背景,在多人物、多物体共存的复杂动态画面中稳定保留各主体的视觉辨识度。目前,kaleido 在多项多主体视频生成基准测试中刷新 sota 表现,为学术界与工业界提供了一个高性能、可复现、完全开源的视频生成技术底座,显著降低高质量多主体内容创作门槛。

Kaleido— 智谱AI开源的多主体视频生成框架-第1张图片-佛山资讯网

标签: git github 编码 ai pdf 短视频

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~