百度发布自研模型MuseSteamer: 一张图可生成电影级高清有声视频
IT之家7月2日消息,百度商业研发团队发布自研视频生成模型“MuseSteamer”及创作平台“绘想”,MuseSteamer是全球首个实现中文音视频一体化生成的视频模型。该技术可实现画面与音效、人声台词的协同创作,打破传统AIGC视频“先画面后配音”的割裂流程。 据悉,MuseSteamer在权威榜单VBenchI2V中以89.38%总分登顶全球第一,支持一张图生成10秒1080p电影级画质视频,人物微表情与运镜效果达专业影视水准。其核心能力源于亿级中文多模态数据清洗、精细化视频结构化描述语...
2025-07-05