可灵2.6模型上线！语音、音效与画面一键直出重构AI视频创作工作流

来源：

2025-12-04

12月3日，可灵推出视频生成2.6模型，该模型提供了里程碑式的“音画同出”能力，彻底改变了传统AI视频生成模型“先无声画面、后人工配音”的工作流程。它能够在单次生成中，输出包含自然语言、动作音效以及环境氛围音的完整视频，重构了AI视频创作工作流，极大提升创作效率。

重构AI视频创作工作流中文语音生成效果全球领先

可灵2.6模型升级了文生音画、图生音画两大功能，输入文本或是输入图片结合提示词文本，均可直接生成带有语音、音效及环境音的视频。语音当前支持生成中文以及英文，生成视频长度最长支持10秒。

该升级重构了传统AI视频创作“先生成无声的视频，再结合其他软件完成后期声音制作”的工作流，创作者使用可灵2.6模型，能够直接生成包含人声、环境与效果音效的视频，极大提升了创作者的工作效率。

通过对物理世界声音与动态画面的深度语义对齐，可灵2.6模型在音画协同、音频质量和语义理解上表现亮眼。

音画协同上，可灵2.6模型生成的视频，在语音节奏、环境音与画面动作上紧密呼应，实现了对画面动态与声音节奏的深度对齐，避免了传统工作流可能产生的“画面一套、声音一套”的割裂体验。

音频质量上，在支持人声、音效、环境声等多类型声音生成的基础上，生成的音频音质更干净、层次更丰富，整体听感更接近真实的混音效果，满足专业级创作对声音细节的高要求。

语义理解上，该模型对多种场景下的文本描述、口语表达和复杂剧情有较强的语义理解能力，能够更准确地把握创作者意图，从而输出逻辑更严密、更贴合用户需求的音画内容。同时，可灵2.6模型在中文语音生成效果上保持全球领先。

以上信息中金仅提供信息存储服务，如有异意请邮件联系Email：cngoldnets@qq.com 我们将及时进行处理！

亮相2026智博会中国移动以“通信+算力+智能”全栈创新勾

营收利润双双实现两位数增长联想中国全域突破

张艺兴现场见证！2026易捷“微光护航·环塔筑梦

百度Create2026：AI Agent走进家庭，小度给出落

43%体育从业者每周运动3次以上！安踏集团倡导健康积极生活

中金观评

2026-05-22

+关注

点评(1)

公牛AI大路灯全球首发：从“安全用电”到“健康用光”的战

中金观评

2026-05-19

+关注

点评(1)

“五星”认证！中国石化长城润滑油发布《2025 ESG（社会责

中金财报

2026-05-23

+关注

点评(1)

卡位端侧感算，SENASIC琻捷智能电芯业务去年增速高达56.6%

中金财报

2026-05-22

+关注

点评(1)

产经安谋科技助力Synaptics 打造AI原生MCU解决方案，让边缘智

中电金信智博会首发双平台：破解企业AI”

《华为应用市场2025年度安全与隐私治理报

投资43%体育从业者每周运动3次以上！安踏集团倡导健康积极生活

公牛AI大路灯全球首发：从“安全用电”到“健康

梅西+哈兰德联袂登场！百威助阵2026年国际足联世界杯；每

中金快讯

2026-05-13

+关注

点评(1)

SID2026丨TCL华星APEX全技术路径创新落地多元场景

中金快讯

2026-05-08

+关注

点评(1)

行业首个3万人发布会+深耕女性出行赛道：雅迪正在重塑行业

商业财经

2026-05-29

+关注

点评(1)

哈密刺绣走上街头，千年非遗被“翻译”成日常时尚

商业财经

2026-05-28

+关注

点评(1)

热点排行

迅策TokenOS操作系统精准卡位AI计量

中金汇聚

亮相2026智博会 中国移动以“通信+算力+智能”全栈创新勾

亮相2026智博会中国移动以“通信+算力+智能”全栈创新勾