EVE/WTAGISTUDY/2025-09-03/TRANSCRIPT→STRUCTURED

AI视频创作完整指南:从音乐到发布的全链路实战

讲师:金属文
时间:2025年9月3日 19:53-21:14
WaytoAGI晚8点共学

AI视频创作核心流程

创作契机与工具选择

本次分享围绕完整的AI视频创作工作流展开,涵盖音乐制作、脚本分镜、生图、视频制作、配音音效、剪辑及发布等关键环节。

创作工具选择:选用 One 2.2 作为主要视频生成模型,在开源模型中表现突出,使用门槛低,通义万象官网可免费使用,生成速度快。同时掌握多款模型优势:海螺擅长特效和打斗镜头,Sora 在衔接上表现更好。

以音乐为创作源点:受乐队创作启发,先制作音乐再根据音乐的起承转合结构撰写脚本和分镜,使视频具备强烈的节奏感和感染力。这种"音乐优先"的创作方法论确保了视频的音画同步。

音乐与脚本的创作方法论

从SUNO到分镜设计

SUNO音乐制作技巧:使用SUNO制作AI音乐,通过设计段落提示词根据音乐情绪递进需求,可关闭inspiration功能进行精确控制。充分利用分轨导出功能,根据不同段落选择合适的乐器,增强剪辑灵活性。

灵感驱动的创作流程:创作方式类似姜文风格,依赖灵感触发,先确定框架,边生图边写分镜,创作中灵活调整。以汉武帝时期卫青霍去病伐匈奴为例,前期设计情绪铺垫桥段,后续递进到打斗高潮。

AI视频终局与内容终局相关,能流传的内容共同点是足够好——好故事、好音乐等。创作者应不断进步,让作品越来越好。

— 金属文

生图与视频生成的一致性解决

从角色设定到首尾帧处理

系统的角色设定流程:先输出四张角色设定图(正面、背面、全身、特写),提取角色特征提示词。尝试二次元、写实、3D皮克斯等多种风格,生成满意场景后保存风格提示词供后续使用。

首尾帧解决方案:纯单帧图生视频出现一致性冲突时,可使用首尾帧技术解决(如人物转身问题),准备好首尾帧及注意细节确保视频前后一致。借助Nano Banana等新工具大幅提高创作效率。

系统提示词撰写方法:借鉴推特博主思路并改良,编写系统提示词让大模型将简单创意转化为专业摄影艺术指令。包含结构化源码和扁平化提示词,在特定窗口进行任务引导,可开启草稿模式提高生成速度。

配音、剪辑与发布运营

从声音克隆到数据分析

海螺AI配音功能强大:支持声音克隆(20兆以内文件),免费用户可用。配音时常调整语速(每次不超过0.05),音高和音量可按需求调整,支持情绪指定或auto自动识别,会员可进行更多进阶调整。

音乐优先的剪辑思路:先有音乐后做画面,分轨导入后按起承转合和鼓点位置做标记,用曲线变速增强节奏感。不同模型视频需调色统一(推荐达芬奇),常用闪黑、闪白、叠化等转场,可用首尾帧做高级转场。

流量漏斗思维:遵循"封面→标题→内容"的优先级,先制作吸引点击的封面和标题。发布后关注视频跳出点,找出跳出率高的时间节点并优化。前期立项确保方向正确,过程中及时纠错,事后复盘避免重复犯错。

热爱才能跨越周期。找到真正热爱的方向——Web编码、AI视频、AIGC等,在创作道路上不断前行,这是AI创作者的终极竞争力。

— 金属文的创作哲学

核心要点 · 7条

  1. 音乐优先策略:先用SUNO制作音乐,根据音乐的起承转合结构撰写脚本和分镜,确保视频具备强烈的节奏感和感染力
  2. 角色设定系统化:输出四张完整角色设定图(正面、背面、全身、特写),提取特征提示词,尝试多种风格后保存可复用的风格提示词
  3. 首尾帧一致性解决:用首尾帧技术解决图生视频的一致性问题,如人物转身等难题,Nano Banana等工具可大幅提升效率
  4. 系统提示词方法论:采用RTF结构、信息全面、正面表述、结构化语法,运用上下文工程和思维链等进阶技巧,打造鲁棒性提示词
  5. 剪辑音画同步:分轨导入音乐后按鼓点标记切割,用曲线变速增强节奏,统一调色并灵活运用转场效果,确保音画完美配合
  6. 流量漏斗运营:封面和标题优先制作以吸引点击,发布后分析跳出点并持续优化,前期立项、中期纠错、事后复盘形成闭环
  7. 多模型协同策略:掌握One 2.2(均衡)、海螺(特效打斗)、Sora(衔接)等模型差异化优势,针对不同场景灵活选用,节省制作成本