EVE/WTAGISTUDY/2025-09-03/TRANSCRIPT→STRUCTURED

AI视频创作完整指南：从音乐到发布的全链路实战

讲师：金属文

时间：2025年9月3日 19:53-21:14

WaytoAGI晚8点共学

AI视频创作核心流程

创作契机与工具选择

本次分享围绕完整的AI视频创作工作流展开，涵盖音乐制作、脚本分镜、生图、视频制作、配音音效、剪辑及发布等关键环节。

创作工具选择：选用 One 2.2 作为主要视频生成模型，在开源模型中表现突出，使用门槛低，通义万象官网可免费使用，生成速度快。同时掌握多款模型优势：海螺擅长特效和打斗镜头，Sora 在衔接上表现更好。

以音乐为创作源点：受乐队创作启发，先制作音乐再根据音乐的起承转合结构撰写脚本和分镜，使视频具备强烈的节奏感和感染力。这种"音乐优先"的创作方法论确保了视频的音画同步。

从SUNO到分镜设计

SUNO音乐制作技巧：使用SUNO制作AI音乐，通过设计段落提示词根据音乐情绪递进需求，可关闭inspiration功能进行精确控制。充分利用分轨导出功能，根据不同段落选择合适的乐器，增强剪辑灵活性。

灵感驱动的创作流程：创作方式类似姜文风格，依赖灵感触发，先确定框架，边生图边写分镜，创作中灵活调整。以汉武帝时期卫青霍去病伐匈奴为例，前期设计情绪铺垫桥段，后续递进到打斗高潮。

AI视频终局与内容终局相关，能流传的内容共同点是足够好——好故事、好音乐等。创作者应不断进步，让作品越来越好。

— 金属文

从角色设定到首尾帧处理

系统的角色设定流程：先输出四张角色设定图（正面、背面、全身、特写），提取角色特征提示词。尝试二次元、写实、3D皮克斯等多种风格，生成满意场景后保存风格提示词供后续使用。

首尾帧解决方案：纯单帧图生视频出现一致性冲突时，可使用首尾帧技术解决（如人物转身问题），准备好首尾帧及注意细节确保视频前后一致。借助Nano Banana等新工具大幅提高创作效率。

系统提示词撰写方法：借鉴推特博主思路并改良，编写系统提示词让大模型将简单创意转化为专业摄影艺术指令。包含结构化源码和扁平化提示词，在特定窗口进行任务引导，可开启草稿模式提高生成速度。

从声音克隆到数据分析

海螺AI配音功能强大：支持声音克隆（20兆以内文件），免费用户可用。配音时常调整语速（每次不超过0.05），音高和音量可按需求调整，支持情绪指定或auto自动识别，会员可进行更多进阶调整。

音乐优先的剪辑思路：先有音乐后做画面，分轨导入后按起承转合和鼓点位置做标记，用曲线变速增强节奏感。不同模型视频需调色统一（推荐达芬奇），常用闪黑、闪白、叠化等转场，可用首尾帧做高级转场。

流量漏斗思维：遵循"封面→标题→内容"的优先级，先制作吸引点击的封面和标题。发布后关注视频跳出点，找出跳出率高的时间节点并优化。前期立项确保方向正确，过程中及时纠错，事后复盘避免重复犯错。

热爱才能跨越周期。找到真正热爱的方向——Web编码、AI视频、AIGC等，在创作道路上不断前行，这是AI创作者的终极竞争力。

— 金属文的创作哲学