EVE/EVE230/2025-12-30/TRANSCRIPT→STRUCTURED

让 AI 赋予数字人灵魂

WaytoAGI晚8点共学
2025年12月30日 19:55-21:48
JadeWu 讲师

数字人的四维构成

核心定义 → 维度分解

数字人区别于虚拟角色的关键在于有灵魂,能给人活生生的感觉。JadeWu强调,数字人由皮囊、灵魂、声音、表演四个维度组成:

"数字人的核心是持续运营,而非单纯炫技。"

— JadeWu

AI数字人制作工具全景图

工具选择 → 实操应用

JadeWu分享了完整的工具矩阵,涵盖创意、生图、动画、配音等全流程:

环节 推荐工具 特点
创意文本 Google Gemini 大语言模型创作分镜、剧本
生图 MJ、Lovart、Nano MJ生成人设,Nano调整细节
数字人动画 可灵 2.0、即梦 可灵画质优秀,即梦速度快
配音 Minimax Audio、Elab Minimax中文多情绪表现优异
超分 magnific、即梦智能超清 magnific效果最佳但价格贵
后期剪辑 剪映 成片发布前处理

从创意到成片:完整工作流

流程设计 → 实战案例

三大制作环节:

  1. 创意阶段:用大语言模型生成分镜、剧本、台词
  2. 视觉阶段:用MJ、Lovart出图,通过Nano调整一致性
  3. 动画阶段:用可灵或即梦让数字人动起来,配音,添加表演和运镜

典型案例展示:

"在 AI 时代,技术迭代快,创意和审美更重要。初学者先用基础工具积累经验,再用效率化工具。"

— JadeWu

数字人制作进阶技巧

动作控制 → 音画同步 → 细节优化

动作控制要点:

音画同步方法:

其他工具介绍:

🎯 核心要点提炼

  1. 灵魂运营是核心:数字人不是炫技,要持续打造人设、故事背景、说话风格,做长期运营
  2. 可灵2.0是首选:高品质模式下画质优秀,需上传日常生成的高质量图片,一次抽4条确保效果稳定
  3. 创意审美优于技术:工具迭代快,但创意和审美更能差异化,初学者需先积累经验再用高效工具
  4. Minimax配音最优:中文多情绪表现卓越,支持音画同出直接带语音,指定音色吐字更清晰
  5. 镜头丰富度有诀窍:用不同景别的同角色图+同一动作控制,而非重复抽卡,节省成本提高效率
  6. 工具矩阵需完整:从Gemini创意→MJ/Lovart生图→可灵/即梦出动画→Minimax配音→剪映后期,每环节选对工具
  7. 运镜提示词要简洁:可灵和海螺2.3模型适合大幅度运镜,提示词应避免权重分散(如"第一视角高速飞跃")