EVE/WaytoAGI/2026-02-12/TRANSCRIPT→STRUCTURED

用阿里百炼制作春节祝福内容一场直播掌握Workflow全流程

直播嘉宾:电波曲奇
时间:2026年2月12日 19:55-21:08

阿里百炼平台核心能力

02:00-08:14

阿里百炼平台具有基础模型服务和应用开发两大核心能力,可调用千问系列大模型,覆盖文本、视觉、图片、视频、语音等多模态能力。年前发布的新模型性能大幅提升,新上线的图像模型也表现出色。

平台可直接复刻多个开源应用,包括新春营销专区的短信生成器、海报生成器等,其中海报生成器涉及MCP(Model Context Protocol)的调用能力。

Workflow核心架构与节点运作

15:00-52:01

Workflow本质与设计思路

Workflow是单次与模型进行复杂交互的流程,有明确的开始和结束,中间步骤可根据需求灵活设计。以萌宠拜年视频为例,通过图生视频和文生视频的多节点流程,相比单一Agent推理更为复杂,但逻辑更清晰。

条件判断节点:流程分支控制

通过条件判断节点将文生视频和图生视频两个业务场景分开——根据是否上传图片决定走不同分支。条件变量来自开始节点,可添加自定义变量实现复杂的分支逻辑,支持"全部满足"和"任意满足"两种条件关系。

核心节点类型对比

  • 开始节点:任务起点,包含预置变量(图片、query)和自定义变量
  • 大模型节点:与模型交互的核心,输出结果存储在result中,支持不同模型类型
  • 脚本节点:运行Python/JS代码处理工程问题,可处理列表转字符串等数据格式转换
  • 图生视频节点:选择i to v模型,输入参考图片和提示词,可调整清晰度、时长、种子
  • 文生视频节点:直接文本输入,无需图片参考,流程更简洁
  • 流程输出节点:类似打log功能,便于追踪中间过程,替代查看流程日志

"Workflow承担业务工作超70%,是中期考试,检验对各节点应用及知识储备的掌握。若未掌握Workflow相关能力如调API、MCP等,搞Agent会遇阻碍。"

— 电波曲奇

萌宠拜年视频实战与问题解答

30:31-01:05:01

完整执行流程演示

以生成猫咪跳舞视频为例:用户上传小猫图片并输入"生成猫咪跳舞视频"指令 → 条件判断命中图生视频分支 → 大模型生成优化提示词 → 脚本节点抠出图片URL → 图生视频节点生成MP4格式视频 → 以Markdown格式打印视频链接可在页面实时渲染展示。

常见技术问题详解

  • 列表转字符串作用:因图生视频需要image的URL格式,但原生节点输入是JSON,该步骤从长JSON中截取网页地址作为入参,实现格式转换
  • 流程输出目的:不仅可显示最终结果,更重要的是将意图识别、分流等中间信息打进输出,便于追踪内部执行逻辑,类似打log功能
  • 多图参考生成限制:当前版本i to v入参仅支持单图,多图参考需等待百炼升级,已向产品经理提需求
  • 参数调整测试:修改视频时长、分辨率、随机种子等参数后需重新测试,可快速验证效果差异

分级学习建议

新手入门阶段:优先掌握大模型、多模态生成、条件判断和变量等基础内容,足以完成大部分工作。

进阶专业阶段:有一定基础的学员可深入学习知识库操作、API接口通讯、脚本处理、插件组件运用等高级内容。

实践强调:只有通过实际操作才能真正理解各节点功能,建议按照教学文档边学边做。

Workflow架构优化与技术前瞻

55:33-01:09:31

Workflow改造方向

架构层面:可随意增加节点、调整条件判断分支,满足更复杂的业务需求。

内容层面:调整节点内部的提示词和参数,优化生成质量。实际上就是在既有框架上进行定制化改造,测试后通过流程输出节点监控中间结果。

Workflow在Agent时代的价值

虽然当前处于agentic时代有诸多Agent架构选择,但Workflow是检验对模型交互理解的中期考试。掌握Workflow的API调用、MCP集成等能力,是构建复杂Agent系统的基础。业务实践中,Workflow承担超过70%的生产工作。

Python SDK调用与后续资源

可通过查看发布渠道的使用文档,安装带swap的Python SDK包,调用import application,输入参数变量、API key和prompt即可实现Workflow的程序化调用。

持续学习资源:关注WaytoAGI视频号获取后续课程,扫码加入百炼官方群获得技术支持,在小红书关注"电波曲奇"账号了解最新模型和技术动态。

💡 核心要点总结