阿里百炼平台具有基础模型服务和应用开发两大核心能力,可调用千问系列大模型,覆盖文本、视觉、图片、视频、语音等多模态能力。年前发布的新模型性能大幅提升,新上线的图像模型也表现出色。
平台可直接复刻多个开源应用,包括新春营销专区的短信生成器、海报生成器等,其中海报生成器涉及MCP(Model Context Protocol)的调用能力。
Workflow是单次与模型进行复杂交互的流程,有明确的开始和结束,中间步骤可根据需求灵活设计。以萌宠拜年视频为例,通过图生视频和文生视频的多节点流程,相比单一Agent推理更为复杂,但逻辑更清晰。
通过条件判断节点将文生视频和图生视频两个业务场景分开——根据是否上传图片决定走不同分支。条件变量来自开始节点,可添加自定义变量实现复杂的分支逻辑,支持"全部满足"和"任意满足"两种条件关系。
"Workflow承担业务工作超70%,是中期考试,检验对各节点应用及知识储备的掌握。若未掌握Workflow相关能力如调API、MCP等,搞Agent会遇阻碍。"
以生成猫咪跳舞视频为例:用户上传小猫图片并输入"生成猫咪跳舞视频"指令 → 条件判断命中图生视频分支 → 大模型生成优化提示词 → 脚本节点抠出图片URL → 图生视频节点生成MP4格式视频 → 以Markdown格式打印视频链接可在页面实时渲染展示。
新手入门阶段:优先掌握大模型、多模态生成、条件判断和变量等基础内容,足以完成大部分工作。
进阶专业阶段:有一定基础的学员可深入学习知识库操作、API接口通讯、脚本处理、插件组件运用等高级内容。
实践强调:只有通过实际操作才能真正理解各节点功能,建议按照教学文档边学边做。
架构层面:可随意增加节点、调整条件判断分支,满足更复杂的业务需求。
内容层面:调整节点内部的提示词和参数,优化生成质量。实际上就是在既有框架上进行定制化改造,测试后通过流程输出节点监控中间结果。
虽然当前处于agentic时代有诸多Agent架构选择,但Workflow是检验对模型交互理解的中期考试。掌握Workflow的API调用、MCP集成等能力,是构建复杂Agent系统的基础。业务实践中,Workflow承担超过70%的生产工作。
可通过查看发布渠道的使用文档,安装带swap的Python SDK包,调用import application,输入参数变量、API key和prompt即可实现Workflow的程序化调用。
持续学习资源:关注WaytoAGI视频号获取后续课程,扫码加入百炼官方群获得技术支持,在小红书关注"电波曲奇"账号了解最新模型和技术动态。