EVE/AI硬件/2026-02-08/TRANSCRIPT→STRUCTURED
深度解析 AI硬件 × AI应用开发
嘉宾:银海(AI产品经理)
•
时间:2026年2月8日 19:55-21:42
第一部分:硬件市场竞争格局与Rocket眼镜核心能力
AI眼镜已成为科技大厂的竞争焦点,市场参与者众多。从华为早期的通话眼镜,到如今Rocket、雷鸟等品牌在显示和功能方面的快速迭代,再到专门做多语言翻译的眼镜在外贸市场的热销,AI眼镜赛道正在经历快速发展。
Rocket眼镜的核心能力包括"听"和"看"两个维度:
- 听的能力:通过镜腿扬声器实现放歌、播报、对话等功能
- 看的能力:依靠摄像头进行录像、拍照,可与大模型对话(乐奇AI助手)
- 显示效果:光栅屏幕解决了漏光问题,支持绿色全息触控AR显示,可显示时间、温度、电量等信息
应用场景涵盖AI识物、AI拍照答疑、多语言翻译、快速回复、实时导航、灵感记录等,还能与支付宝、银联合作实现支付功能。
体验挑战:录像时能耗较高、生命周期短;由于需要双层镜片设计,透光率受影响;扬声器声音易被旁人听见。
第二部分:从应用体验到开发工具链
眼镜端支持对话、调节音量亮度、便签、翻译、提词器、导航、会议纪要、智能体商店等多种交互操作。智能体商店中有多种通用型智能体,如12306订票、热量识别、查价格、单词收集等。
"开发者可搭建个性化智能体,如食物卡路里识别智能体,通过摄像头识别眼前物体的卡路里含量。"
— 银海
开发平台生态对比:
- 灵珠平台:Rocket原生平台,插件生态和模型相对有限,但有快速模板
- 三方平台:阿里云百炼和COZE等拥有丰富模型和模板,支持一键复制应用并绑定到眼镜
开发注意事项:接入时需获取API key和应用ID,COZE个人访问API key会在30天后过期,需动态更换。
第三部分:从界面设计到功能集成的实战复现
通过AI IDE创建AI glasses项目,参考眼镜交互图片构建终端体验。设计采用绿色极客风格,左下角显示时间和天气,右下角显示电量,中间显示语音输入转写内容。
核心功能集成:
- ASR语音识别:接入语音模型API实现实时语音识别和翻译
- 主Agent搭建:创建Rocket眼镜助理Agent,选择Flash模型,支持文本和图像信息处理
- 工具能力:添加联网搜索、地图导航等工具,接入Amap地图插件实现路线规划
- 语音合成:接入实时语音合成API,支持自动语音打断能力
"通过code、阿里云百炼等工具,已打通从信息采集到智能体搭建再到眼镜显示的完整开发链路。开发范式简单高效,发布应用后可立即生效。"
成本分析:使用Mac mini运行Openclaw测试中,5分钟388次请求耗费约30美元;切换到国内模型后成本降低。大模型平台多有免费额度,ASR语音识别每秒成本仅0.00022,整体开发成本相对较低。开发者可通过删除API key重新创建的方式控制成本。
第四部分:应用拓展方向与社区交流
AI眼镜在视觉类捕获方面有进一步拓展的空间,如拍照后生成风格化内容、视频剪辑等。结合用户生活场景的个性化定制,能够不断打磨应用体验。
实战建议:观众可参考会议回放了解眼镜连接方法,开发时直接复制已有模板可大幅降低开发成本。龙虾网关虽未完全打通,但整体开发速度较快,与多种IM通讯设备的底层通信已基本实现。
💡 核心要点速记
- 市场现状:AI眼镜成为科技竞争焦点,Rocket、雷鸟等产品在显示、功能方面快速迭代,专业翻译眼镜已在外贸市场热销
- Rocket眼镜核心优势:具备"听"(扬声器)和"看"(摄像头)双维度能力,支持语音对话、AR显示、多语言翻译、支付等多场景应用
- 开发生态选择:灵珠平台供给较弱,但阿里云百炼和COZE提供丰富模型和模板,支持快速一键部署,是更优的开发选择
- 完整链路可行性:通过AI IDE、语音识别、Agent搭建、工具集成,已打通从信息采集到眼镜显示的闭环,开发范式高效
- 成本控制:国内大模型平台提供免费额度,ASR识别成本极低(0.00022/秒),整体开发投入相对经济
- 用户体验挑战:双层镜片影响透光率,扬声器隐私问题需优化,电池续航在视频录制场景下需改进
- 未来方向:视觉内容生成、视频编辑、个性化定制是眼镜应用的主要拓展方向,市场潜力待深度挖掘