摘要
百度AI IDE Comate凭借中文编程理解、内置实时预览、开放MCP生态和多智能体协同四大后发优势,精准解决AI编程痛点,实现弯道超车。
饼干哥哥昨天参加了百度 AI Day 大会,会上发布了 AI 编程 IDE Comate.

到官网 https://comate.baidu.com/zh 就能下载使用。

说实话,这个时间点才从把原先的插件转成 IDE, 是不是有点晚了?我们还有必要熟悉一个新的产品来用吗?
刚收到邀请的时候我是这个想法,但到现场交流后,才发现:这是后发优势。多模态、多智能体协同、设计稿一键转代码、实时预览修改、超级补全……Comate 专挑当下用 AI 编程的痛点来打。

简报 ⬇️

AI 编程各项能力的对比中,Comate 处在什么位置?
可以看结论表格:

详情 🔍
因为我在筹备 Reddit 产品的上线,刚好就用 Comate 来帮我完成前端页面的开发。
实测有 4 个值得分享的点,同时也是我认为** Comate 在洞察用户需求后发布的 4 个后发优势。**
1️⃣ 本土优化,中文编程理解碾压 Cursor
首先,百度一直清楚自己的定位:从中文最大搜索引擎开始,到** Comate 一直都是围绕着「中文落地场景」来做**
别小看这点。之所以很多人觉得 AI 编程没办法用,跑不出来自己想要的。
就是因为很多用户是不知道编程的专业术语,而海外产品又无法很好的理解中文。
尤其是在垂直文化语境下的。

例如大会现场有个算法工程师张欣欣,在做中医 AI 产品,在描述传统中国文化的风格的时候,Cursor 做了 3 遍都无法击中,而 Comate 一下子就理解到了。
2️⃣ 内置实时预览,让 AI 指哪打哪
开发前端页面的时候,最烦的就是改某个主线的时候需要截图返回来跟 AI 说怎么改。
目前普遍的解决方案是安装一个插件叫 Stagewise ,能让我直接在页面点选某个模块后,让 AI 精准修改。我装了但不知道为什么配置完后用不了。
结果今天在用 comate 的时候很惊喜的发现他们本身就内置了这个功能,通过内置的预览视图就能指哪打哪。
正常来说,用 Comate 做网站,完成的时候它会启动一个本地 ip 地址的页面预览入口。
如果没有的话,就像我这样让它预览,然后点「预览网页」

注意看页面右下角,点「选中元素」

此时就能点选网页不满意的地方
例如这里,描述中国企业问题和我们解决方案的时候,单纯列出来不好看,我要修改展示样式。
于是就选中这里,

鼠标单击后,就会看到对话框自动匹配到了这块的代码。
此时就可以直接提需求了。

这块的效率提高很多,能精准改代码。

效果是这样。

同时,这也有个好处就是能让 AI 不要「过度发挥」有时候让它改点小东西,结果 AI 给改面目全非了。
精准指哪打哪,才是用户真正需要的效果。
3️⃣ 野心不止 MCP,百度想搭建自己的 AI 应用生态
现在 Cursor、Windsurf 等一线的 AI 编程 IDE,已经把自己的产品填了一波又一波的内置功能。但说实话,总有满足不到的地方。
而 Comate 选择了另外一条路:搭建开放生态,借助 MCP 协议,补充 API、SDK 的形式链接第三方的研发平台、数据服务、私有知识库与模型。

这意味着开发者可以将其接入**公司内部的 Jira 项目管理系统、飞书协作套件或自研的代码库,让 AI 智能体在熟悉的企业环境中工作。**更不用说现在的基操:通过 MCP 市场,将 GitHub、Figma 等常用工具集成进来,让 Zulu 等智能体直接调用这些外部工具的 API 来完成任务,例如直接操作 GitHub 仓库。
其中比较惊喜的是 Comate 接入了 Figma to Code****能实现 设计稿一键转码。
之前很多 case 是 html2design——把代码转成产品原型
现在反过来,直接能把设计好的产品原型一键转成代码
例如,我在 Figma 看到一个登录组件还挺好看,就可以如图复制链接

然后到 Comate,新增 Figma 的 MCP

回到对话界面,输入 /Figma to Code ,会自动打开下面的弹窗
第一次要获取授权码
然后把前面复制的链接放到 Figma 地址里

一顿操作后就给还原好了,做成了 html,可以直接在我显示里引用。

这样的效果远比给张图片 AI 去复现来的更直接可靠。
4️⃣ 在这一切的背后驱动的是多智能体协同与多模态交互
Comate AI IDE 的核心突破在于其“多模态”与“多智能体协同”两大能力,这使其超越了传统代码助手的范畴,成为一个能够理解复杂意图的“协同开发伙伴”。

多智能体协同是其实现复杂任务处理的关键。系统内置了核心编程智能体 Zulu,当接收到开发者用自然语言描述的复杂需求时,Zulu 能够自主思考、拆解任务,并协同 Planner(规划者)、Architect(架构师)、Actor(执行者)等专精智能体,形成一个“虚拟开发团队”。这个团队能够自动规划技术路径、生成代码、调用工具、修正错误,并实时展示其思考与执行过程。
这样,用户只需下达简单的指令,便可驱动整个团队完成从项目搭建到功能实现的全过程。
所以你看,Comate 的核心竞争力,其实是对“理解”二字的追求。无论是理解中文语境、理解你的点选意图,还是通过智能体团队去理解一个复杂的项目需求。
我们追求的,终究不是一个更聪明的代码补全工具。
想想看,若未来每个人身边都站着这样一位“懂中文、通全栈、有同理心”的伙伴,创意抵达现实还需要多久?
潮水已至,剩下的,只是你愿不愿意伸手,与它并肩。
以上,
既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧…