来源:中国企业家杂志
往后假期,你也可以为自己开发一个专属AI导游。
文|《中国企业家》记者 闫俊文
编辑|张晓迪
图片来源|视觉中国
3月初,一款名为Manus的通用Agent产品火爆网络,测试阶段,需要的验证码一码难求。目前,Manus已经在国外上线了APP,订阅费根据档次,分别为每月39美元和199美元。这比大部分大模型产品的收费都要高,比如Jasper AI,每月费用是29美元和59美元,其企业端收费更高一些。
Manus创始人肖弘是一位90后,有消息说,字节跳动曾尝试收购Manus,但没有成行。今年4月,Manus背后的公司完成由Benchmark领投的7500万美元B轮融资,估值跃升至近5亿美元,此前,它的投资人还有腾讯、真格基金、红杉中国。
Agent,意即智能体,意味着AI能处理更复杂的问题,不仅能听、能读、能写,还能思考与决策,甚至能够与物理世界交互。
Agent时代正加速到来。2024年底,Anthropic发布并开源了MCP,(Model Context Protocol),MCP是一个开放协议,旨在标准化大型语言模型与外部数据源和工具的交互。它通过客户端-服务器架构,允许AI应用通过统一接口访问各种资源。今年4月,Google也发布了A2A(Agent to Agent),试图让AI智能体能够相互“通信”。
近期,明势创投创始合伙人黄明明在出席《中国企业家》2025商界木兰年会时表示,Agent对物理世界的理解、记忆推理以及工具的使用,会在未来1~2年取得巨大突破,目前还远远没有到大家停下来卷成本、卷差异化的地步。
目前,Manus的风暴仍在持续,就像它的母公司名字“蝴蝶效应”一样。该公司总部在武汉,但引发的创业潮却在杭州、北京、上海等多地涌动。这些创业者们坚信,Agent是比APP更大的机会,下一个微信、抖音、小红书的机会就藏在其中。
《中国企业家》记者在小红书找到一位Agent创业者成峰,他今年31岁,生活在杭州,他拥有一个典型的大厂职业路径,他先是在互联网中厂、大厂从事产品和运营工作,后来跳到创业公司,最终选择创业。
成峰始终觉得公司制的考核体系不能满足自己对产品的想象,前者意味着用户规模、ROI考核。最终他在2023年底,全职投入了Agent创业。
目前,成峰在小红书、B站以及公众号上以“AI产品自由”的账号公开自己创作Agent的过程,就像一份教程——教别人怎么搭建Agent。他的全网粉丝超过5000人,同时也有足够的广告收入养活自己,但他的最终目标还是做Agent产品创业。这期间,他搭建过很多有趣的Agent:
一个是,给自己的妈妈搭建了一个“出行地图”Agent。他将妈妈出行常用的起点和终点固定成模块,设计成一个图标放在手机屏幕上,一点击,就能自动跳跃到高德地图,自动打车以及导航到上车地点,而不是需要长辈手动搜索。
另一个是,能让游客省去数百元钱的AI导游。他利用高德地图和MiniMax的MCP做了一个浙江省博物馆的AI导游,让用户可以听AI对文物的讲解。
还有一个是,他搭建了一款小红书笔记Agent,这是一款接入了纳米AI的小红书爆款笔记工具。目前,小红书没有开放数据端口,但这款Agent像人一样,搜索,浏览与抓取小红书上的旅游内容,最后生成AI旅游攻略。
这些Agent的搭建往往需要数小时到几天不等,相较于APP开发数月的周期,大幅缩短了开发时间,并且搭建使用的语言不是代码而是自然语言。
一个人人皆可设计产品的时代正在到来。
以下是成峰的讲述(有删减):
给妈妈做一个高德MCP
我开发MCP的需求,还是从个人出发,因为都是自己经历的场景,所以就尝试使用AI去解决问题。
今年“五一”期间,我用了一晚上,做了一个“高德地图长辈版”的应用,方便长辈们出行打车。
我的老家在温州,家中长辈需要在温州和杭州之间往返,他们可能会有一些交通问题,有时候还带着孩子,打车就比较困难,比如用滴滴打车或者高德地图,他们需要去找收藏,得找半天,因为这些应用的收藏按钮很小,有时候根本找不到。
后来,我就想把它做成一个网页按钮,放在手机屏幕上,家里人一点击,就可以直接调用出发和目的地,打开高德地图,直接打车。
“妈妈出行地图”Agent的工作流 来源:受访者其实,对于大部分人来说,怎样去沟通一件事情,怎样去表达,他其实没有概念。我们跟大模型一样,需要通过不断对话,去校准经验,然后达到一个结果。但是搜索(移动互联网产品)本身没有这样的功能,全靠用户第一次输入的准确性。
在“五一”前一周,我还做了故宫和浙江省博物馆AI导游。这源于我去西藏旅游的经历,导游只管自己跑,基本不会给游客讲解,我的体验比较差。我就用MiniMax的MCP加上Cursor(AI代码编辑器,功能是输入需求表达,自动生成代码)做了这款产品。
我用最简单的产品工具去开发,用自然语言表达,不到一周时间就做出来了。
其实,AI导游这一块还有一些缺失,因为信息没那么健全,如果博物馆开放数据,做出的产品体验会更好一点。
有些旅游达人,他坚决不用智能体,全靠自己做攻略。我觉得用户和用户之间是不一样的,有A用户有B用户,使用习惯是不一样的。
旅游达人担心“刷好评”以及不真实,其实还是抓数据源的问题,他能不能让AI抓到差评的数据源。比如,大众点评和小红书比较难去抓,其实还是AI能力的问题,能力健全以后,AI能够自己去抓那些评论,然后把评论汇总给用户看的话,它能够解决蛮多问题的。
这也是当前Agent存在的问题,就是产品之间的墙,我想去抓它的数据,但抓不到。现在只能说,这一块的业务没办法做。如果MCP未来的收益足够大,肯定会有第三方或者第四方推动这个问题的解决。
我跟某大厂的内部朋友聊过,如果依赖自己去做这件事情,内部阻力还蛮大的,因为他们没有人敢去下赌注,那些高层领导可能对AI并没有那么了解,他们也不愿意脚踏实地地去用一用。
Manus的忠实用户
我在2023年开始接触AI编程,那时候GPT-4出来了,我自己写一些小工具,到了2024年底,开始做一些小程序,到了今年,出现了MCP这个概念,加上Manus产品,我看到了肖弘,我觉得Agent是一个比APP更大的市场。
我试用过Manus,的确很流畅,比如你给他一个任务,首先,它会分析你的意图是什么,然后,它就会有一个任务规划,它会给你一个执行表,它每做完一项就去勾一下,最后,它会用比较好的框架去展示结果。
来源:视觉中国我对肖弘团队印象比较深的是这句话:“AI Should use browser,not in browser,The browser should be in cloud.(AI需要用浏览器,但不是在浏览器里面用,它应该在云端用)。”
就像我们现在玩手机,其实都在用我们的眼睛。视觉层面的时间已经给占用很多了,在视觉背后,还有很多空间可以去挖掘,比如,我们以前在看抖音时,背后其实可以有很多智能体帮我们去完成任务,它的背后可以是无限的时间。
目前,杭州的MCP开发者是有一个圈层,但比较小,人数规模还比不上扣子(字节跳动的AI Bot开发平台,于2024年2月上线)的开发者,原因在于它能够商业化,比如一些企业已经可以用扣子做一些生成图片、写文章的任务。
扣子排行榜前几个Agent还挺有意思的,比如抓取一些小红书的数据,抓飞书的一些数据,对于一些企业很有用。
目前,MCP或者部分智能体尚未形成成熟的商业化模式,其实,对Agent来说,MCP只是其中的一个点,它也不一定能做起来,但目前来看,它属于其中一个台阶,未来可能会有比MCP更好的产品,但就目前来说,我个人觉得MCP是里面做得最好的。
我未来会以智能体为职业方向,现在商业化还不成熟,是因为生态不成熟,智能体的方向不会变,但可能智能体的形式会变。
未来,对纯智能体的话,它可能还会面临几个挑战,第一个就是算力,如果像Manus那样,它需要一个非常大的虚拟机,其实核心还是算力以及算力的成本。第二,就是大模型本身的突破,我本身不会去看到底哪个大模型做了什么功能,我始终去抓最好的大模型调用。
我现在社交媒体做了几个账号,全网粉丝超过了5000人,但我还是希望能做一个产品。
社交媒体是一个收集用户反馈的渠道,在此之前开发产品,去做用户访谈成本会比较高。此外,我们也可以做成一个账号,可以用其他方式来盈利,这样,当你未来有一个新的产品,你相当于有一个宣发平台,能给你做冷启动。
新闻热线&投稿邮箱:tougao@iceo.com.cn
特别声明:以上内容仅代表作者本人的观点或立场,不代表Hehson财经头条的观点或立场。如因作品内容、版权或其他问题需要与Hehson财经头条联系的,请于上述内容发布后的30天内进行。