Z Highlights
生成式AGI已经颠覆了人们的生活,但AI工具并没有随着用户使用场景的融合而整合。各个赛道的头部玩家依靠独家的数据库发展模型,现有算力和数据量难以支撑多模态和跨业务领域拓展,急需形成用户粘性的市场竞争也使得AI的生成稳定性被优先考虑。
DeepAI认为,要想让AI“民主化”为实现使用者创意想法的工具,就必须形成普惠而一站式的多模态平台,打通语音、文本、视频、图像之间的转换壁垒,真正满足用户从idea到可视化编辑的一站式需求。
通过从数据量到推理效率的技术转型、更合理的分层订阅制度以及赋能生态的DePIN模式,DeepAI在生成式AI的红海中开辟了一条差异化路径。在a16z发布的Top 100 Gen AI Consumer Apps中,DeepAI 在最常用的AI工具里排名全球第 26位,而在通用人工智能助手领域,DeepAI是前五名中唯一一个十亿美元以下的公司,充分展现了其活力与潜力。
01 开端:在占山为王的AI领域挑战一站式服务
通用人工智能AGI的概念已经存在了很长时间,亚瑟·克拉克在《2001:太空漫游》中描绘的HAL 9000可能是人类对AGI的终极想象——飞船里的第六号船员,精通人类语音的识别、能欣赏艺术和全面接管飞船运行。如今,DeepAI的分布式Agent网络与生成工具正将克拉克的虚构转化为可触达的技术图景。
2023年消费级AGI产品爆发,推动生成式AI进入大众视野。OpenAI、Google DeepMind、Anthropic、文心一言等通用AI工具长于文本和代码生成,Leonardo.ai、OpenArt.ai等专攻图像与风格定制,Character.AI等聚焦聊天机器人赛道。
生成式AGI已经颠覆了人们的生活,但AI工具并没有随着用户使用场景的融合而整合。各个赛道的头部玩家依靠独家的数据库发展模型,现有算力和数据量难以支撑多模态和跨业务领域拓展,急需形成用户粘性的市场竞争也使得AI的生成稳定性比尝试多模态融合处于更高优先级。
2016年,Kevin Baragona在旧金山创立了DeepAI,一个多模态生成式AI工具平台,致力于实现“AI 民主化”,让每个用户的想法转化为高质量的创意作品。目前提供图像生成、视频创作、音乐创作、AI 聊天功能和开发者API等功能。
DeepAI认为,要想让AI真正“民主化”为实现使用者想法的工具,就必须形成普惠而一站式的多模态平台,打通语音、文本、视频、图像之间的转换壁垒,真正满足用户从idea到可视化编辑的一站式需求。
02 创新:普惠+生态=市场更喜欢的多样AI工具
在模态单一的痛点之外,DeepAI也观察到头部AI工具订阅机制不够普惠的问题,如ChatGPT在免费账号情况下,3至4小时内仅能与GPT-4o进行8次文本对话,如果在对话中插入附件则次数更少,这会使大量需要连续会话来修正生成文本或进行长篇创作的用户感到失望。
因此,在DeepAI的订阅机制中,即使是免费用户也能使用基础AI工具、进行基础文本生成、图像生成、API调用(有限次数)、背景消除、音乐生成与标准模式聊天。
DeepAI的另一大创新点是采用DePIN模式来鼓励更多AI创建者参与基础设施建设,平台上相当一部分AI Agent和聊天机器人是个人以去中心化的方式构建的,为任何人提供服务,并通过使用量为创建者匹配收益Token。
借助生态的力量,DeepAI计划创建一个具有强大功能API的开发平台为开发者提供更多样的AI工具,如客服机器人、数据分析Agent等。用户市场可以自发筛选不同AI工具,从而解决对研发方来讲用户需求难以预测,传统AI模型高成本、低复用率的问题。
03 设计:从AI生态建设和多模态开始,提供个性化工具,打通文本、图像、视频创作间的壁垒
首先,我们为什么会遇到铺垫知识背景,引导AI对某一领域回答的麻烦?
传统的LLM如GPT-4o、Claude、Gemini基于海量的训练数据得来,但用户在寻求一些专业性问题或者情感支持时通常需要有方向性的回答。如果在prompt中提示不够清楚,AI难以识别用户偏好,就会造成信息广而不深、领域偏差或态度笼统的问题。所以需要在prompt里指出希望思考和生成的方向,如“作为一名英式英语的母语者,帮我修改邮件的措辞”。
图片来源:deepai.org
但以DeepAI的AI Chat举例,虽然和其他LLM一样通过回应用户的prompt生成文本内容,但DeepAI的聊天界面预载了多种设定完成的“个性角色”,如“心理咨询师”、“语言学习伙伴”、“电影人物”等等。这些Bot是DePIN商业模式下大量创建者的“作品”,Bot的使用量和创作者的收益token成正比。
借助这些预设模式,用户不再需要精心构思和引导提问就能直接进入使用场景。同样是请求AI解释一道大学数学题目,ChatGPT和Claude需要用户铺垫大学数学的学习内容和知识范围,而DeepAI的“大学数学老师”却可以直接用模型中预设的知识库解决问题。
其次,为什么用几个单模态平台生成的结果效果没有那么好,虽然prompt一样,用不同工具分别生成的文本、图像、视频、音乐融合度却很低?
不同的生成式AI采用的模型各不相同,prompt中相同的表达可能会被不同模型进行不同解读,加之如Midjourney等图像生成AI为封闭平台、对专业性的要求较高,没有受过专业培训的用户难以达到预期的效果。
DeepAI在整合多模型的时候融入了自家的DeepCORE技术,它主要用于分析输入信息的特征和需求,因此,用户输入的prompt会在统一的理解后被redirect向不同生成器,这使DeepAI的生成作品既能够横跨多元模型,选取它们的不同优势,又能够被统一解读,不至于逻辑不和。
AI Chat
图片来源:deepai.org
DeepAI的AI Chat是一款多功能聊天工具,支持文本交互、知识问答、创意写作等,可以帮忙撰写邮件,辅助编程、还能构思小说情节和角色、作为学科的虚拟导师讲解知识点等。
使用指南:
1.预设模式AI
使用时,用户可以先点击AI Chat下方的标签,选择偏好的预设模式AI。
2.开始会话
在下方文本框输入问题,选择上拉栏中的模式(图中为Standard),就可以点击发送,开始会话。ZP在使用DeepAI时被一个设计巧思吸引,在问题输入界面点击“Inspire Me”,DeepAI会自动在文本框里生成有趣的问题,充分展示了一个创意感和灵动感。
3.聊天记录管理
所有会话都会被保存在侧边栏中,用户可以管理聊天记录,方便整理或删除。
4.模式选择
AI Chat 在模式上也有速度、实时性和订阅模式的差异:
•Standard:默认模式,兼顾回答的准确性和速度,适用于一般的聊天和文本生成需求。
•Turbo:响应速度更快,但稳定性稍有降低,适合希望快速得到答案,对稳定性要求不那么严苛的场景。
•Online:具备实时网页浏览功能,能借助网络信息来作答,让回答更贴合当下实际情况。
•Genius:属于高级功能,具有更强的推理能力和更高的回答准确性,不过是Pro(专业版)用户专享。
•Super Genius:拥有更高级的逻辑推理能力,同样仅限Pro 用户使用,可处理更复杂、需要深度思考的问题。
5.Voice Chat
除了文本交流,用户可以通过Voice Chat,点击 “Call” 按钮通过语音与 AI 进行对话 ,无需手动输入文字。DeepAI称这是“最先进的 AI 语音聊天模式”,在语音识别、语义理解以及语音合成方面具备较高的技术水准,能实现自然流畅的语音交互体验,方便用户以更便捷、更自然的方式获取信息、寻求帮助。
AI Image Generator
图片来源:deepai.org
AI Image Generator可以通过用户输入的文本描述生成对应景观、人物、风格的图片。DeepAI对生成的输出不要求版权,用户可以将生成的创意设计或插画直接用于商业用途。
使用指南:
1.文本描述
在对话框内输入文本描述,如“A beautiful sunset over a tropical beach with palm trees and clear blue water(一片有着棕榈树和清澈蓝色海水的热带海滩上的美丽日落)”,DeepAI就能快速生成对应元素的图像。在使用过程中,用户也可以借助AI Chat生成更综合生动的语言描述,然后输入图像生成器。
2.模式选择
•图片生成器提供了两类模式,从画质需求上来分,有“Standard”“HD”“Genius” 等模式;从生成速度来讲,有 “Speed(速度优先)” 或 “Quality(质量优先)”两种选择。
•免费模式下,生成器可以能根据输入的文本描述,如“一只猫骑着独角兽穿越太空”,相对快速完成图像生成任务。但是生成图像的质量并不细腻。猫的眼部细节,会出现位置偏差或怪异的形态,毛发纹理,也有点过度简化了,缺乏层次感与真实感,与Google ImageFX等工具生成的图像存在差距。
DeepAI Image与Google ImageFX生成的图片对比,图源lazyprogrammer
3.多样风格
DeepAI内置了多种图像风格,从写实照片到动漫插画,用户可以通过风格预览“View all +100 styles” 查看超 100 种风格,然后根据想要的效果选择对应的风格生成图片,避免风格不合适导致的反复调整。
4.图片编辑与多模态交互
生成图像后,DeepAI会自动弹出几个选项,用户可以:
•下载保存,使用输出的图像;
•选择图像编辑选项,跳转到DeepAI的图像编辑器进行进一步调整;
•将生成的图像输入AI Video模块,让图片素材转视频;
•点击“Share”选项和“Talk to image”,用AI Chat的服务与图像交互。
5.图像增强器
与DeepAI 的 AI 聊天功能相似,该图像生成器集成了一系列预设工具,用于优化图像效果。诸如超分辨率、图像上色、背景移除等功能,为用户处理常见图像任务提供了多种解决方案 。
•超分辨率:可锐化和清晰化图像,修复模糊或低质量的视觉效果。虽然不如Photoshop 的放大功能先进,但快速简便,能满足日常需求。
•上色器:能自动为老照片添加逼真的色彩。虽然效果达不到博物馆级,但对于免费(或低成本)工具而言,表现相当不错。
•背景去除器:操作简单有效,尽管精准度不如Canva,但至少可以免费使用。
AI Video Generator
图片来源:deepai.org
•与AI Image Generator类似,DeepAI视频生成器可以通过用户输入的文本描述生成对应景观、人物、风格的视频。值得一提的是,用户也可以通过直接导入图像来生成视频。使用过程与AI Image Generator类似,在此不做赘述。
•视频生成器的Genius Mode(生成更高质量和更长的视频)现在仅限Pro用户使用,付费用户每个月有五次免费使用该模式的机会,不过对于在Video Generator方面有特别需求的用户,DeepAI也提供了购买使用次数的方案,5美元购买30次视频生成机会,其中5次可以使用Genius Mode。
AI Music Generator
DeepAI的音乐生成器目前是免费开放使用的功能,尤其适合制作拟音、音效,为视频添加合适的背景音乐,满足影视制作、内容创作等多方面的音频需求,亦可以与其他功能搭配使用:
1.文本描述
在输入框内输入对音乐的描述,例如风格摇滚/古典、情感基调欢快/悲伤、节奏特点舒缓/急促等,随后点击 “Generate” 按钮,即可生成符合描述的音乐。在这一步中用户同样可以先借助AI Chat生成准确的音乐描述。
2.模态交互
用户可以通过文字转图像、图像转视频、文字转视频、文字转音乐等功能,将一个想法通过DeepAI的一站式服务生成不同作品。比如,用一段文字生成视频后,可以将同一段文字输入AI音乐生成器,要求AI为这段文字生成的视频配背景音乐。
04 技术:提升效率,而非依赖数据
传统的生成式AI依赖海量的高质量标注数据,本质上是一种建立在大模型和预训练基础上的运用海量数据所生成的“模拟器”。基于庞大数据和超高算力的“暴力美学”,是当前生成式人工智能的核心打法,也是以OpenAI为代表的一众企业的发展关键。
从GPT、GPT2再到GPT3,OpenAI将模型参数从1.17亿提升到15亿,然后爆炸式地提升到1750亿,以至于GPT3比以前同类型的语言模型参数量增加了十倍以上。简单来说,在同等条件下,喂的数据越多,人工智能就越强。
然而,数据获取成本高且面临隐私风险。同时,全球范围内,数据存量的增长速度远远低于数据集规模的增长速度。据人工智能研究机构epoch的研究预测,语言数据可能在2030~2040年耗尽,其中能训练出更优性能的高质量语言数据甚至可能在2026年耗尽。
面对这一难题,Deep AI的创始人Kevin Baragona在2024T-EDGE创新大会暨钛媒体财经年会上提出,未来AI行业的竞争本质上是“效率的竞争”,不能单纯依赖算力和数据量,而是要通过优化模型架构,提升推理效率。
他试图在DeepAI中解决当前大生成式AI发展中因数据稀缺而遇到的瓶颈,并在自己的X账户上解释这个技术:
翻译:“想象一个数学家坐在洞穴里证明有趣的定理。他不需要庞大的数据集来阅读。他不需要离开洞穴。这是理解如何在没有大量数据的情况下训练AI的一种方法:) ”
不过,Baragona近期表达了对AI超速发展的担忧。今年3月,Baragona与特斯拉首席执行官兼推特所有者Elon Musk以及苹果联合创始人Steve Wozniak等人签署了一封公开信,呼吁所有人工智能实验室暂停训练最先进的 AI 模型六个月。
“那是为了防范我们创造出比人类更聪明的人工智能所带来的风险,”他说,“这与我们之前谈到的隐私和跟踪类应用所带来的风险有点不同。在此期间,我认为我们的政府需要开始采取一些行动,以保护我们的权利,并防范人工智能对我们国家构成的未来威胁。”
05 团队:DeepAI创始人的商业智慧
DeepAI 团队由拥有丰富软件开发、产品管理及企业运营经验的创始人 Kevin Baragona 和 Peter Griggs 领衔,团队成员具备多元背景,致力于将先进 AI 技术转化为涵盖图像、文本、视频、音乐等多领域的实用工具与服务,秉持 “AI 民主化” 理念,推动 AI 技术广泛普及应用。
Kevin Baragona
DeepAI 的创始人之一 Kevin Baragona 曾于 Underdog Media 担任软件工程师一职,主要负责产品开发相关工作,涵盖内部工具以及数据库设计等关键领域。2015 年,Kevin Baragona 加入 Opus Logica, Inc.,专注于 Ruby on Rails 开发以及 NetSuite 开发。随后任职于 IJK Controls,负责为电影制作、航空航天和国防等行业的云台系统开发实时嵌入式软件,成功将技术应用拓展至多个专业领域。
自2017 年 1 月起,Kevin Baragona 全身心投入到 DeepAI 的创立与运营中。他在自己的LinkedIn主页上写道:"I'm creating pure magic.(我在创造真正的魔法。)"希望在将前沿的人工智能技术转化为人人可用的工具。
Peter Griggs
DeepAI 的联合创始人Peter Griggs 早期以独立网页开发者身份开启职业生涯,2013 年短暂担任 AutoVitals 的高级产品经理,2015 年至 2017 年 4 月,于 Opus Logica, Inc. 担任驻场企业家。
2017 年 3 月,他联合创立 DeepAI,并在随后的 5 年 5 个月中担任 CEO,引领公司在人工智能领域发展。后来他也在 Astra Nova School 兼职担任讲师并投身 Deepgram,从事全职产品工作。
06 竞争对手、未来机遇与融资:平台定位带来头部潜力
生成式AI的发展前景依然可观。据麦肯锡评估的跨 16 个业务职能的 63 个用例,生成式 AI 可能带来数万亿美元的价值。
DeepAI 的巨大潜力在于其DePIN模式的平台定位,越多优质 Agent 发行部署,越能吸引流量聚集,头部效应就越强大。随着合作网络社群的增加,DeepAI 将具备强大的网络效应,从而构建宽广的护城河。
我们可以用一些同赛道产品与DeepAI进行对比。
1.OpenAI:
•作为全球生成式AI的领导者,覆盖文本(ChatGPT)、图像(DALL·E)和代码生成,OpenAI明显的优势是技术领先、生态庞大(微软投资)、企业级客户资源丰富。
•因此,OpenAI的访问量(505M/月)远超DeepAI,但DeepAI在轻量化工具和开发者友好性上更具灵活性。一些对 ChatGPT 感到失望的个人用户和开发者会转向下游的 DeepAI。
2.Sleepless AI:
•主打AI 虚拟恋人聊天,在币安 Launchpool 吸引了数十亿美元资金,可见 Web3 市场流动性对 AI 项目的欢迎,目前已上线币安,FDV 市值 16 亿$。
•与之相比,DeepAI 定位平台而非应用,更具备可移植性,基于 DeepAI 平台能创作更多个性化 AI 角色,可兼容虚拟恋人,也可包括游戏、动漫、影视等各类角色。
3.Bittensor:
2021 年开始的老牌 AI 项目,目前在 AI+Web3 板块估值最高,FDV 市值130 亿$。通过区块链协议验证机器学习模型,和 DeepAI 一样是挖矿奖励机制,有 PolyChain 等顶级加密 VC 参与。
与之相比,DeepAI 主要验证筛选 Agent 大模型,比Bittensor主打的机器学习模型扩展性更强,应用场景更广。
4.Character.AI:
•除了和Web3 领域的 AI 项目比较,DeepAI 在 Web2 AI 产业链上也有同类产品。在个性化 AI 机器人聊天赛道中,除了估值过千亿美元的 OpenAI,还有 Character.AI 影响力最大,其最新一轮融资估值 50 亿$。
•DeepAI 比 Character.AI 更加基于社区驱动,而且经济模型更有优势。DeepAI 不仅为创作者增加收益,而且具备 Agent 价格发现、算力效率提升等独特价值。另外,通过 Token、NFT 等粉丝经济,相比 Character. AI 按月收费传统模式,DeepAI 的经济模型更能提升用户忠诚度。
07 融资
2019年3月,DeepAI完成了种子轮融资,具体融资情况尚无公开数据。根据Growjo估计,DeepAI目前的年收入约为84万美元。
未来,DeepAI将可能专注于技术架构创新、行业应用深化、分布式AI生态维护和Web3与去中心化基础设施建设。在减少数据依赖的同时占据多层次市场优势,让我们拭目以待。
Reference
deepai.org
https://www.perplexity.ai/search/sou-suo-he-liao-jie-deep-aizhe-W_z4MmZmSSy9rlBotpXczw
https://www.hellobtc.com/kp/du/03/5074.html
https://www.oracle.com/cn/artificial-intelligence/generative-ai/what-is-generative-ai/#gai-explained
https://blockchain.news/ai/deepai
https://x.com/deepai
https://x.com/kevinbaragona
https://www.bloomberg.com/news/videos/2023-04-03/generative-ai-too-disruptive-for-its-own-good-deepai-video
https://baragona.org/
https://www.linkedin.com/in/baragona/
https://www.linkedin.com/in/peter-griggs-46003046/
https://www.newsmax.com/newsmax-tv/kevin-baragona-artificial-intelligence-dangers/2023/06/01/id/1122060/
https://www.zoominfo.com/p/Peter-Griggs/1936771573
https://blockchain.news/ai/deepai
https://www.crunchbase.com/organization/deepai
https://vizologi.com/business-strategy-canvas/deepai-business-model-canvas/
https://growjo.com/company/DeepAI#what-is