“你的Agent,我一周末就能做出来!” AI时代的护城河:Cursor 卷每日迭代速度,DeepSeek 用技术撕大厂规模优势
创始人
2025-10-06 10:44:59
0

编译 | 核子可乐、Tina

在今天的 AI 创业圈,你很难找到一个比“护城河”更常被提起,也更令人焦虑的词。

一方面,共识正在形成:新的 AI 应用似乎毫无壁垒。一个开发者团队在一个周末的黑客松里就能拼凑出一个功能相似的 Demo 或一个 AI 智能体,这让人不禁怀疑——在看似谁都能复制的领域,护城河究竟在哪里?

但另一方面,这个概念的普及恰恰说明了它的极端重要性。事实上,在 AI 浪潮之前,初创企业创始人远未像现在这样频繁地讨论护城河。其核心直指一个生存命题:到底是什么,能阻止你陷入无限竞争、利润归零的绝境?

护城河的本质是一种防御机制。想象一下,你好不容易建起一家公司,城外的竞争者却像“野蛮人”一样兵临城下,虎视眈眈。你唯一能依靠的,便是那条围绕在城堡外的护城河。

这也是为什么 YC 最近在一档播客中,专门讨论了“人工智能初创企业最强大的护城河”,他们认为这已是许多聪明头脑犹豫创业的关键。在奖学金面试中,顶尖的学生们一针见血地提问:他们看不出那些新兴的 AI Agent 公司有何护城河。在他们看来,这些产品无异于“ChatGPT 套壳应用”,极易被复制。没错,你或许能凭借一个巧妙的点子,迅速搭建出有收入的业务。但问题在于:然后呢?你如何把它从一个随时可能被取代的生意,锻造成一家长期可持续的公司?

这个问题,是所有 AI 创业者必须面对的。YC 还特别提到了两个典型例子:Cursor 靠着“一日一迭代”的极限速度,在巨头还在审批时,就能把功能推向用户,把“速度”本身变成护城河;而 DeepSeek 则通过在强化学习阶段大幅降本,动摇大厂的规模经济,让“规模优势 = 护城河”的逻辑开始动摇。

以下是 YC 播客的完整翻译整理。

1AI 时代的护城河

问:“护城河”的概念在今天已经无处不在,也极其重要。有趣的是,在 AI 出现之前,初创企业创始人并没有像现在这样频繁地讨论护城河。为什么在 AI 时代,“护城河”这个概念在创业者群体中愈发受到重视?

YC:确实,如今的创业者对于护城河的讨论热度远超 AI 兴起之前,这是个有趣的趋势。一部分原因当然是 ChatGPT 这类产品极易照搬,促使创始人必须思考如何建立更加持久的商业模式,而非仅追求短期收益。

问:那护城河的本质是什么?创始人又该从哪里入手考虑这个问题?

YC:护城河的本质就是一种防御性策略,前提是必须有可守之物才有必要——如果没有需要守护的对象,又何必费心构建护城河?创始人切忌过早纠结护城河,首要任务是找到真实存在的痛点,真正解决用户需求。护城河应该在与客户的交互和产品迭代过程中逐步形成。如果因为无法预见长期护城河而放弃创业构想,那实在不太明智。

问:所谓“七大力量框架”是什么,它在当代又有何意义?

YC:七大力量框架源自汉密尔顿·赫尔默 2016 年的著作《七大力量:商业战略的基石》。虽然其中列举的案例来自早期互联网企业(如甲骨文、Facebook 和 Netflix),但这套框架本身的价值从未过时。它概括了企业可以构建的七类护城河,因此哪怕在 AI 智能体领域仍然具有现实意义。

问:那从这套框架的角度来看,初创企业最重要的“护城河”是什么?

YC:初创企业最重要的护城河是速度。正如温莎资本的瓦伦所言,初创企业起步阶段唯一的优势就是速度。

像 Cursor 这样的厂商正是凭借不懈的执行力而获胜——他们每天都在推出新功能,而谷歌或 Anthropic 这类行业巨头则因为流程复杂而根本无法与之匹敌。

问:在 AI 时代,要如何让“流程之力”成为护城河?

YC:流程之力代表着构建起高度复杂的业务体系,借此提高复制的门槛。在 AI 领域,这体现为打造经过多年打磨、能在真实环境中高效运作的精密 AI 智能体。典型案例包括 Case Text 文本分析系统、Greenlight 身份认证系统以及 Casca 贷款申请系统。这些系统属于关键基础设施,要复制其功能需要深厚的工程技术实力与对极端案例的处理能力,可以想见其中的难度。

问:那咱们再来聊聊“垄断资源”,初创企业要如何利用这份资源?

YC:垄断资源是指无法套利且具有独立价值的珍贵资产,典型案例包括药品专利。对初创企业而言,关键形式是通过驻场客户现场获取真实数据和工作流程——扮演“前沿部署工程师”的角色。Character AI 等公司通过微调大语言模型将服务成本降低 10 倍,从而创造出垄断资源。最优质的垄断资源往往是企业自主研发的专用模型。

问:AI 企业要如何通过“转换成本”来构筑护城河?

YC:如果转换成本过高或者转换过程过于艰难,使得客户不愿费力操作时,转换成本就能构成护城河。在 AI 领域,这体现在漫长的系统接入周期以及针对企业特定工作流的深度定制化(如 Happy Robot 与 DHL 的合作,Salient 与银行客户的合作等)等层面。一旦集成完毕,考虑到团队再培训和数据迁移成本等复杂因素,企业一般不会再更换供应商。当然,AI 可以通过代码生成等工具从陈旧系统中提取数据以降低转换成本。

问:那什么是“反向定位”,AI 初创企业又该如何运用这种策略?

问:能不能解释一下 AI 领域的“网络效应”是何形态?

YC:网络效应是指产品价值随用户增长而提升的特性。在 AI 领域这主要体现为数据网络效应:用户数据越多,定制模型就越精准,产品性能越强,进而吸引到更多用户。

典型案例包括:Cursor 利用键盘输入与鼠标点击数据训练自动补全功能;OpenAI 等基础实验室将聊天记录注入未来模型(如 GPT-6)的训练过程等。

问:规模经济在 AI 领域扮演什么角色?

YC:规模经济是指通过巨额投资构建大型基础设施,从而降低服务交付成本的作法。规模经济在应用层相对少见,但 Exa 通过网络抓虫实现 AI 搜索的业务仍是典型案例——其前期投入巨资构建爬虫系统,而后实现多客户复用。在模型层面,训练前沿大语言模型需要巨额资本投入,也可以认为大型实验室是具备了规模优势。

问:聊了这么久护城河,能不能给各位创始人提点总结性建议?

YC:创始人最该关注的是某个特定人群的痛点并加以解决——也就是实现从零到一的突破。不必纠结于预测五年后哪个点子能建立起最强的护城河,护城河会在构建过程中自然形成。如果没有值得守护的对象,自然也就不需要什么护城河了。

2“前置工程师”模式,才是大多数初创企业的护城河

问:那假设有人发现自己的业务确实值得守护,能不能讨论一下要怎么构思护城河?

YC:当然。所谓“流程之力”的说法有点怪,其实本质上就是指构建起某种难以复制的复杂商业体系——就是打造出太多核心要素,让他人难以复制。书里举的例子就是丰田的流水线。而 AI 版本——或者说智能体版本——就是经过多年精细高校、能够在真实环境下高效运作的复杂智能体。我们播客里讨论过不少案例,比如 Jake Heler 的 Case Text 就是经典范例。最近还有几家新公司值得关注:有几家企业专门向银行出售智能体解决方案,比如 Greenlight 就在为银行提供 KYC(了解客户)服务;还有 Casca,为银行处理贷款申请业务,也就是帮助银行了解哪些贷款可以发放。

这些案例很有意思,因为这类 AI 智能体的构建难度并不大,周末一场黑客松活动就能搞定。很多大学生在构思 AI 智能体时,想到的往往就是这些黑客松级别的产品。他们会觉得“这种东西一个礼拜就能做出来,怎么可能有竞争力?”说得没错,黑客松上搞出来的东西根本毫无实用价值。

比如像 Casca 和 Greenlight 这类系统一旦发生故障,银行就会损失几百万美元。这属于关键基础设施的范畴,本质上更接近自动驾驶汽车。更深层的工程价值其实是流程之力的终极体现。以 Plaid 为例,他们需要为极其广泛的金融机构提供支持——可能涉及数千上万的不同网站、爬虫程序,乃至各种各样的系统……你能想象 Plaid 会使用怎样的 CI/CD 架构吗?虽然这纯属推测,但如果我是 Plaid 的运营负责人,就必然会采用最新的代码生成工具,确保比任何竞争对手都更快地接入全球金融机构。这也是现代 AI 时代下流程之力的终极体现。

我想这大概也是当前 SaaS 厂商最重要的防御性优势。纵观上一代 AI 智能体厂商,为什么 Stripe、Rippling 或者 Gusto 能够保持竞争地位?最核心的原因,就是他们构建起大量软件系统,其成本高昂且难以复制——毕竟直接从他们的官网页面上复制代码没有意义,他们极其复杂的后端逻辑才是重点。

另外,我认为还存在某种“盲点效应”——没错,任何依托 AI 的黑客松版本都能快速实现,但要让系统稳定处理每天数万笔 KYC 请求,那最后这 10% 的完善工作本质上就是最枯燥乏味的苦差事,多数工程师对此也缺乏热情。OpenAI 团队同样会面临这种困境。试想在大模型实验室里,团队正致力于通用人工智能的研发,那强迫他们拿出精力和时间处理 KYC 工具这最后 5% 的一致性优化确实不太现实。我认为这在 KYC 这类垂直领域体现得尤其明显。

这类领域需要一定的专业知识才能理解极端案例,比如从七大核心力量中做选择。而在我看来,速度和执行力可能是其中最常被提及的两大主导因素,而执行力则是硬核创造者最终胜出的关键所在。卓越的产品品味和打造顶尖产品的能力至关重要。

我认为其中涉及一个关键误区——许多产品或许能用 20% 的精力实现 80% 的功能效果,但要让这些方案真正落地,必须投入 99% 的精力以确保 100% 的准确性,而这对应着十倍甚至百倍的付出。这类似于帕累托原则。

问:那其他“力量”类别又该如何理解,比如垄断资源?

YC:传统观点认为垄断资源只是那种比较稀缺的资产,或者说无法进行套利的标的。垄断资源必须具备独立价值,有时还能提供优先获取权,比如以远低于市场的利率获取资金。经典案例就是制药企业持有的专利——这些专利往往极难获取,需要经历自主研发、多轮验证并通过监管审批。专利本身国中 FDA 认证的双重保障,构成了极具持久性的护城河。也正因为如此强大,专利才被设定为有限周期——毕竟没人希望垄断权永世长存。更现代的监管领域案例,比如 Scale AI 正与国防部开展大量合作,Palantir 也是如此。光是进入这一领域就需要经历艰苦卓绝的过程:必须招募顶尖人才、频繁往来于政府部门之间进行业务洽谈,还需要耗费巨大精力和成本建立类似专用数据中心的研发实验室。

虽然困难重重,可一旦成功,那回报就滚滚而来了。某种意义上,真正的垄断资源也可以说是政府工作人员的认可——任何从事 AI 业务的厂商都必须通过官方渠道或层层审批,这些流程甚至被明确写入政府公开文件当中、纳入未来一切 AI 相关行动的规划。总而言之,垄断资源的形式多种多样,可以是创作者的奇思妙想,也可以是客户群体的关键痛点。

但除了这些如幻似梦的一夜造富神话之外,大多数初创企业应该关注的其实是所谓“前置工程师”模式。

如今许多成功的初创企业都是这样运作:他们主动获取真实数据与工作流程等垄断资源,深入那些难以触达的优质软件与客户现场,确保实时捕捉需求。这在本质上是对流程进行定制优化,如先通过邮件接收请求,再对数据进行增强处理,有时还须呼叫中心向客户去电——通过这些看似枯燥的流程,才能逐步积累起专属提示词、评估标准并最终形成可用于模型微调的自有数据集。这些环节都具有极高的价值。

当然,行业内也不乏特例,如之前提到的 Character AI——他们不仅参与构建了首批大语言模型,更通过微调技术将模型部署成本降低至十分之一。这种模式本身就是一种资源垄断策略。最理想的垄断资源就是能够完成特定任务的自有模型。没错,这样效果更好。

很长一段时间,人们认为这是该领域唯一的生存模式——若没有自有模型,业务早晚要完蛋。但事实证明并非如此,自有模型只是众多可行的商业模式之一。从宏观角度来看,人们确实会担忧如果某天研发实验室把模型转为垄断资源并限制外部访问,那自己辛苦建立的商业体系将瞬间瘫痪。但从具体案例着眼,我们又发现 AI 革命尚处于萌芽期,虽然 ChatGPT 这种顶尖表现离不开大量预训练、后训练和海量数据支撑的 RLHF,但有时候仅靠上下文工程就能实现 80% 到 90% 的功能突破,且足以支撑起理想中的业务形态。

要知道,Cursor 最早也没有直接对 GPT-5 进行全参数微调(但他们现在应该已经具备这种能力了)。他们当初也只是在打造用户真正需要的产品。如我们之前所说:别让这些条条框框过早限制了你的可能性,Cursor 就是个很好的参考。

问:接下来要讨论的第三种力量是转换成本。就是说想办法让客户转换至其他解决方案的成本变得极其高昂,这样企业就能形成护城河。这样即使替代方案略胜一筹,从财务角度、运营时间和投入的精力来看,整个转换过程也都将极其痛苦,确保客户不想放弃已经在现有解决方案中投入的大量资源。那能不能聊聊 AI 公司要如何构建这样的护城河?

YC:我觉得 AI 公司构建护城河的方式,跟所谓“前置部署工程师”的理念密切相关。我们以 Happy Robot 和 Salient 为例:他们以高度定制化的企业专属工作流为切入点,主要服务大型企业客户。其中的关键环节正是“前置部署工程师”模式——整个试点周期可能长达半年甚至一年,但成功后往往能转化为七位数的大额合同。而试点周期之所以漫长,是因为其本质是在为企业的特定运营流程提供定制化软件。以 Happy Robot 为例,客户 DHL 要求深度集成完整的物流工作流,完全契合 DHL 的运营体系;而 Salient 为金融业打造的 AI 语音智能体则需要对接银行系统——即贷款整合、债务追收、欺诈监控、风险合规等环节上差异巨大的多种工作流程与内部专属工具。

作为 AI 厂商,他们的价值就是为这些流程打造定制化解决方案,用最终收获的巨额合同弥补漫长的试点周期。一旦中标,大型企业在很长一段时间内都不会重复招标,进而为初创公司提供稳定的收益来源。这就是 AI 厂商的制胜之道。我认为这既是护城河的体现,在 AI 时代下又颇具深意——可以大幅降低转换成本,帮助初创公司顺利杀入重围。若能运用代码生成技术从陈旧的遗留系统或竞争对手处提取数据,那么某些原本依赖转换成本建立的壁垒将自然消解。

另外,转换成本也可以分成两种形态:源自 SaaS 时代的传统模式,如 Salesforce 这类记录系统;还有 Lever、Ashb 等招聘系统,其转换成本更多来自痛苦的数据迁移过程。

我很认同这样一个观点:大语言模型能够自动将旧有数据结构转换成新模式,因此可以显著降低转换成本。用户可以通过浏览器自动化工具解决两端数据导出受限的问题。

3老牌 SaaS vs AI 原生:反向定位的力量

问:那如何理解书中提到的另一道护城河——反向定位策略呢?

YC:所谓反向定位,是指采取竞争对手难以效仿的策略——主要是因为盲目效仿会蚕食后者的现有业务。

这种策略主要体现在两个方面:在各领域,传统 SaaS 厂商自主开发的 AI 智能体与新兴 AI 原生公司基于现有 SaaS 平台打造的 AI 智能体之间,正上演着达尔文式的生态竞争。以客户支持为例:Zendesk、Intercom 和 Front 等传统 SaaS 企业都在开发自有 AI 智能体;而近年来涌现的新兴公司则专注于构建能与这些老牌系统对接的 AI 智能体。在这种相似生态位的正面对抗中到底谁能胜出,实在是耐人寻味。

而二者最核心的区别之一,就是传统厂商几乎仍然按照座席数量收费——即收取员工的“人头费”。我认为这在战略上将是他们的致命软肋——如果 AI 智能体表现出色且切实有效,企业客户必然减少相关岗位的雇员需求,将相关工作交给 AI 智能体接手。就是说他们的产品越成果,反而会削减自身收入。当然,一部分公司应该能够化解危机,特别是那些创始人仍拥有强势话语权的厂商。以 Intercom 为例,这类由创始人主导的公司仍然清醒,能够意识到这场关乎存亡的危机,因此有可能主动进行自我颠覆。

至于那些由非创始人掌控的企业,我的态度就比较悲观——自我蚕食收入实在太难。我们还见证着另一种趋势,即大量初创公司的定价模式围绕着“交付工作量”或者“完成的任务量”展开。这种模式迫使产品在设计阶段始终关注完成工作的能力。我在上届 YC 结业时曾反复强调:希望每位创始人都能设法去老牌公司实习一个月,切实感受他们的遗留痛点——难以重塑内部工程文化以拥抱 AI 工具、推动上下文工程和提示词工程实践。如果团队无法真正实现 AI 原生化,那么就根本无法交付行之有效的产品。而这一切的根源,就在于老牌企业不愿放弃自己的座席定价模式——而在 AI 时代,售出的许可证数量将必然减少。

很明显,老牌厂商不擅长为这类新型工程设计流程。以 YC 孵化初创公司 Avoca 为例,他们开发的客户支持软件类似于 Service Titan,但专攻暖通空调行业。具体来讲,就是为暖气和空调维修人员提供服务。在暖通空调企业中的总交易额还只占 1%,比例很小。毕竟这类企业本身的利润不高,没办法在软件上投入太多资金。但 Avoca 发现了一个惊人的秘密:虽然他们最初是以软件供应商的身份杀入市场,但随着时间失衡,他们实际占据了越来越大的客户支出份额——通过让暖通空调服务商针对客户支持环节的实际效果付费,这部分支出占比正从 1% 跃升至 4%、再到 10%。这类新型 AI 初创企业不仅增长更快,在现有预算池中的比例也更高。

实际上,我们可能都低估了垂域 SaaS 型 AI 公司的真正实力——他们的占比绝非 1%,而很有可能一路增长至 10%。这也是我们的主要结论所在:垂域 AI SaaS 智能体的规模至少会达到 SaaS 的十倍,而且它所挖掘的其实是企业支出中截然不同的另一部分——并不是传统软件预算,而是全新的领域,把过往只能由人力解决的部分交给 AI。

YC:肯定呀,创造性的知识工作肯定比机械执行脚本、照本宣科要有趣得多。

问:你提到关于劳动力替代还有第二种产业对位形式,能不能具体讲一讲?

YC:AI 领域发展如此迅猛,在每个垂直领域几乎都会涌现一家所谓先行者厂商。但至少在 YC 的观察中,我们发现后来者反而更具优势。比如 Stripe 是在 Braintree 和 Authorize.net 之后才进入市场,DoorDash 在外卖领域也只是 Grubhug 和 Postmates 的晚辈,但最终还是凭借更优质的产品刻了胜利。

因此值得思考的是:当我们进入一个看似竞争激烈、已经有早期赢家占据主导的垂直领域时,该如何制定反制策略?又该如何与原有厂商形成差异化定位?我认为 Legora 跟 Harvey 的对比就很有启发。二者同属法务 AI 领域,Harvey 虽然具有先发优势,但 Legora 也制定了自己的差异化策略:Harvey 过度聚焦于产品微调与差异化,而这并非明智之举。

YC:Duolingo 是目前最具知名度的语言学习应用,在全球范围内都有很高的知名度。针对它的批评在于——它本质上更像游戏应用,而非语言学习工具,运作方式也跟真实语言学习背道而驰。而 Speak 则运用大语言模型,通过语音交互帮助用户实践并真正掌握语言。这种差异化的定位策略成效显著,对吧?Speak 用户呈现出爆发式增长,它并未试图通过大量的游戏化元素、积分系统和娱乐机制与 Duolingo 竞争,而是专注于打造“若想通过口头交流学习语言,这里就是最佳选择”这一独特定位。

4品牌效应:ChatGPT 如何压过谷歌

问:你提到差异化定位与品牌建设存在交集。那能不能聊聊品牌在 AI 领域的护城河作用?

YC:我认为反向定位模式与品牌模式理念高度契合。书中提到品牌的本质也是一种护城河——当企业知名度足够高时,即使存在同等产品,消费者仍会因品牌效应选择你。虽然我们很难像书中提到的那样在 AI 领域打造出“可口可乐”,初创企业更是几乎没有可能(毕竟品牌需要时间积累),但这种效应确实存在且显而易见。

让我震惊的是,OpenAI 的 ChatGPT 日活用户仍远超谷歌 Gemini。其实每位了解模型并经常使用的朋友肯定都能感觉到,Gemini Pro 2.5 和 Flash 2.5 完全不逊于 ChatGPT 的旗舰版本,更何况谷歌本就拥有全球用户基础,而 OpenAI 完全是从零做起。然而,在谷歌这个全球最大消费品牌之下,OpenAI 却仍然成功打造出了现象级的消费 AI 应用品牌,迫使谷歌陷入追赶态势。

如果有人在 2022 年预言这样的局面,我肯定是不相信的。这恰恰是反向定位的完美范例。重申一次,谷歌的商业模式要求其持续支撑自家广告业务,同时运营庞大的组织结构。既然如此,为什么要冒着巨大风险改变这一切?谷歌虽然一直号称要“整理全球信息”,但 ChatGPT 的起源才真正体现了初创企业追求速度的本质。

仅凭几名工程师组成的精干团队,在短短数月间就完成了产品交付。这里要特别强调,OpenAI 的创始团队中有不少成员都来自谷歌 DeepMind,而搜索巨头白白浪费了自己的积累和资源优势。只能说,谷歌的环境培育不出社会真正需要的高速创新能力。这里再次体现出一个颠扑不破的原则:速度决定一切。

问:Diana,能不能解释一下书中描述的网络经济效应,要如何作用于如今的 AI 领域?

YC:没问题。书中对网络效应做出的定义是:随着更多用户或顾客获取并使用产品,其价值也将随之提升,而用户数量的增长反过来又让每个人获得更多价值。书中以 Facebook 举例——我们身边的好友使用得越多,我们自己的体验也会更有趣;而随着用户增加,社交网络的价值就越高。这正是互联网时代人们执的网络效应形成机制。另一个典型案例是 Visa 支付网络——商户接入越多,消费者获得的价值越高,因为 Visa 卡可以在更多场所刷卡消费。这种模式形成了护城河,因为要积累如此庞大的用户及商户规模来赢取市场竞争会变得极其困难。这种模式天然具有强大的防御效果。

而在当前 AI 时代,网络效应又呈现出新的形态——它实质上转化为数据形态。我认为许多 AI 厂商获取的海量数据构成了核心壁垒:数据量越大,定制化模型就越完善;模型越完善,用户体验就越出色。此类案例比比皆是。比如说大型基础实验室,他们可能使用到部分用户数据(虽然我也不确定具体来源),而且肯定会将训练成果回馈给系统。就是说从 ChatGPT 1 到 5 的所有对话历史都会被输入至 GPT-6,以此类推以持续推动新模型版本的诞生。Cursor 也是一样,他们之所以能拿出最出色的点击式自动补全功能,是因为 Cursor 在免费版注册时就明确告知用户会使用其数据进行训练。随着用户增加,几乎每一次鼠标点击和键盘敲击都会被记录下来。这些数据会输入模型进行训练,因此使用 Cursor 的开发者越多,其产品就越完善,进而帮助其实现多重收益。

这种模式在 AI 初创企业中尤其适用。我之前提到的 Salient 和 Happy Robot 也是如此,当企业员工使用其产品时,积累下的大量私有数据能够显著优化工作流程。而他们通过评估机制建立起网络效应,进而成为 AI 初创企业的成功关键,即将数据反哺系统以进行迭代优化,进而提升上下文工程能力。这种飞轮效应会随着产品应用规模的扩大自主运转,而且在消费级市场和 AI 垂域 SaaS 智能体中同样成立。

5模型层的资本壁垒

问:Jaffrey,能不能给我们讲讲规模经济在 AI 领域的运作机制?

YC:规模经济是指投入巨资构建庞大体系后获得的成本优势,借此以低于竞争对手的价格提供服务。经典安全包括 UPS、联邦快递还有亚马逊配送网络——这些企业建立起庞大的实体基础设施,因此相较小体量竞争对手能实现更低的单位成本。而在 AI 领域,这种效应并未在应用层得到充分显现,真正发挥作用的其实是模型层——训练前沿大语言模型需要巨额资本投入,只有少数公司能够承担得起。而一旦完成训练,则能以极低成本让用户在模型上进行推理。

这就是 DeepSeek 年初发布时震惊全世界的原因所在——他们似乎能以远低于预期的成本训练出前沿大模型,大大削弱了人们认为只有 AI 实验室能够掌握规模经济优势的认知前提。DeepSeek 的核心贡献,在于破解并公开了模型中强化学习的实现原理,颠覆了长期以来媒体报道的误解。

还有另一个常被谈起的问题:基座模型厂商如何在竞争中建立防御优势?当前市场上存在的显著规模经济效应,导致新进入者几乎难以突破,这无疑是种有效的防御途径。

问:我们之前讨论过初创企业该如何应对这种困境,虽然成功案例不多,但也有一些值得参考。其中一个就是你创办的 Exa 公司,能介绍一下 Exa 的业务吗?

YC:Exa 本质上是为 AI 智能体提供搜索服务,为需要网络搜索功能的 AI 应用开发者提供 API 接口。我认为 Exa 的商业模式可以总结成:要提供这项服务,必须抓取大量网页——虽然不像谷歌那样需要覆盖整个网络,但规模仍然相当可观。这需要巨额的固定资本投入,但一旦完成对网页的大规模抓取,就能为众多客户提供可复用的服务。Exa 的独特之处,在于其投资布局与模型厂商是平行的——在智能体技术尚未普及时就已经开始布局,因此成为市场的先行者。事实上,Exa 的相关研发甚至早于 GPT-3 的发布。这种早期投资策略,恰似模型厂商当年押注 transformer 模型与 scaling law 的冒险精神。而最近一批 YC 孵化企业中就有两家——Channel 3 和 Orange Slice 也在复制这种模式:先在自有服务器上抓取海量静态网页来构建基础数据集,再让智能体在这些数据上运行。随着智能体性能的提升,这类模式必将愈发普及。

问:关于护城河问题,能不能给各位有志创业的朋友提点总结性的建议?

YC:大家首先需要关注的,是书里没有提到的第一道护城河——速度。比如当你纠结“我们能否掌握垄断资源”时,其实思考方向就已经错了。别从这点入手,更重要的是“我是否锁定了某个具有明确痛点的用户群体?”

这种痛点必须足够强烈,绝不是「要是能解决就好了」,而是 「如果今年解决不了,不单升不了职、说不定要被开除」那种。

这才是真正关键的痛点——可能关乎生存危机(比如 企业濒临倒闭),可能涉及勃勃野心(比如「明年我们就要全面接管市场」),而这才是创业者与客户之间最应该产生的共鸣。只要能发现这类痛点,就要马上行动起来,尽快完成从零到一的突破。

参考链接:

https://www.youtube.com/watch?v=bxBzsSsqQAM

声明:本文为 InfoQ 整理,不代表平台观点,未经许可禁止转载。

相关内容

热门资讯

福建持续打通“两山”转换通道 福建“八山一水一分田”,森林覆盖率全国第一,绿色是福建最鲜明的底色,也是重要的发展优势之一。近年来,...
最新或2023(历届)廊坊市事... 离退休人员待遇先涨  早在1月14日,国务院就公布了《关于机关事业单位工作人员养老保险制度改革的决定...
最新或2023(历届)南阳市事...   工资怎么涨基本工资从40%涨到45%左右  在刚刚过去的全国两会上,人社部原副部长何宪透露,最新...
最新或2023(历届)三门峡市...   工资怎么涨基本工资从40%涨到45%左右  在刚刚过去的全国两会上,人社部原副部长何宪透露,最新...
最新或2023(历届)商丘市事...   工资怎么涨基本工资从40%涨到45%左右  在刚刚过去的全国两会上,人社部原副部长何宪透露,最新...