Anthropic最新报告,揭示了300个独角兽的创业机会!YC CEO力挺

2026-02-23 发布 · 浏览28次 · 点赞0次 · 收藏0次

【导读】Anthropic最新报告揭示,AI智能体近半数使用量集中在软件工程,其余16个垂直行业各占不到9%。AI已具备连续工作5小时的能力,但用户目前最多只让它跑42分钟,信任远未跟上技术。Y Combinator CEO陈嘉兴断言:这片几乎空白的行业版图里,藏着下一代300个独角兽。

你所在的行业,可能还没见过哪怕一分钟的AI智能体。

这个事实本身蕴含着巨大的机会。

2026年2月18日,Anthropic发布了一份关于AI智能体实际使用情况的大规模研究报告(报告:https://anthropic.com/research/measuring-agent-autonomy),分析对象是其公共API上数百万次真实的人机交互。

报告的核心发现可以浓缩成一张柱状图。


软件工程独占了49.7%的智能体工具调用量,像一根拔地而起的烟囱。

剩下的16个垂直行业——医疗、法律、金融、教育、客服、物流,每一个的份额都是个位数:医疗1%。法律0.9%。教育1.8%,没有任何一个超过9%。

Y Combinator的CEO陈嘉兴(Garry Tan)盯着这张图,得出了一个让很多创业者坐不住的结论:那片几乎空白的区域,藏着下一代300个独角兽。

他的原话更直白:「如果我今天创业,我会盯着那张柱状图上那一大片红色区域,直到从中看到自己的未来。」

你的AI比你以为的能干得多

这份报告里有一组数据,适合贴在每个产品经理的工位上。

独立评估机构METR的测试结果显示,Claude已经能够独立完成需要人类近5小时才能搞定的工作。然而在实际使用中,即便是全球最激进的那批用户(统计意义上的第99.9百分位),单次让AI连续工作的时长也不过42分钟左右。


5小时的能力,42分钟的授权。

这中间巨大的落差,陈嘉兴给它起了个名字叫「部署积压」(deployment overhang)。

翻译成大白话就是:AI已经准备好了,人还没准备好。

好消息是,人正在追赶。

从2025年10月到2026年1月,这个第99.9百分位的会话时长几乎翻了一倍,从不到25分钟涨到42分钟。

值得留意的是,这条增长曲线非常平滑,并没有因为新模型的发布出现突然跳升。

换句话说,驱动变化的主力不是模型变聪明了,而是人类在一次又一次的协作中,学会了慢慢松手。

Anthropic内部的使用数据印证了同样的趋势。

2025年8月到12月,Claude Code在最困难任务上的成功率翻倍,每次会话中人工介入的次数从5.4次降到了3.3次。

对于正在考虑创业方向的人来说,这意味着一件很具体的事:窗口期还在。

绝大多数行业甚至还没开始认真尝试让AI智能体介入自己的核心工作流。

不是技术不行,是信任还没到。

老手更敢放手,也更敢叫停

关于人和AI如何磨合出默契,这份报告讲了一个很有意思的故事。

刚开始用Claude Code的人,只有大约20%的会话选择了「全自动批准」模式——也就是让AI自己跑,不用每一步都等人点头。

累计使用超过750次之后,这个比例上升到40%以上。

信任在日复一日的使用中缓慢生长,可以被精确测量。

反直觉的地方在于:那些更愿意放手让AI跑的老用户,同时也更频繁地打断它。

新手的打断率大约是5%,老手反而到了9%。


这看起来矛盾,其实是两种截然不同的工作方式。

新手像是在考场上监考,AI每写一道题都要看一眼。

老手更像是委托了一个信得过的下属,平时不盯着,一旦感觉方向不对立刻喊停。

从「逐项审批」到「委托+监控」,这种转变对理解人机协作的未来至关重要。

另一个容易被忽视的细节:在复杂任务中,Claude主动暂停来向用户确认的次数,是用户主动打断它的两倍还多。

AI在拿不准的时候会停下来问一声,而非闷头往前冲。

Anthropic的研究团队提炼出一个核心概念来描述这种动态——「共建」。

AI智能体的自主程度,不是模型单方面决定的。

它由三方力量塑造:模型在不确定时选择暂停,用户随经验调整监管尺度,产品设计在中间架设桥梁。

这个发现直指当下最热的AI监管争论。

如果政策要求人类必须「逐项审批AI的每一个动作」,结果大概率是生产力被扼杀,安全性却没有实质提升。

报告中的数据也支持了这种判断:73%的工具调用有人在回路中监管,仅0.8%的操作属于不可逆类型。

而那些看起来高风险的极端案例(API密钥操作、自主加密货币交易),经核实大多是安全团队做的红队演练,不是真实生产场景。

护城河在行业里,不在模型里

看到这里,可能有人要问:既然垂直行业机会这么大,为什么大家都挤在软件工程里?

答案并不复杂。

代码是可测试、可回滚、出错成本低的——写坏了一段代码,最多回退一个版本。

但你让AI帮一个病人处理医保报销,或者替律师做证据开示,出了错可能是一场诉讼。

软件工程的智能体渗透率高,本质上是因为这个领域的「容错空间」最宽裕。

Box的CEO Aaron Levie点出了垂直AI创业的真正壁垒所在:能把遗留工作流吃透,能在监管的夹缝中找到产品路径,能帮客户推动组织内部的变革。


谁都可以在大模型外面包一层界面做个「AI壳」。

但要让智能体在医疗账单审核、法律合同检索或建筑许可审批这些场景里真正跑起来,创业者必须比客户自己还懂那个行业的痛点和雷区。

这也是为什么陈嘉兴认为垂直AI公司天然具备防御性。

他提了一笔大账:过去二十年,SaaS行业每十年规模增长十倍,超过40%的风险投资流入了SaaS公司,催生了300多个独角兽。

他的核心推演是——这300多个独角兽,每一个都对应着一个垂直AI版本等待被创造;而AI版本的天花板可能是SaaS版本的十倍,因为它替代的不只是软件本身,还有操作软件的那些人。

Bessemer Venture Partners在2025年的一份研究中给出了类似的判断:美国劳工统计局的数据显示,软件支出仅占美国GDP的1%,而由重复性语言任务主导的商业与专业服务行业占到13%。

垂直AI的潜在市场不在于抢占现有软件的份额,而在于切入那些软件从未触及的服务经济腹地。

放到中国语境下,这个逻辑同样成立,甚至空间更大。

中国企业级市场的一个显著特征是供给端偏爱通用化、标准化的产品,而需求端渴望的是能够深入特定行业流程的定制方案。

叠加数据孤岛和组织协同壁垒,这种供需错配反而为垂直AI创业者提供了结构性的保护。

Gartner预测,到2026年底约40%的企业应用将集成任务型AI Agent——2025年这个数字还不到5%。

我们正站在从实验到规模化的临界点上。

图已经画好了

软件工程这块地盘基本已经有主了。

但医疗、法律、金融、教育、客服、物流——16个垂直行业各自只占个位数的份额,几乎是一片未经开垦的土地。

如果你是一个正在选方向的创业者,或者是一个在传统行业里每天处理大量重复性工作的从业者,这份报告指向的信号很明确:你日常工作中那些让你疲惫又无聊的环节,很可能就是下一个独角兽公司的起点。

那些你每天重复填写的表格、反复核对的数据、来回扯皮的审批流程,在AI智能体的视角里都是尚未被开发的矿脉。

模型已经具备连续工作五小时的能力,用户目前只让它跑42分钟。

TechCrunch在2025年底调研了24位专注企业市场的风险投资人,压倒性的共识是2026年将成为企业真正从AI中看到回报的一年。

与此同时,麦肯锡的数据显示92%的企业计划在未来三年增加AI投资,但只有1%认为自己已经进入成熟部署阶段。

也就是说,几乎所有人都知道要往这个方向走,几乎所有人都还站在起跑线上。

陈嘉兴的总结很简练:300个SaaS独角兽已经来过了,300个垂直AI独角兽即将到来。

赢家属于那些选准一个行业扎进去、把领域知识编织进智能体、同时能帮客户完成变革管理的创始人。

每一轮技术革命最丰厚的回报,往往不属于铸造锤子的人,而属于那些清楚该往哪面墙上敲的人。

参考资料:

https://anthropic.com/research/measuring-agent-autonomy

https://garryslist.org/posts/half-the-ai-agent-market-is-one-category-the-rest-is-wide-open

Anthropic最新报告,揭示了300个独角兽的创业机会!YC CEO力挺 - AI 资讯 - 资讯 - AI 中文社区

声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论
游客
游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。