Anthropic最新报告，揭示了300个独角兽的创业机会！YC CEO力挺

2026-02-23 发布浏览411次点赞0次收藏0次

【导读】Anthropic最新报告揭示，AI智能体近半数使用量集中在软件工程，其余16个垂直行业各占不到9%。AI已具备连续工作5小时的能力，但用户目前最多只让它跑42分钟，信任远未跟上技术。Y Combinator CEO陈嘉兴断言：这片几乎空白的行业版图里，藏着下一代300个独角兽。

你所在的行业，可能还没见过哪怕一分钟的AI智能体。

这个事实本身蕴含着巨大的机会。

2026年2月18日，Anthropic发布了一份关于AI智能体实际使用情况的大规模研究报告（报告：https://anthropic.com/research/measuring-agent-autonomy），分析对象是其公共API上数百万次真实的人机交互。

报告的核心发现可以浓缩成一张柱状图。

软件工程独占了49.7%的智能体工具调用量，像一根拔地而起的烟囱。

剩下的16个垂直行业——医疗、法律、金融、教育、客服、物流，每一个的份额都是个位数：医疗1%。法律0.9%。教育1.8%，没有任何一个超过9%。

Y Combinator的CEO陈嘉兴（Garry Tan）盯着这张图，得出了一个让很多创业者坐不住的结论：那片几乎空白的区域，藏着下一代300个独角兽。

他的原话更直白：「如果我今天创业，我会盯着那张柱状图上那一大片红色区域，直到从中看到自己的未来。」

你的AI比你以为的能干得多

这份报告里有一组数据，适合贴在每个产品经理的工位上。

独立评估机构METR的测试结果显示，Claude已经能够独立完成需要人类近5小时才能搞定的工作。然而在实际使用中，即便是全球最激进的那批用户（统计意义上的第99.9百分位），单次让AI连续工作的时长也不过42分钟左右。

5小时的能力，42分钟的授权。

这中间巨大的落差，陈嘉兴给它起了个名字叫「部署积压」（deployment overhang）。

翻译成大白话就是：AI已经准备好了，人还没准备好。

好消息是，人正在追赶。

从2025年10月到2026年1月，这个第99.9百分位的会话时长几乎翻了一倍，从不到25分钟涨到42分钟。

值得留意的是，这条增长曲线非常平滑，并没有因为新模型的发布出现突然跳升。

换句话说，驱动变化的主力不是模型变聪明了，而是人类在一次又一次的协作中，学会了慢慢松手。

Anthropic内部的使用数据印证了同样的趋势。

2025年8月到12月，Claude Code在最困难任务上的成功率翻倍，每次会话中人工介入的次数从5.4次降到了3.3次。

对于正在考虑创业方向的人来说，这意味着一件很具体的事：窗口期还在。

绝大多数行业甚至还没开始认真尝试让AI智能体介入自己的核心工作流。

不是技术不行，是信任还没到。

老手更敢放手，也更敢叫停

关于人和AI如何磨合出默契，这份报告讲了一个很有意思的故事。

刚开始用Claude Code的人，只有大约20%的会话选择了「全自动批准」模式——也就是让AI自己跑，不用每一步都等人点头。

累计使用超过750次之后，这个比例上升到40%以上。

信任在日复一日的使用中缓慢生长，可以被精确测量。

反直觉的地方在于：那些更愿意放手让AI跑的老用户，同时也更频繁地打断它。

新手的打断率大约是5%，老手反而到了9%。

这看起来矛盾，其实是两种截然不同的工作方式。

新手像是在考场上监考，AI每写一道题都要看一眼。

老手更像是委托了一个信得过的下属，平时不盯着，一旦感觉方向不对立刻喊停。

从「逐项审批」到「委托+监控」，这种转变对理解人机协作的未来至关重要。

另一个容易被忽视的细节：在复杂任务中，Claude主动暂停来向用户确认的次数，是用户主动打断它的两倍还多。

AI在拿不准的时候会停下来问一声，而非闷头往前冲。

Anthropic的研究团队提炼出一个核心概念来描述这种动态——「共建」。

AI智能体的自主程度，不是模型单方面决定的。

它由三方力量塑造：模型在不确定时选择暂停，用户随经验调整监管尺度，产品设计在中间架设桥梁。

这个发现直指当下最热的AI监管争论。

如果政策要求人类必须「逐项审批AI的每一个动作」，结果大概率是生产力被扼杀，安全性却没有实质提升。

报告中的数据也支持了这种判断：73%的工具调用有人在回路中监管，仅0.8%的操作属于不可逆类型。

而那些看起来高风险的极端案例（API密钥操作、自主加密货币交易），经核实大多是安全团队做的红队演练，不是真实生产场景。

护城河在行业里，不在模型里

看到这里，可能有人要问：既然垂直行业机会这么大，为什么大家都挤在软件工程里？

答案并不复杂。

代码是可测试、可回滚、出错成本低的——写坏了一段代码，最多回退一个版本。

但你让AI帮一个病人处理医保报销，或者替律师做证据开示，出了错可能是一场诉讼。

软件工程的智能体渗透率高，本质上是因为这个领域的「容错空间」最宽裕。

Box的CEO Aaron Levie点出了垂直AI创业的真正壁垒所在：能把遗留工作流吃透，能在监管的夹缝中找到产品路径，能帮客户推动组织内部的变革。

谁都可以在大模型外面包一层界面做个「AI壳」。

但要让智能体在医疗账单审核、法律合同检索或建筑许可审批这些场景里真正跑起来，创业者必须比客户自己还懂那个行业的痛点和雷区。

这也是为什么陈嘉兴认为垂直AI公司天然具备防御性。

他提了一笔大账：过去二十年，SaaS行业每十年规模增长十倍，超过40%的风险投资流入了SaaS公司，催生了300多个独角兽。

他的核心推演是——这300多个独角兽，每一个都对应着一个垂直AI版本等待被创造；而AI版本的天花板可能是SaaS版本的十倍，因为它替代的不只是软件本身，还有操作软件的那些人。

Bessemer Venture Partners在2025年的一份研究中给出了类似的判断：美国劳工统计局的数据显示，软件支出仅占美国GDP的1%，而由重复性语言任务主导的商业与专业服务行业占到13%。

垂直AI的潜在市场不在于抢占现有软件的份额，而在于切入那些软件从未触及的服务经济腹地。

放到中国语境下，这个逻辑同样成立，甚至空间更大。

中国企业级市场的一个显著特征是供给端偏爱通用化、标准化的产品，而需求端渴望的是能够深入特定行业流程的定制方案。

叠加数据孤岛和组织协同壁垒，这种供需错配反而为垂直AI创业者提供了结构性的保护。

Gartner预测，到2026年底约40%的企业应用将集成任务型AI Agent——2025年这个数字还不到5%。

我们正站在从实验到规模化的临界点上。

图已经画好了

软件工程这块地盘基本已经有主了。

但医疗、法律、金融、教育、客服、物流——16个垂直行业各自只占个位数的份额，几乎是一片未经开垦的土地。

如果你是一个正在选方向的创业者，或者是一个在传统行业里每天处理大量重复性工作的从业者，这份报告指向的信号很明确：你日常工作中那些让你疲惫又无聊的环节，很可能就是下一个独角兽公司的起点。

那些你每天重复填写的表格、反复核对的数据、来回扯皮的审批流程，在AI智能体的视角里都是尚未被开发的矿脉。

模型已经具备连续工作五小时的能力，用户目前只让它跑42分钟。

TechCrunch在2025年底调研了24位专注企业市场的风险投资人，压倒性的共识是2026年将成为企业真正从AI中看到回报的一年。

与此同时，麦肯锡的数据显示92%的企业计划在未来三年增加AI投资，但只有1%认为自己已经进入成熟部署阶段。

也就是说，几乎所有人都知道要往这个方向走，几乎所有人都还站在起跑线上。

陈嘉兴的总结很简练：300个SaaS独角兽已经来过了，300个垂直AI独角兽即将到来。

赢家属于那些选准一个行业扎进去、把领域知识编织进智能体、同时能帮客户完成变革管理的创始人。

每一轮技术革命最丰厚的回报，往往不属于铸造锤子的人，而属于那些清楚该往哪面墙上敲的人。

参考资料：

https://anthropic.com/research/measuring-agent-autonomy

https://garryslist.org/posts/half-the-ai-agent-market-is-one-category-the-rest-is-wide-open

声明：本文转载自新智元，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！

Anthropic最新报告，揭示了300个独角兽的创业机会！YC CEO力挺

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。