ora research -- 2026.04.22

2026 Agent Readiness 现状报告

AI Agent 正在成为 Web 的新客户,但 99% 的网站还没准备好迎接它们。这份报告调查了剩下那 1% 做对了什么。

110 项 跨 5 个加权层级的检测指标
99% 网站对 Agent 不友好
3 大 前沿 Agent:ChatGPT / Claude / OpenClaw
A-F 评分体系:A = Agent 可端到端完成任务

全文翻译

忠实翻译,术语保留英文原文,首次出现括号注释中文。

核心论点

文章指出,AI Agent(智能体)正在成为 Web 的新客户,但 99% 的网站还没有为此做好准备。报告深入调查了剩下那 1% 做对了什么。

近期行业背景

报告发布前有三件大事:

  • Salesforce 推出 Headless 360 —— 将每一个 CRM 和 Commerce(商务)操作转化为 MCP(Model Context Protocol,模型上下文协议)工具
  • 每个 Shopify 店铺默认成为 MCP Endpoint(端点)
  • Cloudflare 举办了第一届 Agents Week

作者观察到,Agent 基础设施正在"大规模交付"。

方法论概述

ora 使用其 Deep Scan 工具扫描了数千个产品。报告中的每一个指标都来自真实 Agent —— 具体来说是 ChatGPT、Claude 和 OpenClaw —— 对每个网站运行完整 Session(会话),覆盖五个加权层级。该工具生成真实 Agent 并运行实际会话。每个 Protocol(协议)都通过真实握手(handshake)探测,而非字符串匹配。

他们在五个加权层上评估 110 项检查:

Discovery

发现层:Agent 能否找到网站的入口和能力声明?

Identity

身份层:网站如何向 Agent 声明自己的身份?

Auth & Access

认证与访问层:Agent 如何完成身份验证?

Agent Integration

Agent 集成层:MCP、A2A 等协议支持情况

User Experience

用户体验层:Agent 驱动的交互是否流畅?

加权评分

LLM 根据产品上下文审查,不相关的检查从分母中移除

覆盖的规范

规范/协议内容
RFC 8288Link Headers(链接头)
RFC 8414OAuth Server Metadata(OAuth 服务器元数据)
RFC 9309robots.txt
RFC 9421Web Bot Auth(Web Bot 认证)
RFC 9727API Catalog(API 目录)
RFC 9728OAuth Protected-Resource Metadata
MCP 全面覆盖Tool Descriptions、OAuth、PKCE、Streamable HTTP、Server Cards
A2A / ACPAgent-to-Agent / Agent Communication Protocol
x402 / MPP支付协议 / 机器支付协议
llms.txt为 LLM 提供网站结构化信息的声明文件
agentskills.ioAgent 技能注册中心

评分机制

评分是 Relevance-aware(相关性感知)的。每次扫描后,LLM 会根据产品上下文审查结果,标记出真正不相关的检查(例如:对免费开源工具检查支付协议)。N/A 检查从分母中移除,因此网站不会因为缺少一个它没有理由实现的协议而被扣分。每个网站获得 0-100 分和一个字母等级。A 意味着 Agent 可以端到端完成任务,F 意味着它连首页都过不去。

排行榜 Top 50

榜单顶端由更新的、Agent-native(原生 Agent)公司主导:Attio、Tavily、AgentMail、Parallel、Fireworks 等。这些公司诞生于 Agent 成为品类之后,Agent-native 基础设施是默认起点,因此输出 MCP、Streaming(流式传输)和 Agent 级 UX 是默认而非迁移。

作者认为更有趣的信号是与它们并列的基础设施巨头。Stripe、Cloudflare 和 Vercel "早早读懂了紧迫性" —— 每一个新的 MCP 传输、Commerce 协议和 Agent Runtime(运行时)都运行在它们的轨道上,每一个新的 Agent 工作流都在复合它们的收入。支付和基础设施被描述为"承重结构"

排名公司等级分数域名
1TelnyxA91telnyx.com
2ForterA86forter.com
3AttioB79attio.com
4AnomalyArmorB78anomalyarmor.com

(原文提供完整 Top 50,此处摘录前 4 名)

深度解读

工程级分析:协议栈拆解、评分架构、选型决策框架。

这篇文章回答的问题:网站需要具备哪些技术能力,才能成为 Agent 的合格"客户"?

这篇文章应该回答但没回答的问题:网站为什么需要迎接 Agent?Agent 流量对网站来说是机遇还是负担?

压力测试:三个最致命的假设

假设 1:Agent 需要专用协议才能与网站交互。现实是,大量成功的 Agent 集成并不使用这些协议。ChatGPT 的 Browse 功能、Claude 的 computer use 都是直接解析 HTML。如果 Agent 本质上是"会用工具的浏览器",那协议层可能只是锦上添花而非必需品。这就像说"99% 的餐厅没有为外星人准备好菜单" —— 前提本身就值得质疑。

假设 2:用 ChatGPT/Claude/OpenClaw 作为评测 Agent 是客观的。这是循环定义 —— "Agent Readiness"的分数完全取决于这三个特定 Agent 能做什么,而非 Agent 一般需要什么。如果换一批 Agent 来测,排行榜可能完全不同。ora 用自家 Agent 来定义标准,再用自家工具来打分。

假设 3:ora research 是中立的观察者。ora.ai 出售 Deep Scan 工具。Agent Readiness 越重要,他们的产品越有价值。这不是阴谋论 —— 这是标准的 vendor research(供应商研究报告),读的时候需要打折扣。

一、五层评分架构拆解

ora 的 110 项检查分布在五个加权层上。这不是随机堆砌 —— 它们构成了一个Agent 与网站交互的完整调用链

层级实际运行位置核心协议失败后果
Discovery DNS / HTTP 层。Agent 发出第一个请求时 llms.txt, robots.txt (RFC 9309), Link Headers (RFC 8288), API Catalog (RFC 9727) Agent 连网站有哪些能力都不知道,只能盲猜
Identity HTTP 响应头 / 元数据端点 OAuth Server Metadata (RFC 8414), Protected-Resource Metadata (RFC 9728) Agent 不知道该信任谁、怎么建立安全通道
Auth & Access OAuth 授权服务器 / Token 端点 OAuth 2.1 + PKCE, Web Bot Auth (RFC 9421), MCP OAuth Agent 无法完成身份验证,所有需要登录的操作都卡死
Agent Integration 应用层端点(MCP Server / A2A Endpoint) MCP (Streamable HTTP, Tool Descriptions, Server Cards), A2A, ACP Agent 找到了门,但门上没有门把手 —— 知道有功能,但不知道怎么调用
UX Agent 执行操作后的响应处理 Streaming, 结构化输出, 错误恢复, x402/MPP 支付 Agent 能调用功能,但结果不可用(非结构化 HTML、无 Streaming、无支付能力)

关键设计:Relevance-aware 评分。这是整个方法论中最聪明的部分。LLM 在扫描后审查结果,将与产品无关的检查从分母中移除。这意味着:

但这也意味着分数不具备跨产品的绝对可比性 —— 两个都是 80 分的网站,可能检查的子集完全不同。

二、协议栈全景:谁定义了 Agentic Web?

报告引用的规范清单,实际上勾勒出了一个完整的Agent Web 协议栈。我们可以把它分三层理解:

基础层

发现与身份

llms.txt — 网站对 LLM 的"自我介绍",类似 robots.txt 但面向 Agent

RFC 8288 — HTTP Link Headers,让 Agent 通过响应头发现相关资源

RFC 9727 — API Catalog,结构化列出网站所有可用 API

安全层

认证与信任

RFC 8414 / RFC 9728 — OAuth 元数据发现,Agent 自动找到授权端点

RFC 9421 — Web Bot Auth,专为 Bot 设计的认证方案

OAuth 2.1 + PKCE — MCP 的默认认证方式

能力层

交互与支付

MCP — Agent 调用工具的标准协议(Tool Descriptions, Streamable HTTP, Server Cards)

A2A / ACP — Agent 之间互相通信

x402 / MPP — 机器对机器的支付协议

三、Agent-native vs 迁移:两种路线的工程差异

报告揭示了一个关键分野:

Agent-native 公司(Attio, Tavily, Fireworks...)

  • 默认输出 MCP:产品设计时就考虑了 Agent 调用场景
  • Streaming 是默认:不需要"给 Agent 加一个流式接口"
  • Agent UX 是一等公民:错误消息结构化、操作可回滚
  • 零迁移成本:不需要给旧系统"打补丁"

基础设施巨头(Stripe, Cloudflare, Vercel...)

  • 早期嗅到机会:在 Agent 成为品类前就开始布局
  • 平台效应:每新增一条 Agent 轨道,所有下游用户受益
  • 复合增长:Agent 工作流越多,平台收入越高
  • "承重结构"定位:不做 Agent 产品,做 Agent 的基础设施

四、DIY vs Deep Scan:你自己能做什么?

维度自己手动检查ora Deep Scan
发现 llms.txt curl 访问 /llms.txt 自动探测 + LLM 语义解析
MCP Server 端点 手动找文档中的 /mcp 端点 自动握手探测 + Server Card 验证
OAuth 发现 查 /.well-known/oauth-authorization-server 全链路 OAuth 元数据检查 + PKCE 验证
Agent 会话测试 几乎不可能手动模拟 真实 Agent 运行完整 Session
Relevance 过滤 靠人工判断 LLM 自动标记 N/A 项
成本 人工时间 + 维护成本 付费工具,但可规模化

五、选型决策框架

你应该关注这份报告

如果你的产品面向开发者 / B2B / 电商,且已有用户通过 Agent 访问你的服务。你不需要全部实现 110 项检查,但 Discovery + Auth + MCP 三层是底线。

你可以先观望

如果你的产品是纯内容型(博客、文档站),Agent 流量目前对你没有商业价值。但 llms.txt 和 robots.txt 的 Agent 规则是低成本投入,值得提前准备。

你可能不需要这个

如果你的用户群与 Agent 完全不重叠(C 端娱乐、本地服务)。但要注意:Agent 作为"中介层"正在渗透一切,今天不需要不等于明天不需要。

六、诚实限制

需要警惕的

  • 利益冲突:ora 出售 Deep Scan 工具,报告天然有推广动机
  • 评测 Agent 的偏见:只用 3 个 Agent 评测,结果可能不具普遍性
  • "99%"是修辞:没有给出扫描了多少网站、什么类型的网站
  • Top 50 不完整:原文只展示了前 4 名,完整的 50 名需要去原文查看

值得认可的

  • Relevance-aware 评分:避免了"什么都得实现"的军备竞赛思维
  • 真实 Agent 测试:不是静态分析,而是实际运行 Session
  • 协议栈全景:第一次系统性地定义了 Agentic Web 的技术栈
  • 基建公司视角:不只看 Agent-native 公司,也关注了 Stripe/Cloudflare 这类"卖铲子"的角色

Payments and infrastructure are described as "load-bearing for the agentic web."

支付和基础设施被描述为"承重结构" —— 每一个新的 Agent 工作流都在复合它们的收入。

An A means an agent can complete a task end-to-end. An F means it cannot get past the front page.

A 意味着 Agent 可以端到端完成任务。F 意味着它连首页都过不去。

苏格拉底对话

通过提问层层深入,发现报告背后的核心洞察。

学生:这份报告说 99% 的网站没准备好迎接 Agent,这听起来很吓人。我需要立刻给我的产品加上 MCP 支持吗?

老师:先别急。我问你一个问题:你上一次使用某个网站时,是通过浏览器直接访问,还是通过一个 Agent 帮你操作的?

学生:大多数时候还是直接用浏览器。只有偶尔让 Claude 帮我查个 API 文档或者抓个数据。

老师:这就是关键。报告说 Agent 是"Web 的新客户",但 Agent 目前占你总流量的多少?如果 Agent 流量不到 5%,那"99% 的网站没准备好"这个数字,到底是危机信号还是市场教育?

学生:嗯……所以这份报告本身可能也是一种市场教育行为?ora 出售 Deep Scan 工具,他们天然有动力让"Agent Readiness"变成一个大家都关心的话题。

老师:没错。但这不意味着报告没有价值。关键是区分"事实"和"叙事"。事实是:确实有一套新的协议栈正在标准化(MCP、A2A、llms.txt 等)。叙事是:99% 的网站"落后"了。前者值得技术人关注,后者需要打折扣。

学生:那报告里最有价值的部分是什么?

老师:我认为是两件事。第一,它第一次系统性地画出了"Agent Web 协议栈"的全景图 —— 从 Discovery 到 UX 的五层结构。之前这些协议散落在各个 RFC 和提案里,没有人把它们串起来。第二,它揭示了一个有趣的分野:Agent-native 公司把这些协议当默认配置,而 Stripe/Cloudflare 这类基建公司把它当复合增长引擎。这两种策略完全不同,但都指向同一个方向。

学生:所以真正的问题不是"我的网站有没有准备好",而是"Agent 流量什么时候会成为不可忽视的比例"?

老师:更准确地说,是"我的产品在 Agent 调用链路中扮演什么角色"。你是被 Agent 调用的工具(那需要 MCP 支持)?还是 Agent 的运行基础设施(那需要更深层的集成)?还是 Agent 的终端用户界面(那需要 UX 层优化)?这三个角色需要的准备完全不同。

学生:报告里的 Relevance-aware 评分机制也挺有意思。它承认了不是每个网站都需要实现所有协议。

老师:这是整个方法论中最聪明的设计。但它也暴露了一个问题:如果每个网站的评分子集都不同,那两个同为 80 分的网站实际上可能完全不可比。这让排行榜的"排名"变得可疑 —— 排名暗示了绝对优劣,但评分机制本身否认了这一点。

学生:所以如果我要做决策,应该怎么用这份报告?

老师:把它当作一份"协议栈地图"而非"成绩单"。不需要追排名,但需要理解每一层解决什么问题。然后根据你的产品角色,选择性地实现最关键的 2-3 层。llms.txt 和 robots.txt 的 Agent 规则是最低成本的起点,几乎零维护成本,但能让 Agent 知道你的存在。这才是真正的 ROI。

学生:最后一个思考:如果 99% 的网站都没准备好,那 Agent 目前是怎么工作的?它们是通过"暴力解析 HTML"来完成任务的吗?

老师:这正是最反直觉的地方。大多数 Agent 确实是靠解析 HTML、模拟点击来工作的 —— 这很脆弱,但能用。报告的价值不在于说"你必须立刻改造",而在于描绘了一个未来状态:当协议栈成熟后,Agent 与网站的交互会从"暴力解析"升级到"结构化对话"。这个转变不会一夜发生,但提前了解地图的人不会迷路。

个性化洞察

基于你的身份和关注领域,提炼最有价值的发现。

1. 协议栈全景图值得收藏

报告第一次系统性地将 Agentic Web 的技术栈从 RFC 层面串起来。作为技术自媒体内容,这份"协议栈地图"本身就是高价值素材 —— 可以单独拆成一篇"Agent Web 协议栈入门指南"。你需要做的不是实现这些协议,而是理解每一层解决什么问题,然后在合适的时候写一篇通俗解读。

2. "卖铲子"比"挖金子"更稳

报告最有洞察力的观察是 Stripe/Cloudflare/Vercel 的策略:不做 Agent 产品,做 Agent 的基础设施。这对你的 AI 产品方向有启发 —— 与其做第 1000 个 Agent,不如做让 Agent 更好工作的工具。Agent-native 公司会死一批,但基础设施公司会持续增长。

3. llms.txt 是最低成本的 Agent Readiness 投入

如果你有个人网站或项目网站,写一个 llms.txt 文件(告诉 LLM 你的网站有什么能力、怎么调用)几乎是零成本的。这比实现完整的 MCP Server 简单 100 倍,但能让 Agent 在搜索时优先发现你。值得今天就做。

4. vendor research 的阅读框架

这份报告是一个经典的 vendor research 案例。ora 用"99% 的网站没准备好"制造紧迫感,用自家工具定义"准备好"的标准,再用排行榜展示"谁已经准备好了"。这个套路在 Gartner、Forrester 的报告中也很常见。下次读类似报告时,先问三个问题:谁出的?谁付费?标准是谁定的?

5. Agent 流量占比是关键先行指标

在决定投入多少资源做 Agent Readiness 之前,先搞清楚你的产品目前有多少流量来自 Agent。如果不到 5%,优先级可以放低。但如果你做的是开发者工具或 B2B API,这个比例可能已经在快速增长 —— ChatGPT 和 Claude 的 browsing 功能每天在你的文档上爬多少次?这个数据值得监控。