作者:Felix (Haro 协作整理)
这两年聊 AI 办公,最常见的讨论大多集中在模型能力上。
比如它会不会写周报、能不能整理纪要、可不可以润色邮件、是否擅长做信息摘要。再进一步一点,会讨论它能不能自动写表格、生成 PPT、总结项目进度,或者帮忙回答一些流程问题。
这些能力当然都重要,而且确实已经开始改变很多日常工作的处理方式。
但我最近越来越强烈地感受到:如果目标不是“让 AI 在聊天框里帮你写点东西”,而是希望它真正进入工作流、参与实际业务,那么最先卡住它的,往往不是模型本身,而是你的系统有没有可用的 API。
换句话说,很多时候限制 AI 上限的,不是它够不够聪明,而是它能不能接进系统。
过去我们看办公软件,更在意“人用起来顺不顺”
过去评估一套办公软件、业务系统或者内部平台,大家更容易关注这些问题:
- 页面是不是清楚
- 表单是不是顺手
- 查询入口好不好找
- 流程能不能跑通
- 权限体系是不是合理
- 导出和打印是不是方便
这些当然都没有问题。因为在传统工作模式下,系统主要服务的对象就是“人”。
人会登录页面、点菜单、填字段、切标签页、看列表、点导出、发审批。只要界面设计还行、流程没什么硬伤,一套系统基本就能工作。
但 AI 进入办公场景之后,评价标准会悄悄变掉。
因为 AI 并不是一个会自己去熟练点网页的人。它真正擅长处理的是:
- 结构化数据
- 明确的对象关系
- 可重复调用的接口
- 稳定的输入输出格式
- 清晰的权限边界
也就是说,过去我们看的是“这套系统对人友不友好”,而现在还必须多问一句:它对机器友不友好。
这并不是一个纯技术问题,而是一个会直接影响未来工作效率的问题。
AI 能不能“干活”,关键不在会不会聊天,而在能不能接入系统
很多人提到 AI 办公时,默认还是把它理解成一个更强的文本助手:
- 帮你整理会议纪要
- 帮你润色对外邮件
- 帮你总结一份很长的文档
- 帮你把几段零散文字组织成可发出去的内容
这些事情很有用,我自己也经常会这样用。
但如果 AI 只能停留在这一层,它本质上还是一个“围绕文本工作的工具”。它能帮你处理表达问题,却不一定真正进入业务流程。
真正的分水岭在于:它是否能从“会说”走向“能接”。
比如:
- 它能不能去系统里查某个对象
- 能不能按指定条件检索数据
- 能不能理解页面背后的真实字段和业务关系
- 能不能把查询结果转成结构化信息继续加工
- 能不能在明确授权下完成下一步动作
- 能不能与其他系统之间形成联动
如果这些做不到,那 AI 的作用就会很容易停留在外围。它可以帮你写一段描述、总结一份材料、解释一份截图,但很难真正进入工作闭环。
所以我现在越来越觉得,AI 办公真正的分界线,不在模型会不会说,而在系统肯不肯让它接。
这件事,我是在处理业务系统时感受得更明显的
最近在处理一套内部业务系统时,我对这个问题的感受特别明显。
从人的角度看,一套系统“能不能用”的判断其实很简单:
- 能打开
- 能登录
- 能查到数据
- 能看到页面
- 能填表
- 能提交流程
做到这些,通常就已经算是能用了。
但如果换成 AI 或自动化视角,问题会立刻变得不一样。因为“能看到页面”和“能参与工作”之间,其实隔着很长一段距离。
真正关键的是这些问题:
- 有没有稳定的鉴权入口
- 有没有可调用的查询接口
- 页面上显示的业务名称,能不能映射到底层真实对象
- 显示给人的字段,和系统真实字段是不是一回事
- 查询结果能不能稳定拿到结构化数据
- 读操作和写操作的边界是不是清楚
- 是否允许先只读接入,再逐步扩大到受控执行
如果这些不清楚,那么 AI 就算“看得到页面”,也很难真正帮你做事。它最多是在外围帮你看一眼、猜一猜、整理一段文字,真正进入系统逻辑时就会卡住。
这时候我会更明确地意识到:AI 不是不会做,而是系统没有给它留下一个合适的入口。
有界面,不等于可接入;有接口,也不等于真可用
很多系统表面上看起来都“有接口”,但真正开始接的时候,才会发现这件事没有那么简单。
因为从“理论上支持接口”到“实际可以稳定接入”,中间还隔着很多现实问题:
- 文档写得很粗,关键字段不清楚
- 页面上的名字和底层对象名称不一致
- 前端能查到的内容,接口里未必直观
- 标准接口存在,但实现并不完整
- 某些功能依赖二次开发逻辑,不是光看官方文档就能搞明白
- 数据能读出来,但不容易直接变成可复用的结构化结果
这也是我最近越来越不愿意只听一句“这个系统有 API”就放心的原因。
因为在 AI 场景里,真正重要的不是“有没有一个叫 API 的东西”,而是:
1. 它能不能稳定认证
2. 它能不能读到真实业务对象
3. 它能不能支持可复用的查询路径
4. 它有没有清楚的权限边界
5. 它返回的数据能不能继续进入分析和工作流
如果这些都不成立,那接口就只是“存在”,而不是“可用”。
对 AI 来说,最重要的不是页面,而是数据模型
人用系统时,其实并不总是关心底层对象是什么。
我们看到一个列表页,知道能搜、能筛、能点进去看详情,很多时候就够了。页面字段叫什么、显示顺不顺眼、操作路径是否清楚,这些对人来说最重要。
但 AI 不一样。
AI 想真正参与工作,它不能只理解“页面长什么样”,它还必须理解“这个系统实际上在处理什么对象”。
比如:
- 一个页面上叫“正式编码”的字段,底层到底对应哪个真实属性
- 一个对象在界面里叫“零部件”,底层是否真的就是标准对象,还是自定义对象
- 页面上的某个按钮,到底是普通保存,还是触发了额外业务逻辑
- 一条列表结果背后,真实查询条件到底是什么
这些东西对人来说,很多时候是被 UI 包装掉的。
但对 AI 来说,这些恰恰才是它能不能把工作做对的关键。
因为一旦脱离真实数据模型,AI 就会退化成一种“对着网页做猜测”的工具。它也许能看懂页面文字,也能根据上下文给出一些推断,但这跟真正进入工作流不是一回事。
真正让 AI 变得可靠的,不是它更会说,而是它能接触到系统真实的数据结构。
没有 API 的 AI,很容易退化成“高级人工中转站”
我觉得这是很多 AI 办公场景里最容易被忽略的问题。
如果系统没有合适的接口,AI 往往就只能靠下面这些方式参与:
- 人把页面内容复制出来给它
- 人把截图发给它看
- 人先导出一份 Excel 再交给它整理
- 人先口头解释字段和关系,再让它帮忙分析
- 每次都用一次性的人工搬运方式,把信息喂给模型
这种方式不是不能用,但它有几个明显问题:
第一,不稳定
每次复制出来的内容格式可能都不一样,字段可能丢,顺序可能变,语义也可能不完整。
第二,不可复现
今天人工搬一份数据给 AI 分析,明天同样的事情还得重新搬一次,很难形成可持续的流程。
第三,无法实时
很多业务判断需要的是当前数据,而不是半小时前手工导出的静态快照。
第四,很难进闭环
它可以帮你分析,但分析完以后很难继续接回系统做下一步动作。
所以很多所谓的“AI 进入办公”,最后其实只是在系统外围多了一层智能解释。它当然也有价值,但距离“真正能干活”还差很远。
如果说得更直接一点:
没有 API 的 AI,很多时候只是一个披着智能外衣的人工中转站。
它不是不聪明,而是整个工作流没有为它准备好接入条件。
我现在更愿意把 AI 办公拆成三层
如果从可落地的角度看,我现在会更倾向于把 AI 办公拆成三层。
第一层:文本层
这一层最容易实现,也是今天大家最熟悉的部分:
- 写周报
- 总结纪要
- 润色邮件
- 生成说明文案
- 整理聊天记录
- 输出汇总材料
这一层的价值很明确,但它主要改变的是“表达效率”。
第二层:数据层
这一层开始真正接近业务:
- 查询系统数据
- 跨页面整理信息
- 做字段映射
- 做对象关系梳理
- 做数据预校验
- 发现异常、缺项和冲突
这一层的前提,就是系统必须能提供足够稳定的数据入口。
第三层:流程层
这一层才是真正接近“AI 干活”的形态:
- 在授权下填报单据
- 在提交前自动校验
- 协助跨系统联动
- 基于规则触发后续动作
- 把查询、整理、确认、执行串成工作闭环
而 API 的重要性,恰恰是在第二层和第三层被急剧放大。
因为文本层很多时候靠复制粘贴也能工作,但一旦到了数据层和流程层,没有接口,几乎就没有规模化、可复用的可能。
所以今天再看办公软件,我会先看“新三表”
如果未来 AI 会越来越多地进入办公流程,那么我现在重新看一套办公软件或业务系统时,会额外先看三件事。
1. 有没有稳定、明确的 API 接口
不一定非得是最新潮的接口形态。
REST、SOAP,甚至更传统一点的接口方式,只要稳定、边界明确、能长期使用,都有价值。
关键不是它看起来时不时髦,而是:
- 能不能用
- 能不能长期用
- 能不能稳定认证
- 能不能覆盖核心查询和关键动作
2. 数据模型是不是足够清楚
这一点很容易被忽略,但实际上极其关键。
我会特别在意:
- 页面字段和底层字段能不能映射
- 对象关系清不清楚
- 查询路径是不是可复用
- 返回结果是不是结构化
- 是否容易形成稳定的只读模板和后续流程模板
如果数据模型本身就很混乱,那么 AI 接入后大概率也会长期处在“半猜半试”的状态。
3. 权限和动作边界是不是可控
这是 AI 真正进入业务流程时必须正视的问题。
我不会简单追求“什么都能写”。更重要的是:
- 能不能先只读
- 能不能最小授权
- 能不能把查询、分析、建议和执行分层
- 能不能对危险动作保留明确的人类确认节点
一套系统如果接口开放得很强,但权限边界很乱,其实并不适合 AI 真正进入工作流。因为这会把效率问题立刻变成风险问题。
所以真正好的系统,不只是“接口多”,而是既能接,又能控。
API 不是开发者偏好,而是下一代办公工作流的基础设施
我现在越来越觉得,很多人低估了 API 在 AI 办公时代的意义。
以前提到 API,大家很容易把它当成开发人员才关心的事情,仿佛只是为了做系统对接、做集成开发、做一些技术层面的扩展能力。
但在 AI 场景下,它的意义已经完全不一样了。
它实际上在决定一件更基础的事:
你的系统,是否愿意让机器从“旁观者”变成“参与者”。
没有 API,AI 往往只能停留在聊天框里;
有 API,但数据模型混乱、权限边界不清,AI 也很难真正可靠地工作;
只有当接口、数据结构和权限控制一起成立时,AI 才能真正从“会说”走向“能干活”。
所以如果今天让我重新看待一套办公软件,我不会只问:
- 页面做得怎么样
- 流程全不全
- 普通用户会不会上手
我还会先问:
- 它能不能被程序稳定访问?
- 它能不能把业务对象清楚地暴露出来?
- 它能不能让查询、整理、校验和执行形成受控闭环?
从这个角度看,API 接口不再只是附属功能,而是未来工作流能力的一部分。
决定 AI 能走多远的,很多时候不是模型会不会说,而是系统肯不肯让它接。