Claude的新电脑控制功能太疯狂了

Prompt Engineering 油管AI课堂 2026-03-28 纯讲解
总结 Claude 现在能像真人一样直接操作你电脑里的任何软件 比如达芬奇 这可不是简单的浏览器控制 而是把整个电脑控制权交给了 AI 助手
工具 - Claude 的“电脑控制” vs 传统“网页代理”:以前 AI 代理只能控制浏览器 现在它能像你一样 在 Mac 上点开任何应用(比如达芬奇、Chrome)并操作; - 核心区别
建议 - 仅限付费用户:只有 Claude Pro 和 Claude Team(Max)套餐能用
播客音频
Prompt E_Claude的新电脑控制功能太疯狂了
核心提纲
一句话总结

Claude 现在能像真人一样直接操作你电脑里的任何软件 比如达芬奇 这可不是简单的浏览器控制 而是把整个电脑控制权交给了 AI 助手

视频类型

工具评测型(深度操作式)

工具定位(独特视角+与其他工具的本质区别)
. Claude 的“电脑控制” vs 传统“网页代理”:以前 AI 代理只能控制浏览器 现在它能像你一样 在 Mac 上点开任何应用(比如达芬奇、Chrome)并操作
. 核心区别:它不再是聊天机器人 而是能接管你桌面的“知识工作伙伴” 目标是自动化你的日常工作流
. 讲师观点:这和 OpenAI 的“助手”定位不同 Claude 更审慎 专为知识工作者设计 不是搞噱头
功能设置指南

全局设置

你需要先升级 Claude 的桌面应用(Desktop App)
同时更新手机 App
在设置里手动找到“Computer Use”(电脑使用)选项并开启
它会像新装软件一样 逐个向你请求应用权限(比如访问达芬奇、Chrome)
单次操作
. 每次执行任务前(比如“打开达芬奇看看我最近的项目”),它还会弹窗再问一次 让你确认
. 操作时 它会实时截屏“看”屏幕 然后模拟鼠标键盘去点击
实战案例矩阵
案例操作步骤效果验证记忆点
查达芬奇项目1. 用调度功能(调度功能)给 Claude 发指令:“用电脑功能打开达芬奇 告诉我最近处理的项目”
2. Claude 请求权限后 自动打开达芬奇并切换窗口
3. 它浏览软件界面并总结项目
成功打开达芬奇 在不同显示器间切换 找到了最近编辑的视频文件“它操作方式完全模拟人类” 但速度很慢 你得耐心看它“表演”
登录银行网站(失败案例)1. 指令:“去花旗银行网站 我提供账号密码 你帮我登录”
2. Claude 会打开 Chrome
3. 但到了输入密码环节 它拒绝执行
它回复:“我无法输入你的登录凭据”自带安全底线:涉及敏感操作(登录、支付)它会主动拒绝 这是设计上的安全防护
远程手机操控结合“调度”功能 你可以在外面用手机给家里的电脑发指令 让 Claude 操作电脑完成工作讲师提到这个场景“想想就令人惊叹” 是核心应用场景之一“远离电脑用手机执行操作” 这才是杀手级应用场景
版本差异(免费 vs 付费 + 讲师建议)
. 仅限付费用户:只有 Claude Pro 和 Claude Team(Max)套餐能用
. 当前系统限制只支持 Mac Windows 和 Linux 支持“即将推出”
. 讲师建议:现在还是早期阶段 速度慢、有卡顿 适合爱折腾的人尝鲜 别指望它稳定处理紧急任务
记忆锚点(3个最关键的实战例子)
“达芬奇侦查员”:让 Claude 帮你翻找专业软件(如达芬奇)里的历史项目 你不用自己打开软件一个个找
“有原则的银行职员”:即使你给它密码 它也不会帮你登录银行网站 安全底线设计得很清楚
“手机遥控器”:结合调度功能 实现真正的远程办公——在外面用手机 指挥家里的 Claude 操作电脑干活
资源索引
. 快速操作清单(从0开始的设置顺序):
确保你是 Claude Pro 或 Team 用户
去官网下载/更新 Claude Desktop App(桌面应用)
在桌面 App 的设置里找到并开启 “Computer Use”
首次使用某个软件(如 Chrome)时 根据弹窗提示授予权限
通过“调度”(调度功能)或直接对话 用自然语言下达电脑操作指令
. 使用场景决策树
. 想让它帮你操作电脑软件? → 用“Computer Use”功能
. 只是查网页资料? → 用原来的网页搜索或上传文件功能就行
. 涉及登录、支付、敏感信息? → 别想了 Claude 会拒绝 这是保护你
. 想远程控制家里电脑? → 结合“调度”功能 用手机发指令
. 可复制模板库
. 查专业软件项目:“用电脑功能打开 [软件名,如:DaVinci Resolve / Figma] ,告诉我最近处理过的文件/项目是什么。”
. 远程文件整理:“我现在不在电脑前。请打开 Finder(访达),把下载文件夹里所有上周的 PDF 文件,移动到‘已处理’文件夹里。”
. 提到的工具/产品/技术
. Claude Desktop App(Claude 桌面应用):需要在电脑上安装的这个软件 是使用“电脑控制”功能的前提
. 调度功能(调度功能):Claude 的一个功能 可以让你通过其他设备(如手机)给 Claude 发指令 是实现远程操控的关键
. Upscope:一家做屏幕共享技术的初创公司 刚被 Anthropic(Claude 的公司)收购 讲师推测部分技术来自它
. 记忆锚点清单
. 金句/类比:“这不是控制浏览器,而是把计算机的控制权交给 AI。” “它操作方式完全模拟人类。”
. 关键数据/对比1500万次观看——发布视频 5 小时内的播放量,说明关注度爆炸。只支持 Mac(目前),Windows/Linux 用户要等。
. 梗/亮点“有记忆的石头”——讲师口误(“rocks have memory”),实际是说 Claude 有记忆,能记住你的工作习惯,但这也意味着要注意隐私,别让它看到敏感信息。
. 建议
. 值得看完整视频(如果你是技术/产品人,且是 Mac 用户)。视频里有完整的操作演示和过程细节(比如它如何在屏幕间切换),你能直观感受它的能力和目前的“笨拙”速度,这对判断其成熟度和应用边界很重要。单纯看笔记无法体会那种“它真的在操作我电脑”的震撼感。

熵科技刚刚在云桌面中引入了原生计算机使用功能。这并非控制你的浏览器,而是实际上能够在Mac OS上使用任何应用程序,这简直令人难以置信。你实质上是在将计算机的控制权交给云桌面应用。

现在,这款电脑到云端的桌面应用程序,将开启一些相当惊人的应用场景。同时,它也带来了一些安全顾虑,以及我确实想讨论的一些限制。但我认为,这将改变我们的工作方式。

你可以将此功能与其他一些特性结合使用,比如通过手机完全远程操控电脑进行调度,这想想就令人惊叹。

所以在这个视频中,我想带大家了解这个功能具体是做什么的,它的局限性是什么,它的能力有哪些,以及在你开始授予关键权限之前需要考虑的其他一些方面。好了,那我们开始吧。

好的,那么发布会正式开始。X平台上的公告视频在短短近5小时内,观看量已突破1500万次,这简直令人难以置信。但Anthropic公司近期确实势如破竹,他们接连发布新功能,而且每一个都极具实用性,绝非华而不实的噱头。

Anthropic并非花招。Anthropic以极其自然的方式行事,这与他们自动化知识工作的总体目标是一致的。现在很多人会将这些新功能与open claw进行比较,我认为这已不再公平。

主题功能的发布非常审慎,它们主要面向知识工作者,而非助手、聊天机器人或代理。而Open Call更像是一个带有友好语气的个人助手,这与anthropic的发布风格不同。好的,那么这次新的anthropic发布。

因此,这项新功能与调度功能协同工作。您可以在协作环境中使用它,同样,如果它运行在Clot桌面环境中,也可以在Clot代码中使用。我认为其中部分功能与Clot桌面相关。

我认为其中一些技术是由U Sept驱动的,这是一家初创公司,最近被Anthropic收购,时间还不到一个月,但他们似乎已经取得了相当不错的进展。传统上,当人们……

传统上,当人们讨论计算机使用代理时,他们主要谈论的是浏览和控制代理。这是我们过去所见的模式。然而,借助这项新的计算机使用能力,anthropic将其提升到了一个全新的层次。他们实际上在探讨如何控制你的计算机。

所以,控制你电脑的代理程序能够使用任何正在运行的应用,目前仅限于Mac OS设备。根据他们的公告,Windows和Linux的支持即将推出。

要启用此功能,您需要升级云桌面应用,以便与调度功能配合使用。同时,您也需要更新手机应用。升级完成后,您将看到计算机使用选项,需要手动启用,并且该功能还需要额外的设置。

它还需要额外的辅助功能选项,因为它将使用你的电脑。这是按应用进行的。所以我认为它会向你请求权限。这样,Clot就能像你一样截取屏幕截图并控制鼠标和键盘。

好的,在演示其工作原理之前,我们先谈谈当前的一些限制。你的桌面需要处于活动状态。对于复杂任务,它可能需要尝试几次,而且运行速度可能会非常慢。

它可能非常缓慢,有时慢得令人痛苦,而你只能坐在那里眼睁睁看着它运行。但当你远离电脑,用手机执行操作时——不仅仅是运行代码,还能实际使用不同应用——这就变得极其有用。

然后它只能使用不同的应用程序。并且,它仅适用于Pro和Max套餐。现在,仅适用于Pro和Max套餐。现在,仅适用于Pro和Max套餐。现在,对于它具体能做什么存在限制。因此,一些约束条件包括它不会参与股票交易或投资互动,不会处理敏感数据,也不会收集和扫描面部图像。

这些是面部图像。这些是面部图像。这些是它不会做的事情,它不会做的事情,它不会做的事情,浏览器以及为这些浏览器插入数据,为这些浏览器插入数据,为这些浏览器插入数据,你可能只想使用Chrome扩展程序。现在需要注意的一点是,它拥有记忆。所以需要非常注意,它拥有记忆。所以需要非常注意,它拥有记忆。

太酷了,岩石有记忆,这意味着云太酷了,岩石有记忆,这意味着云太酷了,岩石有记忆,这意味着云可以学习你的工作方式并保留可以学习你的工作方式并保留可以学习你的工作方式并保留跨会话的上下文。你不想跨会话的上下文。你不想跨会话的上下文。你不想可能分享任何敏感可能分享任何敏感可能分享任何敏感信息。信息。信息。现在你可能还记得Windows中的回忆现在你可能还记得Windows中的回忆现在你可能还记得Windows中的回忆功能。这是功能。这是功能。这是

这是Microsoft原本打算发布的一项功能,但随后遭遇了巨大的反对声浪,他们因此决定不予推出。然而现在,借助云端的计算机使用这类特性,我们实际上正在大力增强Windows曾经拥有的召回功能。

为了展示一个实例,我们可以让它利用你的电脑功能,在Mac OS上打开DaVinci Resolve应用,并告诉我我们最近处理的项目是什么。在某些情况下,这会在执行任何操作前请求我们的许可。

在进行任何操作前,都需要获得许可。所以,现在你可以看到,它正在请求我允许它在此特定会话中使用Dainci Resolve。现在,我们将允许这一请求。此外,你还可以利用调度功能,实现同一台计算机的使用能力。

现在它已经打开了,在另一个窗口打开了达芬奇软件,过程中它会截取屏幕截图以确保能看到窗口。我的屏幕录制正在干扰它。好吧,这确实挺有意思的,有趣的是它居然能做到这一点。

有趣的是,它确实能在不同显示器之间切换,确实能在不同显示器之间切换,确实能在不同显示器之间切换。好的,我实际上把达芬奇调到了同一个屏幕上,调到了同一个屏幕上,调到了同一个屏幕上,就是我们运行云桌面应用的那个屏幕,就是我们运行云桌面应用的那个屏幕,就是我们运行云桌面应用的那个屏幕。嗯,所以它现在正在屏幕之间切换,嗯,所以它现在正在屏幕之间切换,嗯,所以它现在正在屏幕之间切换。嗯,这确实非常有趣,嗯,这确实非常有趣,嗯,这确实非常有趣。我想它已经搞明白了,我想它已经搞明白了,我想它已经搞明白了。

我想它已经精确地定位到了达芬奇软件的位置。没错,就在这里。现在它能够点击不同的窗口,操作方式完全模拟人类的行为,可以原生地使用这些应用程序。不过在这个过程中,它的运行速度可能会非常缓慢,这一点需要留意。

所以如果你决定使用这个应用,请记住这一点。然后你决定使用这个应用。接着你决定使用这个应用。基于这一点,基本上这些就是基于这一点,基本上这些就是基于这一点,基本上这些就是我处理过的不同窗口或不同视频。现在让我们看看我处理过的视频。现在让我们看看我处理过的视频。现在让我们看看,如果我请求它,呃,你能去城市银行的网站并登录吗?我会提供给你登录信息。

可能是通过登录信息。它可能会使用Chrome或Chrome云服务,但提示我无法代表你登录银行网站。请使用你自己的电脑,通过代理打开Chrome浏览器,访问花旗银行网站,然后我会指导你如何登录。好的。

实际上,它要访问Chrome。不过上面说,我无法输入你的登录凭据。所以,这其实是个不错的功能。

在计算机使用能力之上,还有一层安全防护,这确实很不错,也正是你期望从用于知识工作的智能体那里得到的。目前这些都还处于非常早期的阶段。

我会更全面地测试它,并分享我的体验,但它的功能简直令人惊叹,现在正是参与其中的激动时刻。无论如何,请务必去看看,链接会放在视频描述里。请告诉我你的想法。

请告诉我你的想法。你能看到哪些不同的应用场景?你能看到哪些不同的应用场景?你能看到哪些不同的应用场景?你能看到这种方法可能带来哪些潜在问题?你能看到这种方法可能带来哪些潜在问题?你能看到这种方法可能带来哪些潜在问题?无论如何,我希望你觉得这个视频有用。无论如何,我希望你觉得这个视频有用。无论如何,我希望你觉得这个视频有用。感谢观看,一如既往,我们下期再见。感谢观看,一如既往,我们下期再见。感谢观看,一如既往,我们下期再见。

原视频 导出PDF