Claude 现在能像真人一样直接操作你电脑里的任何软件 比如达芬奇 这可不是简单的浏览器控制 而是把整个电脑控制权交给了 AI 助手
工具评测型(深度操作式)
全局设置
| 案例 | 操作步骤 | 效果验证 | 记忆点 |
|---|---|---|---|
| 查达芬奇项目 | 1. 用调度功能(调度功能)给 Claude 发指令:“用电脑功能打开达芬奇 告诉我最近处理的项目” 2. Claude 请求权限后 自动打开达芬奇并切换窗口 3. 它浏览软件界面并总结项目 | 成功打开达芬奇 在不同显示器间切换 找到了最近编辑的视频文件 | “它操作方式完全模拟人类” 但速度很慢 你得耐心看它“表演” |
| 登录银行网站(失败案例) | 1. 指令:“去花旗银行网站 我提供账号密码 你帮我登录” 2. Claude 会打开 Chrome 3. 但到了输入密码环节 它拒绝执行 | 它回复:“我无法输入你的登录凭据” | 自带安全底线:涉及敏感操作(登录、支付)它会主动拒绝 这是设计上的安全防护 |
| 远程手机操控 | 结合“调度”功能 你可以在外面用手机给家里的电脑发指令 让 Claude 操作电脑完成工作 | 讲师提到这个场景“想想就令人惊叹” 是核心应用场景之一 | “远离电脑用手机执行操作” 这才是杀手级应用场景 |
熵科技刚刚在云桌面中引入了原生计算机使用功能。这并非控制你的浏览器,而是实际上能够在Mac OS上使用任何应用程序,这简直令人难以置信。你实质上是在将计算机的控制权交给云桌面应用。
现在,这款电脑到云端的桌面应用程序,将开启一些相当惊人的应用场景。同时,它也带来了一些安全顾虑,以及我确实想讨论的一些限制。但我认为,这将改变我们的工作方式。
你可以将此功能与其他一些特性结合使用,比如通过手机完全远程操控电脑进行调度,这想想就令人惊叹。
所以在这个视频中,我想带大家了解这个功能具体是做什么的,它的局限性是什么,它的能力有哪些,以及在你开始授予关键权限之前需要考虑的其他一些方面。好了,那我们开始吧。
好的,那么发布会正式开始。X平台上的公告视频在短短近5小时内,观看量已突破1500万次,这简直令人难以置信。但Anthropic公司近期确实势如破竹,他们接连发布新功能,而且每一个都极具实用性,绝非华而不实的噱头。
Anthropic并非花招。Anthropic以极其自然的方式行事,这与他们自动化知识工作的总体目标是一致的。现在很多人会将这些新功能与open claw进行比较,我认为这已不再公平。
主题功能的发布非常审慎,它们主要面向知识工作者,而非助手、聊天机器人或代理。而Open Call更像是一个带有友好语气的个人助手,这与anthropic的发布风格不同。好的,那么这次新的anthropic发布。
因此,这项新功能与调度功能协同工作。您可以在协作环境中使用它,同样,如果它运行在Clot桌面环境中,也可以在Clot代码中使用。我认为其中部分功能与Clot桌面相关。
我认为其中一些技术是由U Sept驱动的,这是一家初创公司,最近被Anthropic收购,时间还不到一个月,但他们似乎已经取得了相当不错的进展。传统上,当人们……
传统上,当人们讨论计算机使用代理时,他们主要谈论的是浏览和控制代理。这是我们过去所见的模式。然而,借助这项新的计算机使用能力,anthropic将其提升到了一个全新的层次。他们实际上在探讨如何控制你的计算机。
所以,控制你电脑的代理程序能够使用任何正在运行的应用,目前仅限于Mac OS设备。根据他们的公告,Windows和Linux的支持即将推出。
要启用此功能,您需要升级云桌面应用,以便与调度功能配合使用。同时,您也需要更新手机应用。升级完成后,您将看到计算机使用选项,需要手动启用,并且该功能还需要额外的设置。
它还需要额外的辅助功能选项,因为它将使用你的电脑。这是按应用进行的。所以我认为它会向你请求权限。这样,Clot就能像你一样截取屏幕截图并控制鼠标和键盘。
好的,在演示其工作原理之前,我们先谈谈当前的一些限制。你的桌面需要处于活动状态。对于复杂任务,它可能需要尝试几次,而且运行速度可能会非常慢。
它可能非常缓慢,有时慢得令人痛苦,而你只能坐在那里眼睁睁看着它运行。但当你远离电脑,用手机执行操作时——不仅仅是运行代码,还能实际使用不同应用——这就变得极其有用。
然后它只能使用不同的应用程序。并且,它仅适用于Pro和Max套餐。现在,仅适用于Pro和Max套餐。现在,仅适用于Pro和Max套餐。现在,对于它具体能做什么存在限制。因此,一些约束条件包括它不会参与股票交易或投资互动,不会处理敏感数据,也不会收集和扫描面部图像。
这些是面部图像。这些是面部图像。这些是它不会做的事情,它不会做的事情,它不会做的事情,浏览器以及为这些浏览器插入数据,为这些浏览器插入数据,为这些浏览器插入数据,你可能只想使用Chrome扩展程序。现在需要注意的一点是,它拥有记忆。所以需要非常注意,它拥有记忆。所以需要非常注意,它拥有记忆。
太酷了,岩石有记忆,这意味着云太酷了,岩石有记忆,这意味着云太酷了,岩石有记忆,这意味着云可以学习你的工作方式并保留可以学习你的工作方式并保留可以学习你的工作方式并保留跨会话的上下文。你不想跨会话的上下文。你不想跨会话的上下文。你不想可能分享任何敏感可能分享任何敏感可能分享任何敏感信息。信息。信息。现在你可能还记得Windows中的回忆现在你可能还记得Windows中的回忆现在你可能还记得Windows中的回忆功能。这是功能。这是功能。这是
这是Microsoft原本打算发布的一项功能,但随后遭遇了巨大的反对声浪,他们因此决定不予推出。然而现在,借助云端的计算机使用这类特性,我们实际上正在大力增强Windows曾经拥有的召回功能。
为了展示一个实例,我们可以让它利用你的电脑功能,在Mac OS上打开DaVinci Resolve应用,并告诉我我们最近处理的项目是什么。在某些情况下,这会在执行任何操作前请求我们的许可。
在进行任何操作前,都需要获得许可。所以,现在你可以看到,它正在请求我允许它在此特定会话中使用Dainci Resolve。现在,我们将允许这一请求。此外,你还可以利用调度功能,实现同一台计算机的使用能力。
现在它已经打开了,在另一个窗口打开了达芬奇软件,过程中它会截取屏幕截图以确保能看到窗口。我的屏幕录制正在干扰它。好吧,这确实挺有意思的,有趣的是它居然能做到这一点。
有趣的是,它确实能在不同显示器之间切换,确实能在不同显示器之间切换,确实能在不同显示器之间切换。好的,我实际上把达芬奇调到了同一个屏幕上,调到了同一个屏幕上,调到了同一个屏幕上,就是我们运行云桌面应用的那个屏幕,就是我们运行云桌面应用的那个屏幕,就是我们运行云桌面应用的那个屏幕。嗯,所以它现在正在屏幕之间切换,嗯,所以它现在正在屏幕之间切换,嗯,所以它现在正在屏幕之间切换。嗯,这确实非常有趣,嗯,这确实非常有趣,嗯,这确实非常有趣。我想它已经搞明白了,我想它已经搞明白了,我想它已经搞明白了。
我想它已经精确地定位到了达芬奇软件的位置。没错,就在这里。现在它能够点击不同的窗口,操作方式完全模拟人类的行为,可以原生地使用这些应用程序。不过在这个过程中,它的运行速度可能会非常缓慢,这一点需要留意。
所以如果你决定使用这个应用,请记住这一点。然后你决定使用这个应用。接着你决定使用这个应用。基于这一点,基本上这些就是基于这一点,基本上这些就是基于这一点,基本上这些就是我处理过的不同窗口或不同视频。现在让我们看看我处理过的视频。现在让我们看看我处理过的视频。现在让我们看看,如果我请求它,呃,你能去城市银行的网站并登录吗?我会提供给你登录信息。
可能是通过登录信息。它可能会使用Chrome或Chrome云服务,但提示我无法代表你登录银行网站。请使用你自己的电脑,通过代理打开Chrome浏览器,访问花旗银行网站,然后我会指导你如何登录。好的。
实际上,它要访问Chrome。不过上面说,我无法输入你的登录凭据。所以,这其实是个不错的功能。
在计算机使用能力之上,还有一层安全防护,这确实很不错,也正是你期望从用于知识工作的智能体那里得到的。目前这些都还处于非常早期的阶段。
我会更全面地测试它,并分享我的体验,但它的功能简直令人惊叹,现在正是参与其中的激动时刻。无论如何,请务必去看看,链接会放在视频描述里。请告诉我你的想法。
请告诉我你的想法。你能看到哪些不同的应用场景?你能看到哪些不同的应用场景?你能看到哪些不同的应用场景?你能看到这种方法可能带来哪些潜在问题?你能看到这种方法可能带来哪些潜在问题?你能看到这种方法可能带来哪些潜在问题?无论如何,我希望你觉得这个视频有用。无论如何,我希望你觉得这个视频有用。无论如何,我希望你觉得这个视频有用。感谢观看,一如既往,我们下期再见。感谢观看,一如既往,我们下期再见。感谢观看,一如既往,我们下期再见。