语音输入不是要完全取代打字,而是帮你在那些“打字反而碍事”的知识工作环节里,解放双手,让思维更流畅。
混合型(工具评测 + 认知升级)
问题不该是“语音输入能不能取代打字”,因为这不是二选一。
真正的问题是:在你每天的工作里,有没有哪些地方,打字其实是在“挡你的路”?
一旦你找到这些环节,语音输入的价值就出现了。
用Whisper Flow直接口述一个很长的提示词给Claude,Claude就能立刻生成初稿。感觉就像和同事面对面协作,不用先费劲整理思路。
全程不用碰键盘,只用语音,就能和AI一起把一个网站构想“实现”出来。过程非常流畅。
找个舒服的地方,用手机对着Notion口述日记或回顾。这种方式能帮你更好地和自己内心想法相处,甚至修正你的语法,让表达更得体。
它不是“另一个听写工具”。
它的核心是:消除思想与表达之间的障碍。
早期最大的成功不是“变快了”,而是让“从想到说”这个过程没有阻力。
推荐你用它做这些事:
还是老老实实打字吧:
给新手的启动建议:
像视频里一样,给自己定个“一周挑战”,用它处理所有事情。即使开始很别扭,但这是发现它真正价值的最快方法。
需要表达复杂想法或长篇草稿? → 用语音输入。
在安静或私密环境? → 用语音输入。
需要精确格式、特殊符号,或在公共场所? → 用打字。
只是想快速确认或简单回复? → 用打字。
语音指令模板:
Whisper Flow设置思路:
值得看完整视频。因为团队真实的挣扎过程(网络卡、符号识别问题、从别扭到习惯)、以及关于“身份认同”的讨论,这些细节和感受是笔记无法完全传递的,能让你更直观地判断这工具适不适合自己。
想想你一天中有多少时间只是在写邮件、发Slack消息、向AI工具输入指令。现在,有个值得思考的问题:语音输入能否在真正的知识工作环境中取代打字?让我们一探究竟。
本视频由Whisper Flow赞助,这是一款AI语音听写应用。当他们联系我们时,我确实想亲自测试一下。Whisper Flow的宣传语是“无需打字,开口即说”。于是,我们照字面意思做了。
我请团队中的三位成员,用整整一周的工作时间,全面体验Whisper Flow处理所有事务。这才是我唯一愿意制作的赞助内容形式。来认识一下团队成员:朱莉娅是我们的总经理,她投入了大量时间……
她一天中的大部分时间都在沟通、战略规划、团队协调以及起草文件。阿莱西亚是我们的项目经理,她负责整个视频制作流程的运作。而尼科则是我们的视频编辑兼制片人。
这是三个截然不同的角色,三种迥异的写作任务,却面临同一项挑战:一周不能打字。所以,这次挑战我起步得有些艰难,网络速度慢得令人抓狂。
我注意到,每次使用依赖稳定网络的Whisper Flow时,总会收到烦人的提示:“处理时间超出预期。”请将这句话改得更简洁友好。
就像任何基于云的工具,无论是Slack、Notion还是语音应用,一旦网络连接中断,一切都会变慢。>> 这可能只是我的网络连接太慢了。>> 等等,重试一下。我仍然在格式设置上遇到问题。
有时需要手动纠正大写字母。Whisper流有时需要手动纠正大写字母。Whisper流有时需要手动纠正大写字母。
Whisper Flow有时在识别符号时会遇到困难,比如在聊天中想要标记某人时使用的井号或@符号。例如,我当时在一个共享办公空间工作,周围有其他人,我不想打扰任何人,而且我已经习惯了用声音与AI交流,所以不使用Whisper Flow工作变得相当困难,但同时又因为周围环境而无法使用它。
今天我着手设置我的风格偏好,并为自己配置了代码片段。通常我需要从某处复制URL,但有了代码片段,我只需输入“notion模板”,我们第二大脑Notion模板的URL就会立刻出现。
大脑概念模板即将推出。这真的非常非常有用。另一个效果很好的做法是,我在词典中添加了一些第二大脑的缩写。例如,这确实帮助我直接将思维过程传达给AI,而无需整理思路。
当你口述提示词而非打字输入时,你不再预先编辑脑海中涌现的思绪。你不再抑制那些漫谈的念头。而事实证明,这种看似散漫的表达往往正是人工智能理解你真实需求的关键所在。
>> 当我只想向AI倾倒思绪时,按下功能键再按空格,我就能完全松开功能键,它会继续录制我的声音。
>> 早期的最大成功并非关乎速度,而在于消除了障碍。
它们旨在消除思想与表达之间的障碍。到了周中,我察觉到团队中发生了某种变化。今天与Whisper Flow和Claude的合作会议非常出色,我只需口述即可。
我会用Whisper Flow向Claude口述我的初步想法和愿景,先给它一个相当长的提示作为起点,然后Claude就会生成初稿。这感觉几乎就像和同事坐下来一起工作一样。
我向他们阐述我对网站的构想,他们立刻就能实时实现。整个过程感觉非常轻松流畅。借助耳语流技术,我甚至能全程免提创建出一个完整的小型应用。
免提功能确实非常非常有用,帮我节省了大量的时间。我终于解决了关于标点和格式的困扰。我只需说“开括号,听写,然后闭括号”或“开引号,听写,闭引号”。我还可以高亮显示文本。
我还可以高亮想要在社交媒体上大写的文本。点击功能命令激活媒体。点击功能命令激活命令模式,只需说让它大写。所以当我真正习惯并身体记住这些快捷方式时,这变得非常非常有帮助。
我想,让我稍微慢下来的原因,是我经常需要修正标点符号。公平地说,Whisper Flow 在其设置中确实提供了不同的格式和编辑风格。团队尝试了这些设置后,情况有所改善。
它并未彻底解决所有应用场景的问题,但定制化功能确实存在。我肯定会继续使用它,在合适的场景下。
有些场景下它完全适用,而另一些场景下,它反而增加了不必要的阻力,实际上拖慢了进度。
但我觉得这个实验最有趣的地方,也是我们团队反复探讨的焦点,其实并不在于功能本身。它关乎的是一些更为私人的层面——是我在说话、口述,还是我在打字。
这其实是两种不同的身份,内向型身份和外向型身份,风格也截然不同。她并非在描述某种效率工具,而是在描绘自己的两个不同版本。
我想这是我们许多人都能体会到的,即便我们之前从未用言语表达过。我找了个舒适的地方,拿出手机,打开我用来做回顾的Notion应用,然后直接用Whis进行语音输入,让它流畅地记录下我的想法。
它确实帮助我更好地与自己及内心思绪相处。我戴着这款耳机,测试了它的耳语模式。告诉你一个大秘密:它的转录功能完美无缺。我说的是"我测试了耳语模式,效果非常好",而它记录下来的正是如此。
“但我测试了耳语模式,效果确实很好。它修正了我的语法,让我听起来更得体。”那么,耳语流能替代打字吗?并不完全如此,实际上我甚至想质疑这个问题本身,因为这并非非此即彼的选择。更好的问题是……
真正的问题并非二选一,而是:在你的知识工作中,是否存在某些环节,打字反而带来了不必要的阻力?对我们团队而言,答案显然是肯定的。一旦他们发现了这些环节,Whisper Flow就发挥了真正的作用。以下是他们实际推荐的使用场景。
他们实际上会建议你将其用于:引导AI工具、写日记与反思、撰写长篇草稿、提供反馈与评论,以及任何你需要解释自己而非仅仅确认某个狭隘观点的情况。接下来请继续输入内容。如果你正处于...
如果你身处嘈杂的咖啡馆或其他地方,如果说话让你感到不自在,或许打字会更适合。但在安静的环境中,比如办公室,即使周围有人,语音输入也能顺畅使用。处理电子表格数据,或是任何需要精确格式或特殊符号的内容时,打字仍是更好的选择。
我真心建议每个人都去尝试一下。如果你想开始使用Whisper Flow,不妨设定一个和我们一样的挑战,为期一周,尝试用它处理所有事务。
即使感觉有点费力,但正是这种费力,能让你真正习惯它。Whisper Flow的链接在描述区。接受挑战试试看,我相信你会让自己大吃一惊。