我如何每天自动化制作Instagram Reels（完整教程）【实操视频】

▶ How I Post 20+ Automated Instagram Reels A Day (Claude Code Tutorial)

Emil Faschang 油管AI课堂 2026-03-28 有操作演示

总结这个视频教你如何用一套自动化系统，只需输入一句话，就能生成完整的Instagram Reels短视频，涵盖从脚本到发布的全部流程。

工具 - 核心平台：Cloud Code, Claude Code; - AI与生成工具：HeyGen（AI虚拟形象）， Whisper（语音转录）， BO3.1 / VO3.1（AI生成语

建议 1. 先跑通流程：按照视频描述中的MD文件指南，先在本地尝试复现整个系统，理解每个环节的输入输出。

播客音频

Emil Fas_我如何每天自动化制作Instagram Reels（完整教程）【实操视频】

一句话总结

这个视频教你如何用一套自动化系统，只需输入一句话，就能生成完整的Instagram Reels短视频，涵盖从脚本到发布的全部流程。

核心论点展开

痛点与解决方案

. 以前做视频要花好几个小时，现在全自动化了。

. 核心方法：在Cloud Code里输入一句话创意，系统就会自动执行所有步骤。

系统工作全流程

. 第一步：生成脚本与虚拟形象

. 系统会先研究主题，并生成一个100字左右、节奏快的Reels脚本。

. 然后用HeyGen工具生成一个口型同步的4K AI虚拟形象来念稿子。

. 第二步：处理音频与字幕

. 用FFmpeg把虚拟形象视频加速到1.1倍，让语速更自然。

. 用Whisper给视频加上精确的时间戳，为添加字幕做准备。

. 第三步：寻找与筛选素材

. 系统会从YouTube、Reddit等地方自动寻找B-roll空镜头素材。

. 通过Claw Code评估每个素材是否合适，合适的才会进入下一阶段。

. 第四步：规划故事板

. 故事板代理会根据字幕和时间戳，把视频规划成10-15个片段。

. 并为每个片段匹配合适的B-roll素材，确保画面和内容对应。

. 第五步：填补视觉空白

. 如果缺少真实素材，会用维基百科的图片和BO3.1 AI生成的画面来补充。

. 第六步：组装与渲染视频

. 组装代理把所有素材整合到一起。

. 用Remotion技能渲染成Instagram Reels格式（1080x1920）的分屏视频，每秒25帧。

. 第七步：最终审核与发布

. 审核代理会逐帧检查视频，确保画面和内容匹配。

. 审核通过后，一个带字幕、最长45秒的完整视频就生成了，并可自动发布。

系统的灵活性与控制

. 整个流程由Claude Code作为指挥中心来驱动和做智能决策。

. 你可以随时干预，比如调整字幕颜色、视频格式（如全屏虚拟形象）。

. 可以设置为“YOLO模式”，让系统全自动运行，无需每一步都手动批准。

关键数据与案例

. 案例演示：输入指令“做一段视频，讲讲当前伊朗局势以及它怎么影响人工智能领域”，系统最终生成了一个讲述伊朗战争如何分裂AI产业、涉及五角大楼、OpenAI等事件的视频。

. 效率提升：从过去耗时数小时，到现在可以设定任务后离开，回来视频就已制作完成。

. 视频规格：最终成品为Instagram Reels格式，分辨率1080x1920，最长45秒，25帧/秒。

提到的工具/产品/技术

. 核心平台：Cloud Code, Claude Code

. AI与生成工具：HeyGen（AI虚拟形象）， Whisper（语音转录）， BO3.1 / VO3.1（AI生成语音/片段）

. 视频处理工具：FFmpeg（视频加速）， Remotion（视频渲染与剪辑）

. 素材搜集工具：Playwright（自动化浏览器操作，用于截取网页素材）

. 素材来源：YouTube, Reddit, 维基百科

金句

. “一场战争就这么揭示了人工智能最核心的问题：到底谁在控制这些系统？是政府，还是造它们的公司？”

. “我可以设定好任务就去吃午饭，回来视频就做好了。”

. “这可不是一次性的，实际上这是一套端到端的视频生成流程。”

对 Vibe Coder 的价值

. 效率范式：展示如何将复杂、重复的创作工作流（如短视频制作）彻底自动化，解放时间。

. 系统设计参考：提供了一个多智能体（六个代理）协作、分阶段质检的复杂系统设计范例，可借鉴到其他自动化项目中。

. 工具链集成：实战演示了如何将Claude Code作为“大脑”，灵活调度FFmpeg、Remotion、Playwright等专业工具，完成多媒体生产任务。

. 即刻可用的资源：视频作者提供了一个免费的MD文件配置指南，可以直接在Claude Code中导入并搭建同款系统，学习成本低。

建议

先跑通流程：按照视频描述中的MD文件指南，先在本地尝试复现整个系统，理解每个环节的输入输出。

针对性改造：在理解流程后，可以根据自己的需求修改细节，比如视频尺寸、字幕样式、素材来源偏好（例如替换为中文平台）。

控制与放手：初期建议保留关键节点的“批准”环节，确保质量。熟练后，可以像作者一样开启“YOLO模式”实现完全自动化。

思维扩展：这套“一句话生成复杂成果”的范式，可以思考如何迁移到其他内容领域（如自动化写文章、做PPT、生成数据分析报告）。

我曾日复一日地耗费数小时制作Instagram短视频，如今却已不再如此。

现在，我只需在Cloud Code中输入一句话，只需在Cloud Code中输入一句话，只需在Cloud Code中输入一句话，它就会自动研究主题，自动研究主题，自动研究主题，生成脚本，生成AI生成脚本，生成AI生成脚本，生成AI虚拟形象来朗读脚本，寻找B-roll素材，虚拟形象来朗读脚本，寻找B-roll素材，虚拟形象来朗读脚本，寻找B-roll素材，编辑视频，添加字幕，编辑视频，添加字幕，编辑视频，添加字幕，并自动为我发布到Instagram上，自动为我发布到Instagram上，自动为我发布到Instagram上。我将带你一步步了解我的流程。

今天我将详细展示我的完整配置，以便你也能在本地搭建起整个系统。现在，让我播放一段专门为我制作的视频。我提出的要求仅仅是：制作一段关于当前伊朗局势及其如何影响人工智能领域的视频。而这就是最终的成果。

而这正是影响人工智能领域的关键所在。这就是它得出的结论。它得出的结论。它得出的结论。>>伊朗战争刚刚将人工智能产业一分为二。五角大楼利用熵公司的“利爪”系统识别美国对伊朗打击中的目标。当达里奥·阿莫德拒绝移除安全限制时，特朗普下令禁止熵公司参与所有联邦机构的业务。

数小时后，萨姆·阿尔曼火速介入，签署了OpenAI与五角大楼的专属协议。紧接着，一枚导弹击中了阿联酋的AWS数据中心，导致全球范围内的Claude和乍得GPT服务中断。一场战争刚刚揭示了人工智能领域最核心的问题：究竟是谁在掌控这些系统？是政府，还是企业？

政府还是建造它们的公司？正如我所说，这个视频的初衷源于我的一句话。

最终，它完成了整个头像的创建，为视频全程添加了字幕，并从维基百科及其他来源收集了真实的B-roll素材，确保视频拥有准确的背景画面，并使其成为适合Instagram分辨率的视频。当然，这远非完美。

现在，这远非完美，但这是一个极其艰巨的任务。我将详细为你讲解这个系统的运作方式，以便你能直接使用我目前拥有的这个版本。但请务必确保你已准备就绪。

但如果你想订阅频道，如果你想订阅频道，如果你想订阅频道，以便获取我未来版本的最新动态，因为这次我花了大约10天时间才达到这个阶段，同时还要处理一大堆其他事情。所以我就说到这里。

所以，一个月后我能进展到何种程度，就留给你去想象了。现在，话虽如此，这里的一切都是在云代码内部完成的。

我在这里有一个专门用于Omnifusion AI的reels文件夹，里面包含了所有的配置、针对特定功能的技能，以及一套完整的云端代码流程，每当我有视频创意时就可以直接调用。这听起来可能很简单，但我已经把它分解成了

但我已经把它分解成了一个复杂的系统，并且我要提供一个复杂的系统，还要给大家一个免费资源，这样你们就能自己动手搭建了。这个系统包含三个独立的AI模型、六个自主工作的智能体，并且在每一步都进行质量检查。现在，让我们开始吧。

现在，让我们一步步来。现在，我们来详细探讨在Cloud Code中制作视频的实际步骤。首先，我们需要进入前期流程，也就是编写脚本的阶段。这个脚本大约需要100字，并且节奏要快。我已经为此进行了专门的训练。

我专门训练它来撰写高效的Instagram Reels脚本。这一切都伴随着研究过程进行，它会实际找到我们将在Reels中呈现的信息。

现在，脚本完成后，我们利用Hey Gen生成一个4K分辨率的AI虚拟形象，并确保所有口型同步且完美对齐。顺便提一下，这些工作都不是我亲自完成的，全部由Claude Code负责。一旦AI虚拟形象准备就绪，Claude Code便会接手后续步骤。

一旦我们获得了AI虚拟形象，我们会使用FFmpeg的保音调功能将其加速至1.1倍速，这样在加快速度的同时不会导致音调升高。但将其加速至1.1倍速确实能让它感觉更加自然，因为默认情况下，这些虚拟形象的速度略显缓慢。接着，我们会对其进行转录。

我们随后进行转录，速度稍慢。接着，我们使用Whisper对整个视频进行转录，并配有时间戳，这样就能精确知道每个词是在何时被说出的。这对于后续添加字幕将极其有帮助。现在，让我们来详细了解一下它所遵循的六阶段流程。

现在，一旦我们实际开始操作。现在，一旦我们有了脚本，并且有了虚拟形象，我们首先需要的是用于制作B-roll镜头的素材。为此，我们会使用工具、网站、标志等的截图。

我们从Reddit、YouTube等平台获取视频素材，通过Claw Code对每个片段进行评估，判断其是否适合纳入最终视频。一旦通过筛选，便会将其整合进视频中。

现在，如果它通过了质量门，并且一切看起来都符合标准，这里没有问题，也没有需要修订的地方，那么它就会继续前进。但如果有需要修订的地方，它就会被退回。然而，一旦通过，它就会进入故事板代理阶段。接下来，故事板代理将接手处理。

现在，故事板代理利用字幕和时间戳，为视频规划出10到15个片段，并为每个片段匹配合适的B-roll素材。这就是为什么在我展示的视频中，当我们提到特朗普时，画面就出现了特朗普。

当我们提到萨姆·阿尔曼时，画面显示萨姆·阿尔曼。当我们提到Claude和阿尔特曼时，画面显示那些标志。这一切都由故事板代理完成，因为它决定何时展示哪个片段。如果一切顺利通过这里。

如果所有环节都通过，质量检查也合格，我们就会介入，填补视觉上的空白。视频中有些部分确实没有可用的真实素材，因此我们会用维基百科上的人物图片来补充。

所以，当特朗普出现时，萨姆·阿尔特曼也会出现；当特朗普出现时，萨姆·阿尔特曼也会出现；当特朗普出现时，萨姆·阿尔特曼也会出现，等等。实际上，我们会去维基百科获取他们的头像，然后将其用于视频中，并辅以BO3.1 AI生成的片段。现在，当你……

现在，请看屏幕上这个片段，或者甚至这栋建筑，这些都是由人工智能生成的，用来填补视频中的空白。一旦我们填补了视觉上的空缺，就转向组装代理。

现在，这是一个七点验证加上JSON配置，七点验证加上JSON配置，七点验证加上JSON配置，它将所有内容整合起来together，将所有内容整合起来together，将所有内容整合起来together，这样我们就能将所有内容集中在一处，将所有内容集中在一处，将所有内容集中在一处，并且我们已经准备好真正开始创建视频，真正开始创建视频，真正开始创建视频。从组装代理，我们转向Remotion渲染。现在，Remotion渲染，现在，Remotion渲染。

现在，Remotion是一项你可以使用的特定技能，非常适合视频编辑、产品演示等用途。我们利用渲染功能生成分屏效果，将Hey Gen虚拟形象置于底部，B-roll素材置于顶部。

这种分屏格式为180*1,920，这正是Instagram Reels的确切格式。我们以每秒25帧的速度进行渲染。一旦Remotion根据我们之前收集的所有素材完成视频渲染，我们便会进入审核代理阶段。

现在我们进入审核代理环节。审核代理之所以能够运作，是因为Claude Co能够实际观看视频。审核代理的功能是逐帧提取整个视频内容。

因此，它会从一段30秒的视频中采集50到100帧画面，并逐帧检查，以确保B-roll素材与视频中的解说内容相匹配。

如果此处有任何问题，修正循环会将其引导回第二阶段，故事板代理根据评审代理的反馈重新审视，整个流程将从头开始重新启动。

当审核代理通过后，结果是一个已完成的Instagram短视频，时长最多45秒，且已添加字幕。现在你可以根据实际需要调整45秒的时长要求，但在此案例中，输出的是一个分屏视频。

上半部分是动态的B-roll素材。接着，中间部分配有字幕，此处可见采用了紫色渐变效果，但这可根据您的需求进行调整，只需告知Claude进行修改即可。下半部分则是由Hey JJ生成的AI虚拟形象。

目前，我正在处理多种格式的视频内容，比如在原始视频中间添加黑边，上下留出黑色边框，然后简单地加入不同的文字变体。

我还在探索其他视频格式，其中一种设想是让虚拟形象占据全屏，同时将辅助镜头素材叠加其上。为此，你将需要用到HeyGen和Whisper这两个工具：Whisper负责生成字幕转录，而HeyGen则用于内容生成。

嘿，用于生成视频的基因。使用Remotion和ffmpeg来加速视频。使用Remotion和ffmpeg来加速视频。使用Remotion和ffmpeg来加速视频。用Remotion来实际编辑视频。用Remotion来实际编辑视频。用Remotion来实际编辑它。Claude是我们正在使用的Claude它。Claude是我们正在使用的Claude它。Claude是我们正在使用的claude code。所以，claw代码实际上将负责代码。所以，claw代码实际上将负责代码。所以，claw代码实际上将负责在这个流程中做出所有决策，所有智能的决策，所有智能的决策，所有智能的逻辑。VO3.1来生成那些AI生成的片段。

生成那些AI生成的片段。维基百科用于获取图片，而Playright实际上是它在资产生成过程中使用的一个工具，用于策划内容。

在整理素材时，它能利用Playright工具，在我的设备上启动浏览器，访问特定网站并滚动浏览，以获取所需的任何素材，比如网站截图或类似内容。这就是它的运作方式。

那么，在Claude Code内部的实际操作中，具体表现为我只需说“创建短视频”，然后提供一个创意点子。在这个例子中，Claude Code的表现优于ChatGPT。我始终开启着权限绕过功能。

我们称之为YOLO模式，这样在整个过程中它就不会反复请求我的许可，能够直接完成任务。如此一来，我可以启动任务后去用午餐，回来时视频就已经处理完毕。我还可以让它持续运行。

我也可以让它同时运行多个任务，只需简单按下回车键，它就会开始处理并实际生成整个Instagram短视频。正如你所见，如果我打开左侧的输出文件夹，就能看到所有这些内容。

你可以看到我制作的所有这些不同版本的视频，包括我向你展示过的那个带有伊朗AI视角的，还有我制作的大量其他视频，这样你就能明白这并非一次性事件。实际上，这是一个端到端的视频生成流程。

所以，端到端视频生成流程。他现在正在梳理整个流程，逐步检查每一个环节，以明确需要完成哪些步骤，并即将开始生成视频。我已经为你将这个过程变得极其简单。如果你已经在使用相关工具，那就更便捷了。

所以，如果你已经在使用Claude Code，我会在下方描述中放一个免费资源代码，我会在下方描述中放一个免费资源代码，我会在下方描述中放一个免费资源，那将是一个MD文件。只需下载那将是一个MD文件。只需下载那将是一个MD文件。

只需下载这个MD文件，将其放入你的云端代码中，并指示它构建整个流程，用于实现文件中详细说明的真实生成过程。它会引导你逐步操作，并在需要时向你询问任何信息。

它会向你询问任何它需要的信息，你可以告诉它你是否希望某些元素与我的不同，比如字幕的颜色或不同的片段。正如你所见，代码仍在运行中，它正在编写整个脚本。

它正在撰写整个脚本。整个脚本已经规划完毕，整个脚本已经规划完毕，整个脚本已经规划完毕。时长控制在45秒以内，时长控制在45秒以内，时长控制在45秒以内。现在正在生成虚拟形象，现在正在生成虚拟形象，现在正在生成虚拟形象。并且它将逐步演示，并且它将逐步演示，并且它将逐步演示整个流程。如你所见，现在，如你所见，现在，如你所见，现在虚拟形象已生成完毕。虚拟形象已生成完毕。虚拟形象已生成完毕。

它已经生成完毕，现在将以1.1倍速处理并利用Whisper技术对整个视频进行转录。虚拟形象现已准备就绪，即将启动流程来创建资产并生成完整的视频内容。

如你所见，智能管道已初始化。现在，让我运行资产管理器。由于这是关于云代码，一个终端工具，我将搜索相关的B-roll素材。所以，它不会去网站获取任何内容，因为它不是网络工具。

因为它并非网络工具，所以它会从不同来源寻找B-roll素材，实际上是从YouTube上查找内容。如你所见，在这个案例中，它已经完成了素材筛选工作。它批准了九个素材，包括三个YouTube视频片段、四张截图和一个标志。

它拒绝了一些截图和一个标志。有几张因为太暗被拒了，还有几张也因为太暗被拒了。现在它问我是否批准这个清单，因为我目前已经训练它要求批准。你可以移除那些批准关卡。所以，我打算继续并说是的。然后它将继续进行流程。

现在继续推进流程。已调用故事板代理，它将清晰规划所有内容，随后进入渲染阶段。如您所见，故事板现已准备就绪，所有片段均已规划完成，包含语音内容及对应画面。

它包含语音，并指定了我们要为视频的这一特定部分使用哪种素材。我现在要继续并批准这个分镜脚本。接下来将运行语音代理来获取一些AI生成的片段。现在已生成所有语音片段并已批准。

现在，它将开始组装并渲染整个视频。至此，视频已处理完毕，完成了整个流程。视频经过审核并渲染完成，最终成品就在这里。希望您能从本视频中有所收获，尽情享受这个Instagram视频带来的乐趣吧。

尽情体验这款Instagram AI真机，别忘了点赞哦，AI真机请点赞，AI真机请点赞，有任何问题请在下方留言，有问题请在下方留言，有问题请在下方留言，如果想订阅频道就订阅吧，想订阅频道就订阅吧，想订阅频道就订阅吧，以便未来能看到我正在构建项目的更新版本，以及所有未来构建项目的更新版本，以及所有未来构建项目的更新版本，还有云端代码的其他应用场景，云端代码的其他应用场景，云端代码的其他应用场景，以及如何在Instagram上赚更多钱，如何在Instagram上赚更多钱。

如何在Instagram上赚更多钱。布朗。

原视频导出PDF

📚 更多 AI 课程 🎙️ AI 每日资讯 🏠 Scimagine 主站

Scimagine · AI 学习资源一站式平台