我如何每天自动化制作Instagram Reels(完整教程)【实操视频】

Emil Faschang 油管AI课堂 2026-03-28 有操作演示
总结 这个视频教你如何用一套自动化系统,只需输入一句话,就能生成完整的Instagram Reels短视频,涵盖从脚本到发布的全部流程。
工具 - 核心平台:Cloud Code, Claude Code; - AI与生成工具:HeyGen(AI虚拟形象), Whisper(语音转录), BO3.1 / VO3.1(AI生成语
建议 1. 先跑通流程:按照视频描述中的MD文件指南,先在本地尝试复现整个系统,理解每个环节的输入输出。
播客音频
Emil Fas_我如何每天自动化制作Instagram Reels(完整教程)【实操视频】
一句话总结

这个视频教你如何用一套自动化系统,只需输入一句话,就能生成完整的Instagram Reels短视频,涵盖从脚本到发布的全部流程。

核心论点展开
痛点与解决方案
. 以前做视频要花好几个小时,现在全自动化了。
. 核心方法:在Cloud Code里输入一句话创意,系统就会自动执行所有步骤。
系统工作全流程
. 第一步:生成脚本与虚拟形象
. 系统会先研究主题,并生成一个100字左右、节奏快的Reels脚本。
. 然后用HeyGen工具生成一个口型同步的4K AI虚拟形象来念稿子。
. 第二步:处理音频与字幕
. 用FFmpeg把虚拟形象视频加速到1.1倍,让语速更自然。
. 用Whisper给视频加上精确的时间戳,为添加字幕做准备。
. 第三步:寻找与筛选素材
. 系统会从YouTube、Reddit等地方自动寻找B-roll空镜头素材。
. 通过Claw Code评估每个素材是否合适,合适的才会进入下一阶段。
. 第四步:规划故事板
. 故事板代理会根据字幕和时间戳,把视频规划成10-15个片段。
. 并为每个片段匹配合适的B-roll素材,确保画面和内容对应。
. 第五步:填补视觉空白
. 如果缺少真实素材,会用维基百科的图片和BO3.1 AI生成的画面来补充。
. 第六步:组装与渲染视频
. 组装代理把所有素材整合到一起。
. 用Remotion技能渲染成Instagram Reels格式(1080x1920)的分屏视频,每秒25帧。
. 第七步:最终审核与发布
. 审核代理会逐帧检查视频,确保画面和内容匹配。
. 审核通过后,一个带字幕、最长45秒的完整视频就生成了,并可自动发布。
系统的灵活性与控制
. 整个流程由Claude Code作为指挥中心来驱动和做智能决策。
. 你可以随时干预,比如调整字幕颜色、视频格式(如全屏虚拟形象)。
. 可以设置为“YOLO模式”,让系统全自动运行,无需每一步都手动批准。
关键数据与案例
. 案例演示:输入指令“做一段视频,讲讲当前伊朗局势以及它怎么影响人工智能领域”,系统最终生成了一个讲述伊朗战争如何分裂AI产业、涉及五角大楼、OpenAI等事件的视频。
. 效率提升:从过去耗时数小时,到现在可以设定任务后离开,回来视频就已制作完成。
. 视频规格:最终成品为Instagram Reels格式,分辨率1080x1920,最长45秒,25帧/秒。
提到的工具/产品/技术
. 核心平台:Cloud Code, Claude Code
. AI与生成工具:HeyGen(AI虚拟形象), Whisper(语音转录), BO3.1 / VO3.1(AI生成语音/片段)
. 视频处理工具:FFmpeg(视频加速), Remotion(视频渲染与剪辑)
. 素材搜集工具:Playwright(自动化浏览器操作,用于截取网页素材)
. 素材来源:YouTube, Reddit, 维基百科
金句
. “一场战争就这么揭示了人工智能最核心的问题:到底谁在控制这些系统?是政府,还是造它们的公司?”
. “我可以设定好任务就去吃午饭,回来视频就做好了。”
. “这可不是一次性的,实际上这是一套端到端的视频生成流程。”
对 Vibe Coder 的价值
. 效率范式:展示如何将复杂、重复的创作工作流(如短视频制作)彻底自动化,解放时间。
. 系统设计参考:提供了一个多智能体(六个代理)协作、分阶段质检的复杂系统设计范例,可借鉴到其他自动化项目中。
. 工具链集成:实战演示了如何将Claude Code作为“大脑”,灵活调度FFmpeg、Remotion、Playwright等专业工具,完成多媒体生产任务。
. 即刻可用的资源:视频作者提供了一个免费的MD文件配置指南,可以直接在Claude Code中导入并搭建同款系统,学习成本低。
建议
先跑通流程:按照视频描述中的MD文件指南,先在本地尝试复现整个系统,理解每个环节的输入输出。
针对性改造:在理解流程后,可以根据自己的需求修改细节,比如视频尺寸、字幕样式、素材来源偏好(例如替换为中文平台)。
控制与放手:初期建议保留关键节点的“批准”环节,确保质量。熟练后,可以像作者一样开启“YOLO模式”实现完全自动化。
思维扩展:这套“一句话生成复杂成果”的范式,可以思考如何迁移到其他内容领域(如自动化写文章、做PPT、生成数据分析报告)。

我曾日复一日地耗费数小时制作Instagram短视频,如今却已不再如此。

现在,我只需在Cloud Code中输入一句话,只需在Cloud Code中输入一句话,只需在Cloud Code中输入一句话,它就会自动研究主题,自动研究主题,自动研究主题,生成脚本,生成AI生成脚本,生成AI生成脚本,生成AI虚拟形象来朗读脚本,寻找B-roll素材,虚拟形象来朗读脚本,寻找B-roll素材,虚拟形象来朗读脚本,寻找B-roll素材,编辑视频,添加字幕,编辑视频,添加字幕,编辑视频,添加字幕,并自动为我发布到Instagram上,自动为我发布到Instagram上,自动为我发布到Instagram上。我将带你一步步了解我的流程。

今天我将详细展示我的完整配置,以便你也能在本地搭建起整个系统。现在,让我播放一段专门为我制作的视频。我提出的要求仅仅是:制作一段关于当前伊朗局势及其如何影响人工智能领域的视频。而这就是最终的成果。

而这正是影响人工智能领域的关键所在。这就是它得出的结论。它得出的结论。它得出的结论。>>伊朗战争刚刚将人工智能产业一分为二。五角大楼利用熵公司的“利爪”系统识别美国对伊朗打击中的目标。当达里奥·阿莫德拒绝移除安全限制时,特朗普下令禁止熵公司参与所有联邦机构的业务。

数小时后,萨姆·阿尔曼火速介入,签署了OpenAI与五角大楼的专属协议。紧接着,一枚导弹击中了阿联酋的AWS数据中心,导致全球范围内的Claude和乍得GPT服务中断。一场战争刚刚揭示了人工智能领域最核心的问题:究竟是谁在掌控这些系统?是政府,还是企业?

政府还是建造它们的公司?正如我所说,这个视频的初衷源于我的一句话。

最终,它完成了整个头像的创建,为视频全程添加了字幕,并从维基百科及其他来源收集了真实的B-roll素材,确保视频拥有准确的背景画面,并使其成为适合Instagram分辨率的视频。当然,这远非完美。

现在,这远非完美,但这是一个极其艰巨的任务。我将详细为你讲解这个系统的运作方式,以便你能直接使用我目前拥有的这个版本。但请务必确保你已准备就绪。

但如果你想订阅频道,如果你想订阅频道,如果你想订阅频道,以便获取我未来版本的最新动态,因为这次我花了大约10天时间才达到这个阶段,同时还要处理一大堆其他事情。所以我就说到这里。

所以,一个月后我能进展到何种程度,就留给你去想象了。现在,话虽如此,这里的一切都是在云代码内部完成的。

我在这里有一个专门用于Omnifusion AI的reels文件夹,里面包含了所有的配置、针对特定功能的技能,以及一套完整的云端代码流程,每当我有视频创意时就可以直接调用。这听起来可能很简单,但我已经把它分解成了

但我已经把它分解成了一个复杂的系统,并且我要提供一个复杂的系统,还要给大家一个免费资源,这样你们就能自己动手搭建了。这个系统包含三个独立的AI模型、六个自主工作的智能体,并且在每一步都进行质量检查。现在,让我们开始吧。

现在,让我们一步步来。现在,我们来详细探讨在Cloud Code中制作视频的实际步骤。首先,我们需要进入前期流程,也就是编写脚本的阶段。这个脚本大约需要100字,并且节奏要快。我已经为此进行了专门的训练。

我专门训练它来撰写高效的Instagram Reels脚本。这一切都伴随着研究过程进行,它会实际找到我们将在Reels中呈现的信息。

现在,脚本完成后,我们利用Hey Gen生成一个4K分辨率的AI虚拟形象,并确保所有口型同步且完美对齐。顺便提一下,这些工作都不是我亲自完成的,全部由Claude Code负责。一旦AI虚拟形象准备就绪,Claude Code便会接手后续步骤。

一旦我们获得了AI虚拟形象,我们会使用FFmpeg的保音调功能将其加速至1.1倍速,这样在加快速度的同时不会导致音调升高。但将其加速至1.1倍速确实能让它感觉更加自然,因为默认情况下,这些虚拟形象的速度略显缓慢。接着,我们会对其进行转录。

我们随后进行转录,速度稍慢。接着,我们使用Whisper对整个视频进行转录,并配有时间戳,这样就能精确知道每个词是在何时被说出的。这对于后续添加字幕将极其有帮助。现在,让我们来详细了解一下它所遵循的六阶段流程。

现在,一旦我们实际开始操作。现在,一旦我们有了脚本,并且有了虚拟形象,我们首先需要的是用于制作B-roll镜头的素材。为此,我们会使用工具、网站、标志等的截图。

我们从Reddit、YouTube等平台获取视频素材,通过Claw Code对每个片段进行评估,判断其是否适合纳入最终视频。一旦通过筛选,便会将其整合进视频中。

现在,如果它通过了质量门,并且一切看起来都符合标准,这里没有问题,也没有需要修订的地方,那么它就会继续前进。但如果有需要修订的地方,它就会被退回。然而,一旦通过,它就会进入故事板代理阶段。接下来,故事板代理将接手处理。

现在,故事板代理利用字幕和时间戳,为视频规划出10到15个片段,并为每个片段匹配合适的B-roll素材。这就是为什么在我展示的视频中,当我们提到特朗普时,画面就出现了特朗普。

当我们提到萨姆·阿尔曼时,画面显示萨姆·阿尔曼。当我们提到Claude和阿尔特曼时,画面显示那些标志。这一切都由故事板代理完成,因为它决定何时展示哪个片段。如果一切顺利通过这里。

如果所有环节都通过,质量检查也合格,我们就会介入,填补视觉上的空白。视频中有些部分确实没有可用的真实素材,因此我们会用维基百科上的人物图片来补充。

所以,当特朗普出现时,萨姆·阿尔特曼也会出现;当特朗普出现时,萨姆·阿尔特曼也会出现;当特朗普出现时,萨姆·阿尔特曼也会出现,等等。实际上,我们会去维基百科获取他们的头像,然后将其用于视频中,并辅以BO3.1 AI生成的片段。现在,当你……

现在,请看屏幕上这个片段,或者甚至这栋建筑,这些都是由人工智能生成的,用来填补视频中的空白。一旦我们填补了视觉上的空缺,就转向组装代理。

现在,这是一个七点验证加上JSON配置,七点验证加上JSON配置,七点验证加上JSON配置,它将所有内容整合起来together,将所有内容整合起来together,将所有内容整合起来together,这样我们就能将所有内容集中在一处,将所有内容集中在一处,将所有内容集中在一处,并且我们已经准备好真正开始创建视频,真正开始创建视频,真正开始创建视频。从组装代理,我们转向Remotion渲染。现在,Remotion渲染,现在,Remotion渲染。

现在,Remotion是一项你可以使用的特定技能,非常适合视频编辑、产品演示等用途。我们利用渲染功能生成分屏效果,将Hey Gen虚拟形象置于底部,B-roll素材置于顶部。

这种分屏格式为180*1,920,这正是Instagram Reels的确切格式。我们以每秒25帧的速度进行渲染。一旦Remotion根据我们之前收集的所有素材完成视频渲染,我们便会进入审核代理阶段。

现在我们进入审核代理环节。审核代理之所以能够运作,是因为Claude Co能够实际观看视频。审核代理的功能是逐帧提取整个视频内容。

因此,它会从一段30秒的视频中采集50到100帧画面,并逐帧检查,以确保B-roll素材与视频中的解说内容相匹配。

如果此处有任何问题,修正循环会将其引导回第二阶段,故事板代理根据评审代理的反馈重新审视,整个流程将从头开始重新启动。

当审核代理通过后,结果是一个已完成的Instagram短视频,时长最多45秒,且已添加字幕。现在你可以根据实际需要调整45秒的时长要求,但在此案例中,输出的是一个分屏视频。

上半部分是动态的B-roll素材。接着,中间部分配有字幕,此处可见采用了紫色渐变效果,但这可根据您的需求进行调整,只需告知Claude进行修改即可。下半部分则是由Hey JJ生成的AI虚拟形象。

目前,我正在处理多种格式的视频内容,比如在原始视频中间添加黑边,上下留出黑色边框,然后简单地加入不同的文字变体。

我还在探索其他视频格式,其中一种设想是让虚拟形象占据全屏,同时将辅助镜头素材叠加其上。为此,你将需要用到HeyGen和Whisper这两个工具:Whisper负责生成字幕转录,而HeyGen则用于内容生成。

嘿,用于生成视频的基因。使用Remotion和ffmpeg来加速视频。使用Remotion和ffmpeg来加速视频。使用Remotion和ffmpeg来加速视频。用Remotion来实际编辑视频。用Remotion来实际编辑视频。用Remotion来实际编辑它。Claude是我们正在使用的Claude它。Claude是我们正在使用的Claude它。Claude是我们正在使用的claude code。所以,claw代码实际上将负责代码。所以,claw代码实际上将负责代码。所以,claw代码实际上将负责在这个流程中做出所有决策,所有智能的决策,所有智能的决策,所有智能的逻辑。VO3.1来生成那些AI生成的片段。

生成那些AI生成的片段。维基百科用于获取图片,而Playright实际上是它在资产生成过程中使用的一个工具,用于策划内容。

在整理素材时,它能利用Playright工具,在我的设备上启动浏览器,访问特定网站并滚动浏览,以获取所需的任何素材,比如网站截图或类似内容。这就是它的运作方式。

那么,在Claude Code内部的实际操作中,具体表现为我只需说“创建短视频”,然后提供一个创意点子。在这个例子中,Claude Code的表现优于ChatGPT。我始终开启着权限绕过功能。

我们称之为YOLO模式,这样在整个过程中它就不会反复请求我的许可,能够直接完成任务。如此一来,我可以启动任务后去用午餐,回来时视频就已经处理完毕。我还可以让它持续运行。

我也可以让它同时运行多个任务,只需简单按下回车键,它就会开始处理并实际生成整个Instagram短视频。正如你所见,如果我打开左侧的输出文件夹,就能看到所有这些内容。

你可以看到我制作的所有这些不同版本的视频,包括我向你展示过的那个带有伊朗AI视角的,还有我制作的大量其他视频,这样你就能明白这并非一次性事件。实际上,这是一个端到端的视频生成流程。

所以,端到端视频生成流程。他现在正在梳理整个流程,逐步检查每一个环节,以明确需要完成哪些步骤,并即将开始生成视频。我已经为你将这个过程变得极其简单。如果你已经在使用相关工具,那就更便捷了。

所以,如果你已经在使用Claude Code,我会在下方描述中放一个免费资源代码,我会在下方描述中放一个免费资源代码,我会在下方描述中放一个免费资源,那将是一个MD文件。只需下载那将是一个MD文件。只需下载那将是一个MD文件。

只需下载这个MD文件,将其放入你的云端代码中,并指示它构建整个流程,用于实现文件中详细说明的真实生成过程。它会引导你逐步操作,并在需要时向你询问任何信息。

它会向你询问任何它需要的信息,你可以告诉它你是否希望某些元素与我的不同,比如字幕的颜色或不同的片段。正如你所见,代码仍在运行中,它正在编写整个脚本。

它正在撰写整个脚本。整个脚本已经规划完毕,整个脚本已经规划完毕,整个脚本已经规划完毕。时长控制在45秒以内,时长控制在45秒以内,时长控制在45秒以内。现在正在生成虚拟形象,现在正在生成虚拟形象,现在正在生成虚拟形象。并且它将逐步演示,并且它将逐步演示,并且它将逐步演示整个流程。如你所见,现在,如你所见,现在,如你所见,现在虚拟形象已生成完毕。虚拟形象已生成完毕。虚拟形象已生成完毕。

它已经生成完毕,现在将以1.1倍速处理并利用Whisper技术对整个视频进行转录。虚拟形象现已准备就绪,即将启动流程来创建资产并生成完整的视频内容。

如你所见,智能管道已初始化。现在,让我运行资产管理器。由于这是关于云代码,一个终端工具,我将搜索相关的B-roll素材。所以,它不会去网站获取任何内容,因为它不是网络工具。

因为它并非网络工具,所以它会从不同来源寻找B-roll素材,实际上是从YouTube上查找内容。如你所见,在这个案例中,它已经完成了素材筛选工作。它批准了九个素材,包括三个YouTube视频片段、四张截图和一个标志。

它拒绝了一些截图和一个标志。有几张因为太暗被拒了,还有几张也因为太暗被拒了。现在它问我是否批准这个清单,因为我目前已经训练它要求批准。你可以移除那些批准关卡。所以,我打算继续并说是的。然后它将继续进行流程。

现在继续推进流程。已调用故事板代理,它将清晰规划所有内容,随后进入渲染阶段。如您所见,故事板现已准备就绪,所有片段均已规划完成,包含语音内容及对应画面。

它包含语音,并指定了我们要为视频的这一特定部分使用哪种素材。我现在要继续并批准这个分镜脚本。接下来将运行语音代理来获取一些AI生成的片段。现在已生成所有语音片段并已批准。

现在,它将开始组装并渲染整个视频。至此,视频已处理完毕,完成了整个流程。视频经过审核并渲染完成,最终成品就在这里。希望您能从本视频中有所收获,尽情享受这个Instagram视频带来的乐趣吧。

尽情体验这款Instagram AI真机,别忘了点赞哦,AI真机请点赞,AI真机请点赞,有任何问题请在下方留言,有问题请在下方留言,有问题请在下方留言,如果想订阅频道就订阅吧,想订阅频道就订阅吧,想订阅频道就订阅吧,以便未来能看到我正在构建项目的更新版本,以及所有未来构建项目的更新版本,以及所有未来构建项目的更新版本,还有云端代码的其他应用场景,云端代码的其他应用场景,云端代码的其他应用场景,以及如何在Instagram上赚更多钱,如何在Instagram上赚更多钱。

如何在Instagram上赚更多钱。布朗。

原视频 导出PDF