这个视频教你如何用一套自动化系统,只需输入一句话,就能生成完整的Instagram Reels短视频,涵盖从脚本到发布的全部流程。
我曾日复一日地耗费数小时制作Instagram短视频,如今却已不再如此。
现在,我只需在Cloud Code中输入一句话,只需在Cloud Code中输入一句话,只需在Cloud Code中输入一句话,它就会自动研究主题,自动研究主题,自动研究主题,生成脚本,生成AI生成脚本,生成AI生成脚本,生成AI虚拟形象来朗读脚本,寻找B-roll素材,虚拟形象来朗读脚本,寻找B-roll素材,虚拟形象来朗读脚本,寻找B-roll素材,编辑视频,添加字幕,编辑视频,添加字幕,编辑视频,添加字幕,并自动为我发布到Instagram上,自动为我发布到Instagram上,自动为我发布到Instagram上。我将带你一步步了解我的流程。
今天我将详细展示我的完整配置,以便你也能在本地搭建起整个系统。现在,让我播放一段专门为我制作的视频。我提出的要求仅仅是:制作一段关于当前伊朗局势及其如何影响人工智能领域的视频。而这就是最终的成果。
而这正是影响人工智能领域的关键所在。这就是它得出的结论。它得出的结论。它得出的结论。>>伊朗战争刚刚将人工智能产业一分为二。五角大楼利用熵公司的“利爪”系统识别美国对伊朗打击中的目标。当达里奥·阿莫德拒绝移除安全限制时,特朗普下令禁止熵公司参与所有联邦机构的业务。
数小时后,萨姆·阿尔曼火速介入,签署了OpenAI与五角大楼的专属协议。紧接着,一枚导弹击中了阿联酋的AWS数据中心,导致全球范围内的Claude和乍得GPT服务中断。一场战争刚刚揭示了人工智能领域最核心的问题:究竟是谁在掌控这些系统?是政府,还是企业?
政府还是建造它们的公司?正如我所说,这个视频的初衷源于我的一句话。
最终,它完成了整个头像的创建,为视频全程添加了字幕,并从维基百科及其他来源收集了真实的B-roll素材,确保视频拥有准确的背景画面,并使其成为适合Instagram分辨率的视频。当然,这远非完美。
现在,这远非完美,但这是一个极其艰巨的任务。我将详细为你讲解这个系统的运作方式,以便你能直接使用我目前拥有的这个版本。但请务必确保你已准备就绪。
但如果你想订阅频道,如果你想订阅频道,如果你想订阅频道,以便获取我未来版本的最新动态,因为这次我花了大约10天时间才达到这个阶段,同时还要处理一大堆其他事情。所以我就说到这里。
所以,一个月后我能进展到何种程度,就留给你去想象了。现在,话虽如此,这里的一切都是在云代码内部完成的。
我在这里有一个专门用于Omnifusion AI的reels文件夹,里面包含了所有的配置、针对特定功能的技能,以及一套完整的云端代码流程,每当我有视频创意时就可以直接调用。这听起来可能很简单,但我已经把它分解成了
但我已经把它分解成了一个复杂的系统,并且我要提供一个复杂的系统,还要给大家一个免费资源,这样你们就能自己动手搭建了。这个系统包含三个独立的AI模型、六个自主工作的智能体,并且在每一步都进行质量检查。现在,让我们开始吧。
现在,让我们一步步来。现在,我们来详细探讨在Cloud Code中制作视频的实际步骤。首先,我们需要进入前期流程,也就是编写脚本的阶段。这个脚本大约需要100字,并且节奏要快。我已经为此进行了专门的训练。
我专门训练它来撰写高效的Instagram Reels脚本。这一切都伴随着研究过程进行,它会实际找到我们将在Reels中呈现的信息。
现在,脚本完成后,我们利用Hey Gen生成一个4K分辨率的AI虚拟形象,并确保所有口型同步且完美对齐。顺便提一下,这些工作都不是我亲自完成的,全部由Claude Code负责。一旦AI虚拟形象准备就绪,Claude Code便会接手后续步骤。
一旦我们获得了AI虚拟形象,我们会使用FFmpeg的保音调功能将其加速至1.1倍速,这样在加快速度的同时不会导致音调升高。但将其加速至1.1倍速确实能让它感觉更加自然,因为默认情况下,这些虚拟形象的速度略显缓慢。接着,我们会对其进行转录。
我们随后进行转录,速度稍慢。接着,我们使用Whisper对整个视频进行转录,并配有时间戳,这样就能精确知道每个词是在何时被说出的。这对于后续添加字幕将极其有帮助。现在,让我们来详细了解一下它所遵循的六阶段流程。
现在,一旦我们实际开始操作。现在,一旦我们有了脚本,并且有了虚拟形象,我们首先需要的是用于制作B-roll镜头的素材。为此,我们会使用工具、网站、标志等的截图。
我们从Reddit、YouTube等平台获取视频素材,通过Claw Code对每个片段进行评估,判断其是否适合纳入最终视频。一旦通过筛选,便会将其整合进视频中。
现在,如果它通过了质量门,并且一切看起来都符合标准,这里没有问题,也没有需要修订的地方,那么它就会继续前进。但如果有需要修订的地方,它就会被退回。然而,一旦通过,它就会进入故事板代理阶段。接下来,故事板代理将接手处理。
现在,故事板代理利用字幕和时间戳,为视频规划出10到15个片段,并为每个片段匹配合适的B-roll素材。这就是为什么在我展示的视频中,当我们提到特朗普时,画面就出现了特朗普。
当我们提到萨姆·阿尔曼时,画面显示萨姆·阿尔曼。当我们提到Claude和阿尔特曼时,画面显示那些标志。这一切都由故事板代理完成,因为它决定何时展示哪个片段。如果一切顺利通过这里。
如果所有环节都通过,质量检查也合格,我们就会介入,填补视觉上的空白。视频中有些部分确实没有可用的真实素材,因此我们会用维基百科上的人物图片来补充。
所以,当特朗普出现时,萨姆·阿尔特曼也会出现;当特朗普出现时,萨姆·阿尔特曼也会出现;当特朗普出现时,萨姆·阿尔特曼也会出现,等等。实际上,我们会去维基百科获取他们的头像,然后将其用于视频中,并辅以BO3.1 AI生成的片段。现在,当你……
现在,请看屏幕上这个片段,或者甚至这栋建筑,这些都是由人工智能生成的,用来填补视频中的空白。一旦我们填补了视觉上的空缺,就转向组装代理。
现在,这是一个七点验证加上JSON配置,七点验证加上JSON配置,七点验证加上JSON配置,它将所有内容整合起来together,将所有内容整合起来together,将所有内容整合起来together,这样我们就能将所有内容集中在一处,将所有内容集中在一处,将所有内容集中在一处,并且我们已经准备好真正开始创建视频,真正开始创建视频,真正开始创建视频。从组装代理,我们转向Remotion渲染。现在,Remotion渲染,现在,Remotion渲染。
现在,Remotion是一项你可以使用的特定技能,非常适合视频编辑、产品演示等用途。我们利用渲染功能生成分屏效果,将Hey Gen虚拟形象置于底部,B-roll素材置于顶部。
这种分屏格式为180*1,920,这正是Instagram Reels的确切格式。我们以每秒25帧的速度进行渲染。一旦Remotion根据我们之前收集的所有素材完成视频渲染,我们便会进入审核代理阶段。
现在我们进入审核代理环节。审核代理之所以能够运作,是因为Claude Co能够实际观看视频。审核代理的功能是逐帧提取整个视频内容。
因此,它会从一段30秒的视频中采集50到100帧画面,并逐帧检查,以确保B-roll素材与视频中的解说内容相匹配。
如果此处有任何问题,修正循环会将其引导回第二阶段,故事板代理根据评审代理的反馈重新审视,整个流程将从头开始重新启动。
当审核代理通过后,结果是一个已完成的Instagram短视频,时长最多45秒,且已添加字幕。现在你可以根据实际需要调整45秒的时长要求,但在此案例中,输出的是一个分屏视频。
上半部分是动态的B-roll素材。接着,中间部分配有字幕,此处可见采用了紫色渐变效果,但这可根据您的需求进行调整,只需告知Claude进行修改即可。下半部分则是由Hey JJ生成的AI虚拟形象。
目前,我正在处理多种格式的视频内容,比如在原始视频中间添加黑边,上下留出黑色边框,然后简单地加入不同的文字变体。
我还在探索其他视频格式,其中一种设想是让虚拟形象占据全屏,同时将辅助镜头素材叠加其上。为此,你将需要用到HeyGen和Whisper这两个工具:Whisper负责生成字幕转录,而HeyGen则用于内容生成。
嘿,用于生成视频的基因。使用Remotion和ffmpeg来加速视频。使用Remotion和ffmpeg来加速视频。使用Remotion和ffmpeg来加速视频。用Remotion来实际编辑视频。用Remotion来实际编辑视频。用Remotion来实际编辑它。Claude是我们正在使用的Claude它。Claude是我们正在使用的Claude它。Claude是我们正在使用的claude code。所以,claw代码实际上将负责代码。所以,claw代码实际上将负责代码。所以,claw代码实际上将负责在这个流程中做出所有决策,所有智能的决策,所有智能的决策,所有智能的逻辑。VO3.1来生成那些AI生成的片段。
生成那些AI生成的片段。维基百科用于获取图片,而Playright实际上是它在资产生成过程中使用的一个工具,用于策划内容。
在整理素材时,它能利用Playright工具,在我的设备上启动浏览器,访问特定网站并滚动浏览,以获取所需的任何素材,比如网站截图或类似内容。这就是它的运作方式。
那么,在Claude Code内部的实际操作中,具体表现为我只需说“创建短视频”,然后提供一个创意点子。在这个例子中,Claude Code的表现优于ChatGPT。我始终开启着权限绕过功能。
我们称之为YOLO模式,这样在整个过程中它就不会反复请求我的许可,能够直接完成任务。如此一来,我可以启动任务后去用午餐,回来时视频就已经处理完毕。我还可以让它持续运行。
我也可以让它同时运行多个任务,只需简单按下回车键,它就会开始处理并实际生成整个Instagram短视频。正如你所见,如果我打开左侧的输出文件夹,就能看到所有这些内容。
你可以看到我制作的所有这些不同版本的视频,包括我向你展示过的那个带有伊朗AI视角的,还有我制作的大量其他视频,这样你就能明白这并非一次性事件。实际上,这是一个端到端的视频生成流程。
所以,端到端视频生成流程。他现在正在梳理整个流程,逐步检查每一个环节,以明确需要完成哪些步骤,并即将开始生成视频。我已经为你将这个过程变得极其简单。如果你已经在使用相关工具,那就更便捷了。
所以,如果你已经在使用Claude Code,我会在下方描述中放一个免费资源代码,我会在下方描述中放一个免费资源代码,我会在下方描述中放一个免费资源,那将是一个MD文件。只需下载那将是一个MD文件。只需下载那将是一个MD文件。
只需下载这个MD文件,将其放入你的云端代码中,并指示它构建整个流程,用于实现文件中详细说明的真实生成过程。它会引导你逐步操作,并在需要时向你询问任何信息。
它会向你询问任何它需要的信息,你可以告诉它你是否希望某些元素与我的不同,比如字幕的颜色或不同的片段。正如你所见,代码仍在运行中,它正在编写整个脚本。
它正在撰写整个脚本。整个脚本已经规划完毕,整个脚本已经规划完毕,整个脚本已经规划完毕。时长控制在45秒以内,时长控制在45秒以内,时长控制在45秒以内。现在正在生成虚拟形象,现在正在生成虚拟形象,现在正在生成虚拟形象。并且它将逐步演示,并且它将逐步演示,并且它将逐步演示整个流程。如你所见,现在,如你所见,现在,如你所见,现在虚拟形象已生成完毕。虚拟形象已生成完毕。虚拟形象已生成完毕。
它已经生成完毕,现在将以1.1倍速处理并利用Whisper技术对整个视频进行转录。虚拟形象现已准备就绪,即将启动流程来创建资产并生成完整的视频内容。
如你所见,智能管道已初始化。现在,让我运行资产管理器。由于这是关于云代码,一个终端工具,我将搜索相关的B-roll素材。所以,它不会去网站获取任何内容,因为它不是网络工具。
因为它并非网络工具,所以它会从不同来源寻找B-roll素材,实际上是从YouTube上查找内容。如你所见,在这个案例中,它已经完成了素材筛选工作。它批准了九个素材,包括三个YouTube视频片段、四张截图和一个标志。
它拒绝了一些截图和一个标志。有几张因为太暗被拒了,还有几张也因为太暗被拒了。现在它问我是否批准这个清单,因为我目前已经训练它要求批准。你可以移除那些批准关卡。所以,我打算继续并说是的。然后它将继续进行流程。
现在继续推进流程。已调用故事板代理,它将清晰规划所有内容,随后进入渲染阶段。如您所见,故事板现已准备就绪,所有片段均已规划完成,包含语音内容及对应画面。
它包含语音,并指定了我们要为视频的这一特定部分使用哪种素材。我现在要继续并批准这个分镜脚本。接下来将运行语音代理来获取一些AI生成的片段。现在已生成所有语音片段并已批准。
现在,它将开始组装并渲染整个视频。至此,视频已处理完毕,完成了整个流程。视频经过审核并渲染完成,最终成品就在这里。希望您能从本视频中有所收获,尽情享受这个Instagram视频带来的乐趣吧。
尽情体验这款Instagram AI真机,别忘了点赞哦,AI真机请点赞,AI真机请点赞,有任何问题请在下方留言,有问题请在下方留言,有问题请在下方留言,如果想订阅频道就订阅吧,想订阅频道就订阅吧,想订阅频道就订阅吧,以便未来能看到我正在构建项目的更新版本,以及所有未来构建项目的更新版本,以及所有未来构建项目的更新版本,还有云端代码的其他应用场景,云端代码的其他应用场景,云端代码的其他应用场景,以及如何在Instagram上赚更多钱,如何在Instagram上赚更多钱。
如何在Instagram上赚更多钱。布朗。