印度增长最快的AI初创企业

Y Combinator 油管初创课堂 2026-03-19 纯讲解
总结 印度AI初创公司Emergent通过YC孵化,仅用8个月就生成了700万个应用,其核心是将强大的AI编码能力封装成简单工具,让非技术用户也能轻松构建和发布可上线的全栈软件。
工具 Emergent:本期主角,让非技术人员用AI代理构建和部署全栈应用平台。; Lovable / Bolt / T152:同期增长迅速的其他AI应用构建平台,刺激了Em
建议 1. 聚焦交付:不要只做原型工具,思考如何帮助用户真正交付可运行、可维护的应用。解决“从作品到产品”的鸿沟。
播客音频
YC_印度增长最快的AI初创企业
一句话总结

印度AI初创公司Emergent通过YC孵化,仅用8个月就生成了700万个应用,其核心是将强大的AI编码能力封装成简单工具,让非技术用户也能轻松构建和发布可上线的全栈软件。

核心论点展开
创业起点:从解决工程痛点出发
创始人是一对双胞胎兄弟,都是资深工程师。
他们最初想用AI自动化软件测试,因为这是他们管理大团队时遇到的交付瓶颈。
在开发测试AI代理的过程中,他们发现如果能解决“验证”问题,就能实现整个软件工程的自动化。
这个关键洞察,让他们转向了通用编码AI代理的研发。
技术领先:早期就构建了前沿架构
他们很早就投入研发,在编码AI代理的基准测试中拿到了全球第一。
在这个过程中,他们自己摸索并实践了许多现在被认为是前沿的技术。
比如多AI代理协作系统、AI代理间的通信机制、以及为AI代理构建长期记忆。
这让他们在“云计算”概念流行前,就已经在工程上实现了类似的复杂编排。
关键转折:从服务工程师转向服务大众
他们最初的产品是面向工程师的编程助手,但推广速度很慢。
同时,他们观察到像Lovable、Bolt这类让非技术人员构建应用的工具增长飞快。
于是,他们在2025年6月开放了一个小范围测试版,结果瞬间爆火。
出乎意料的是,高达80%的用户完全没有编程背景,他们都在搭建能实际跑业务的应用。
产品哲学:要交付产品,不只是画原型
市场上的很多工具只能做前端原型,很难把做的东西真正部署上线。
他们的核心洞察是:用户要的是能交付、能运行的产品。
因此,他们从零搭建了一个覆盖代码审查、测试、调试、部署、安全和托管的完整平台。
这个平台就像一个顶尖的工程师团队在背后运作,目标是实现软件工程的全自动化。
增长策略:用惊艳产品与网红营销破局
作为市场后来者,他们深知产品必须足够惊艳,要比现有产品强一大截才能吸引用户。
早期,他们重点构建了一个庞大的网红影响者网络,通过TikTok、Instagram等平台扩散。
这种网红营销引擎,成了他们快速打开市场、获取首批用户的关键策略。
关键数据与案例

* 增长数据:上线8个月,通过其平台构建的应用数量达到700万个

* 用户画像80%的用户没有编程背景。用户来自全球约190个国家,其中70%-80%来自美国和欧洲。

* 案例一:美国伊利诺伊州一位音视频设备安装商。他之前用电子表格手动管理,沟通低效。现在用Emergent描述他需要的设备配置流程,生成了一个全栈的潜在客户生成器应用,设计精良。

* 案例二:挪威一位卖掉公司的创业者。他深知律师用电子表格管理客户的痛苦,于是为律师们构建了一个客户关系管理系统(CRM)。他自称“业务开发者”,这成了他的新收入来源。

提到的工具/产品/技术

* Emergent:本期主角,让非技术人员用AI代理构建和部署全栈应用平台。

* Lovable / Bolt / T152:同期增长迅速的其他AI应用构建平台,刺激了Emergent的转型。

* Soda:Emergent早期开发的编程AI代理,曾在基准测试中排名第一。

* GPT-4 / Opus:提及的大型语言模型。他们意识到,每一代新模型都会改变解决问题的思路。

* Kubernetes:他们用于自建云基础设施和AI代理运行环境的核心技术。

* 技能基准(Skill Bench):用于衡量具备特定技能的AI代理性能的工具。

金句

* “我们正在让非开发者不用成为开发者,市场在变大。”

* “你的AI代理不仅从一次会话里学习,它还能跨越多次会话来学习…它竟然能自己学习。”

* “关键洞察是:用户真正要的是交付产品,不只是画个原型。”

* “后来者的产品必须足够惊艳,得比市面上现有的任何产品都强出一大截。”

* “随着模型能力越来越强,人类的欲望也在以同样的速度增长。”

对 Vibe Coder 的价值

* 市场验证:证明了面向非技术用户的“AI应用构建”市场巨大且增长迅猛,这是一个明确的趋势信号。

* 产品思路:展示了如何将复杂强大的底层技术(如AI编码代理)进行封装,提供极简的用户体验,这是成功的关键。

* 技术前瞻:早期在AI代理架构、长期记忆、多代理协作上的实践,提供了宝贵的技术路线参考。

* 增长策略:网红影响者营销可以作为AI工具冷启动的有效手段。

* 哲学思考:面对强大的基础模型,应用层的价值在于解决“最后一公里”问题——部署、集成、用户体验和持续的服务。

建议
聚焦交付:不要只做原型工具,思考如何帮助用户真正交付可运行、可维护的应用。解决“从作品到产品”的鸿沟。
体验优先:即使你拥有强大的技术内核,也要像Emergent一样,对非技术用户隐藏复杂性(如代码、JSON),提供“开箱即用”的默认选项。
架构远见:设计系统时要为AI能力的快速进化留出空间。信任模型会解决某些当前难题,专注于构建模型不擅长的部分(如复杂工作流编排、状态管理)。
寻找杠杆:作为后来者,要么在特定垂直领域做得更深,要么像Emergent一样,在产品完整度或用户体验上实现“十倍好”的突破。
关注角色融合:注意公司内部“产品经理、设计师、工程师”角色融合的趋势,你的工具是否可以赋能这种新的“超级个体”?

所以我认为,现在我们正真切地见证着这一突破:那些深谙问题领域、却长期受技术壁垒所限的专家们,正借助新兴技术来充分表达自我,并将这些构想一一实现。

外界对人工智能的关注实在太多了。人们反复强调AI将取代工作岗位,知识型工作即将消失,这会对就业和社会稳定带来怎样的影响?然而,几乎没有人真正讨论这样一个事实:如果你对某些领域抱有浓厚兴趣并愿意主动探索……

你渴望某种兴趣的代理权,想要开创自己的事业,必须自主创业,掌握生活的自主权,就像你在生活中拥有自主权一样,就像你在生活中拥有自主权一样,就像你在scale那里赋能那样。欢迎回到另一期《轻锥》节目。遗憾的是,加里被传唤去履行陪审员职责,今天无法与我们一同参与。不过,我们真的非常期待。

呃,我们非常激动地请到了马昆德和马达夫……激动地请到马昆德和马达夫……激动地请到马昆德和马达夫·贾尔。呃,他们是双胞胎兄弟……双胞胎兄弟……双胞胎兄弟,也是Emergent的创始人,该公司在2024年夏季……在2024年夏季……在2024年夏季通过了YC孵化。Emergent是一个……是一个……是一个平台,让任何人都能利用AI智能体……利用AI智能体……利用AI智能体构建并交付可用于生产的软件。你们俩实际上就是其中的智能体之一。

你们确实是其中一家代理商。我认为你们是YC投资过的增长最快的公司之一。你们分享的数据简直令人震惊——上线仅8个月,就有700万个应用通过Emergent构建出来。请详细介绍一下这个过程。

跟我们聊聊你们经历的惊人增长——实际上你们正见证着惊人的增长,这种增长究竟在何时达到了一个真正的转折点?对你们来说,那是一种怎样的感受?我们俩是双胞胎兄弟。实际上,我们从12岁就开始学习编程了。后来我们都来到美国攻读博士学位,而我中途选择了退学。

我退出了美国,去攻读我们的博士学位。

我退出了博士项目,加入了Google,而麦迪则继续攻读博士,并加入了Google。之后,麦迪先是去了Zenz,接着又加入Amazon,负责启动深度学习团队。我们一直计划创办一家together初创公司,酝酿已久。在此之前,我在印度运营一家名为Danzo的初创企业,那是一家超本地化的快速商务公司。

一家超本地化即时商务公司。一家超本地化即时商务公司。一家>> 而且Dunano确实是一家大公司>> 而且Dunano确实是一家大公司>> 而且Dunano确实是一家大公司,对吧?对吧?对吧?>> 是的,它确实非常庞大,呃,而且>> 是的,它确实非常庞大,呃,而且>> 是的,它确实非常庞大,呃,而且我们在印度几乎成了一个动词。所以我们在印度几乎成了一个动词。所以我们在印度几乎成了一个动词。

所以当人们发货时他们会说完成了,所以当人们发货时他们会说完成了,所以当人们发货时他们会说完成了,然后呃,然后我当时管理着一个非常大的团队,有300名工程师,当你管理着一个非常大的团队,有300名工程师,当你管理着一个非常大的团队,有300名工程师,当你明白的时候,我们一直在某种程度上关注深度学习领域有一段时间了,我们一直在某种程度上关注深度学习领域有一段时间了,我们一直在某种程度上关注深度学习领域有一段时间了,我们知道一个转折点即将到来。我们知道一个转折点即将到来。我们知道一个转折点即将到来。

我管理这支庞大的工程团队时注意到,软件测试是快速交付的最大瓶颈。

嗯,当我们开始思考……当我们开始思考……当我们开始思考要在人工智能领域构建什么时,这实际上是我们最初的构想……这实际上是我们最初的构想……这实际上是我们最初的构想……>> 这是哪一年?>> 这是哪一年?>> 这是哪一年?>> 那是2023年底。是的。所以当我们申请YC时……我们带着这个想法申请……我们带着这个想法申请……我们带着这个想法申请……就是自动化软件测试的想法。嗯,那是第一个想法。

那是第一个想法。在测试中。实际上,我们带着这个想法去找了很多风投。他们觉得这太疯狂了。现在回想起来,这几乎有点好笑。

于是我们带着这个想法申请了YC,在构建这些测试代理的过程中,我们意识到,如果能解决验证问题——这本质上意味着你能解决测试环节——那么实际上就能实现软件工程的全面自动化。

这是我们关键的认识之一,即验证环节构成了一个循环,正是这个循环让智能体能够持续运行更长时间。基于这一洞察,我们转向将通用编码智能体作为一个重要领域来探索,并着手开始构建通用编码智能体。

>> 这让我们进入2024年 >> 这让我们进入2024年 >> 这让我们进入2024年 >> 这个2024年 >> 这个2024年 >> 这个2024年 >> 是的,告诉我们当时的情况是怎样的 >> 是的,告诉我们当时的情况是怎样的 >> 是的,告诉我们当时的情况是怎样的,比如lovable当时有多大 >> 比如lovable当时有多大 >> 比如lovable当时有多大,以及 >> 以及 >> 以及 >> 我是说,还没有人开始lovable >> 我是说,还没有人开始lovable >> 我是说,还没有人开始lovable,我认为kurs才刚刚开始 >> 我认为kurs才刚刚开始 >> 我认为kurs才刚刚开始,嗯,非常非常早期,呃,我想

德文刚刚很早就出来了,我想德文刚刚很早就出来了,我想德文刚刚很早就出来了,所以真的是非常非常早,我们呢,真的是非常非常早,我们呢,真的是非常非常早,我们看了看这个叫做甜点的benchmark,它本质上是一个benchmark,现在它已经饱和了,但在那个时候,就像那是benchmark,所有编码代理都在那里。

我们接受了这个挑战,要成为那个领域的第一名。于是,我们四个人把自己关在一个房间里,说:“好吧,我们就来好好研究一下这个问题,看看怎么才能攻克它。”这为我们的崛起奠定了基础,我们就这样一步步构建起来。

我们开发的苏打编程智能体,在短短两个月内就登上了Sweet Bench排行榜的全球首位。正是在那时,我们发现了许多关于利用语言模型构建智能体的基本规律。至于目标用户,目前我们主要面向工程师群体。

自命不凡的工程师。自命不凡的工程师。 >> 是的。那时候我们纯粹就是 >> 是的。那时候我们纯粹就是 >> 是的。那时候我们纯粹就是一家研究公司,只专注于构建一家研究公司,只专注于构建一家研究公司,只专注于构建编码智能体。我们根本没考虑过编码智能体。我们根本没考虑过编码智能体。我们根本没考虑过产品的事。曾有一段时间,产品的事。曾有一段时间,产品的事。曾有一段时间,我们算是发明了多智能体我们算是发明了多智能体我们算是发明了多智能体系统。我们发明了记忆功能。我们发明了系统。我们发明了记忆功能。我们发明了系统。我们发明了记忆功能。

我们发明了如何进行代理与代理之间的通信?如何建立测试通信?如何安排测试时间计算?嗯,很多这类事情的时间计算?嗯,很多这类事情的时间计算?嗯,很多这类事情,它们就像是逐渐浮现出来,我们会发现一些东西,然后三个月后,我们就会看到有论文发表出来。嗯,你知道的,就是这样。

这为我们奠定了基础,让我们在云计算概念兴起之前,就已经实践了类似云计算的模式。是的,包括多代理编排、如何运用不同的路由策略等许多范式,都是我们逐步探索出来的。

那些我们有所发现的事情。 >> 我绝对想再深入探讨这一点。 >> 我绝对想再深入探讨这一点。 >> 我绝对想再深入探讨这一点。嗯,不过在这个故事的这个节点上,我很好奇,嗯,不过在这个故事的这个节点上,我很好奇,嗯,不过在这个故事的这个节点上,我很好奇,你们是什么时候转向成为非技术用户工具的? >> 是的。实际上,一旦我们拥有了这个编码助手,我们就走上了企业路线。

那是企业级路线。当时的普遍看法是,嘿,要面向企业构建,我们花了大约两三个月的时间,试图让我们的代理在企业环境中运作。

我们发现它太慢了,同时我们内部开始使用新兴平台来构建内部工具和软件。那时,我们注意到lovable和bolt正疯狂增长,于是我们想,嘿,为什么不……

我们当时想,嘿,为什么我们不把这个强大的编码助手打包起来,推向世界呢?于是我们在去年6月,也就是2025年,启动了一个非常小规模的测试版试点项目。结果它真的起飞了。自那以后,我们就一直专注于为非技术用户解决问题。事实上,我们原以为会有很多技术人员使用我们的产品,但如今平台上80%的用户都是没有任何编程知识的非技术人员。

他们在构建知识体系,开发能够实际运营业务的应用程序,这些应用在今天已经相当成熟。他们遍布全球,涉及多少国家呢?是的,他们的用户群体是全球性的,大约70%到80%位于美国和欧洲,目前覆盖超过190个国家。

目前有超过190个国家。我们在YC内部多次讨论过,我们在YC内部多次讨论过,我们在YC内部多次讨论过,就是嗯,先发优势与后发优势在AI世界中如何体现。

我们确实注意到,我们确实注意到,我们确实注意到,比如看看我们的一些公司,比如看看我们的一些公司,比如看看我们的一些公司,像Lora在Harvey之后进入法律AI领域,但增长势头异常迅猛。所以显然,也许并非如此。

所以,显然,作为先行者的护城河可能并不像传统软件行业所认为的那样宽广。在你们转向非技术用户,做出那种策略调整或方向微调时,正值lovable和bolt飞速增长的时期。

T152的发展速度确实非常快。关于这一点,我是这样看的:我认为可以从两三个不同的角度来探讨。首先,我认为每一代新模型实际上都为我们提供了观察世界的新视角。

喜欢观察世界的方式。

例如,当我们开始研究GP4时,它作为首个模型被我们重点关注。最终,大家普遍试图解决的最大难题是JSON解析,即如何实现结构化的输出格式。我们当时认为,下一个模型将会解决这个问题。

模型会解决这个问题,嗯,你知道,我们不要花时间在,嗯,你知道,我们不要花时间在,嗯,你知道,我们不要花时间在那上面。我认为随着每一个新模型的推出,随着每一个新模型的推出,随着每一个新模型的推出,正在发生的是你需要开始重新构想世界,例如开始重新构想世界,例如开始重新构想世界,例如像opus就是一种不同类别的模型,像opus就是一种不同类别的模型,像opus就是一种不同类别的模型。目前,它将能够实现极长的任务周期,它将能够实现极长的任务周期,它将能够实现极长的任务周期,它将能够实现像多个代理协调,像多个代理协调,像多个代理协调together,所以我认为,像后发优势之一,

是的,后发优势在于,是的,后发优势在于,是的,后发优势在于,你能够真正从当前竞争中,从当前竞争中,从当前竞争中,了解哪些策略有效、哪些无效,对吧?并且,并且,并且我认为你从根本上,从根本上,从根本上,站在了一个不同的起点,对吧?就像,就像,就像不同的起点一样。

就像你观察世界的视角,就像你观察世界的视角,就像你观察世界的视角,是非常不同的,对吧?你的想象力非常丰富,对吧?我的想象力也非常丰富,对吧?

我认为,当我们开始思考并着手创建Emergent时,我们意识到,许多用户使用这些应用程序,他们真正想要的是构建一个能实际运作的应用,对吧?而大多数这类应用正是如此。

而且当时大多数工具实际上都极度侧重于前端原型设计。因此,我们开始从根本上重新构想:如果能真正将产品部署到生产环境,世界会是什么样子。

我们的核心洞见是,要实现软件工程的全面自动化,必须构建一个平台,它能像顶尖工程团队那样运作,涵盖代码审查、自动化测试、调试、部署、安全防护及托管等环节。

因此,我们重新构想了整个平台,从零开始思考:一个端到端的平台应该是什么样子?而用户的真正需求实际上是交付产品,而不仅仅是前端原型设计。

我认为第二个关键点在于如何获取市场渠道,因为你是后来者,对吧?所以即便你的产品非常非常出色,从根本上说,我认为你必须凭借一款真正强大的产品进入市场。

这款产品,你知道的,它遥遥领先于市场上现有的任何产品,遥遥领先于市场上现有的任何产品,遥遥领先于市场上现有的任何产品,足以让人们瞩目。嗯,我们对产品非常有信心,非常有信心,非常有信心,因此,在早期阶段,一旦我们推出产品,我们的很多重点就放在了如何迅速扩大分销网络上。

我们建立了一个庞大的影响者网络,这可以说是我们最初的起点。我们利用TikTok、Instagram等平台,以及一批有影响力的博主,真正地将信息传播出去,从而为我们整个项目拉开了序幕。

为我们的事。为我们的事。

对我来说,构建网红营销引擎就像是抢占市场的策略。你是否也曾考虑过专注于特定用户画像及其细分类型,瞄准那些未被Level或其他平台覆盖,或者更适合新兴平台的用户群体?

我是说我们的论文适合他们。

我们的核心观点是,确实存在大量用户渴望开发严肃的应用程序,这正是我们锁定的目标群体。我们初期的宣传策略也紧紧围绕这一点,比如呼吁大家来发布真正的软件产品,而我们当时所做的尝试则略显初步。

我们所做的软件业务范围有点广泛,类似于市场营销,但真正能转化为平台用户的,是那些确实想在平台上发布真实应用程序的人。这是在信息传递中体现的,是的,所以我们当时会说:来构建真正的应用吧。

我们会说,来构建真正的应用程序。我们还会利用那些在其他平台上常见的错误,比如提醒大家,在Emergence上不会遇到这样的问题。这似乎是一个关键的错误,但对你来说,却是一个重要的洞察。基本上,你深入探索了这一点。

从你管理过300人大型工程团队、在Amazon领导深度学习团队的经验来看,你在工程领域堪称极致追求者,对系统架构设计有着深刻理解。能否请你分享一些心得?

你能分享一下你是如何构建它的吗?你构建方式的一个缺点?像Loal或Bolt这些其他大型产品的一个共同缺点就是很难将它们完全投入使用。你可以很快做出原型,但你的项目从零到百分之百进展得非常迅速。这需要技巧。

这几乎需要技巧。这就像是那20%的努力换来了80%的成果,那20%的努力换来了80%的成果,那20%的努力换来了80%的成果——就像帕累托原则,但你付出的努力远不止于此。从工程到生产的最后20%阶段工作量巨大,确实非常繁重。是的,我认为最后那段路程确实如此。

我认为,正如你提到的最后一公里问题,人们常常忽视的是,不仅要确保应用程序被开发出来,还要确保它能够被部署。这正是我们有意识地选择构建自己的基础设施来运行代理的原因之一。

所以,就像我们代理人正在奔跑一样。

我们提供云沙箱服务,但并未外包给当时颇为流行的第三方沙箱供应商。因此,我们完全自主构建了基于Kubernetes的容器技术栈,其中的一个关键洞见在于……

其中一个关键见解是,如果你在构建阶段和部署阶段为你的智能体提供相同的基础设施,那么在部署阶段就不会遇到那么多问题。此外,我们拥有自己的基础设施,这使我们能够为智能体提供实时反馈,而智能体的表现好坏完全取决于你提供的反馈质量。

嗯,我们构建了你提供的这个。

我们构建了这种基础设施和代理,可以说是共同搭建的。从一开始,正如你所说,因为我们专注于开发那些可以直接投入使用的应用程序,这些应用是生产就绪的,包含了后端、前端以及所有必要的组件。

文本、前端以及所有相关部分。我们选择的文本堆栈对我们而言也相当独特。我们拥有一个基于Python的后端服务器。

我们有一个React前端服务器,就像大多数人通常会选择的那种,更偏向于Node.js的重型技术栈,对吧?这种服务器-客户端架构允许你运行后台任务,如果你需要处理后台队列的话。

我们需要背景线索,以便了解那些会使用这款应用的用户,他们的抱负会越来越大,对吧?嘿,我想运行一个能够进行异步视频处理的任务,他们会去触发它,而我们希望从一开始就支持它。所以,我们向最终用户展示的,正是Emergent所构建的同一文本,也就是我们暴露给代理的内容。好的。

在代理方面,我们很早就采用了多代理架构。因此我们明白,在上下文管理上必须精打细算。具体做法是:让主代理——也就是驱动代理——负责处理主要流程。

但任何你想要委派的任务,无论是测试,还是设计搜索,或是集成探索,比如如何整合这个独特的API,都可以委派给子代理。

在这个过程中,当我们进行所有这些探索时,我们逐渐意识到,我们生成的所有轨迹可以随时间累积,从而为智能体构建一种长期记忆,这在某种意义上是非常独特的。

你的智能体不仅从单一会话中学习,它还能跨越多个会话进行学习。我认为这是持续学习的一种变体,目前正受到广泛关注。你可能已经注意到,人们对技能类学习尤为热衷——例如人们创造各类技能,现在出现了一个名为“技能基准”的新工具,它展示了具备技能的智能体在表现上远超无技能智能体。

并且超越了没有技能的智能体。有趣的是,这些技能似乎无法由智能体自身生成,比如,如果让智能体自行生成这些技能,它们往往无法达到预期的性能表现。因此,我们成功地实现了这一点。

因此,我们能够实现一种方式,让技能基于过往轨迹自动生成,并通过CI/CD流程运行后,将其添加到长期记忆中。这样一来,所有技能都能得到整合。

所以这一切对我们来说都是累积的,对吧?如果你的代理三周前还在为日历集成功能苦苦挣扎,那么今天它已经不再为此困扰了,这要归功于之前那次让它成功实现的会话。这真是太神奇了,它竟然能自主学习。

所以它是自主学习,因为我认为所有这类可视化编程应用平台面临的一个挑战是,随着应用变得越来越复杂,如果构建方式过于简单,可能会耗尽所有模型的上下文窗口容量——这似乎曾是瓶颈所在,而我认为你们通过架构设计成功解决了这个问题。

所以你算是通过架构设计找到了出路。你构建了许多如今被视为前沿的技术,但早在一年前,我们的编码代理就已经做到了。

我们的编码代理功能如此强大,以至于我们内部基本上已经将其作为云端代码的替代品来使用,作为开发者,我们对此感到非常自豪。然而,我们并不希望将这种强大的工具暴露给最终的非技术用户,因此尽管我们拥有这样的VS(Visual Studio)工具,我们仍选择谨慎处理。

因此,尽管我们拥有VS Code编辑器,我们实际上将其隐藏了起来。因为我们注意到,非技术用户一看到代码差异就会感到恐慌。我们团队里曾有一位相当懂技术的产品经理,但他也不喜欢处理JSON这类东西。

JSON,你知道,他就像在说“不,别给我看”,你知道,我会有那种感觉,就像“不,别给我看”,你知道,我会感到有压力。所以,建立那种用户同理心,当你拥有那种用户同理心,并且建立那种客服同理心,你也必须理解你的客服人员,他们正在经历什么,客服人员是什么感受,对吧?>> 内部我们有一个术语叫做“客服”。

内部我们有一个术语叫做"代理体验",我们衡量的是代理在平台上的体验如何。实际上,我认为人们没有意识到的一个重要点是,你们最初本质上就像是工程师世界的德文cursor编码代理,只是你们选择将其打包供非技术用户使用。

为普通用户进行封装。所以你的方向几乎与爱好者论坛相反。你拥有真正的实力,掌握所有实际的力量。

你只需简化用户体验,从用户体验入手,逐步发展能力,对吗?对,我认为从根本上来说就是这样。

我认为从根本上说,除非你从一个起点开始,这个起点能够解决软件开发周期中所有这些问题,否则从另一端着手并解决这些问题实际上非常困难,因为你将做出一些难以逆转的架构选择。

你知道哪些是极难逆转的。你知道哪些是极难逆转的。

你还有更多例子吗?我真的很想知道,比如在哪些情况下,就像你之前提到的JSON传递那样,你们在设计系统时选择完全信任模型?还有没有其他类似的情况,让你们觉得“我们不用在这方面花时间了”,因为……

5将解决它 Opus 4。5将解决它 Opus 4。

我的意思是,有些问题已经存在,比如图书馆的定义,以及我们构建的一些集成。我们认为下一代模型会为我们解决类似的问题,就像如何生成单元测试那样,这些我们之前需要大量提示才能完成的事情。

另一个之前被大力推动的方面。另一个之前被大力推动的方面。另一个我们非常关注的问题是,我们非常关注的问题是,我们非常关注的问题是,随着下一代模型的出现,我们如何赋予它们越来越多的自主权,随着下一代模型的出现,我们如何赋予它们越来越多的自主权,随着下一代模型的出现,我们如何赋予它们越来越多的自主权,而模型获得的自主权越多,其表现就越好。模型获得的自主权越多,其表现就越好。模型获得的自主权越多,其表现就越好。

起初,我们的硬度标准非常严格,我们会不断收紧它,慢慢地,我们观察到随着这些模型变得越来越大、越来越高效,你给予模型的控制越多,其性能就越好。

如果我们进行推断,马具会变得。如果我们进行推断,马具会变得。如果我们进行推断,或者说是推得很远,推得很远,推得很远,你是否担心作为一家公司,与模型本身相比,你的处境会如何?模型本身相比,你的处境会如何?模型本身相比,你的处境会如何?模型变得更强大?模型变得更强大?模型变得更强大?

>> 是的,我觉得现在业界确实存在这么一股暗流,对吧?就是那种“嘿,你知道吗,人工智能要吞噬一切”的论调。

>> 是的,我的意思是,我们的观点是,我认为编码部分只占工作的20%,对吧?

我认为,开发一款应用并推向市场,这个过程真的非常非常艰难。关键在于,你与用户的互动有多紧密?

你对他们需求的了解程度如何?我认为随着模型的能力将变得越来越强大,人类的欲望也在以同样的速度持续增长。因此,我认为人们将希望在此基础上构建更复杂的应用程序。

平台方面,另一件事是,至少通过我们的技术框架,我们能够在这些模型基础上额外提取20%到30%的性能。实际上,我们可以利用多个基础模型来进一步挖掘潜力。我认为我们必须持续不断地推进这项工作。

比如,我们正考虑如何为我们的用户提供越来越多的服务。举例来说,现在很多已经构建了应用的用户,他们不仅希望参与分发,还渴望助力增长,比如如何有效地管理用户等等。

管理用户等等,我认为对我们来说,这方面的范围似乎在不断扩大。我同意这一点,我的意思是,还有另一张图表我最近分享过,显示软件工程师职位的数量实际上正在增加,我感觉……

实际上,情况正在上升,至少在我们YC内部,我们正经历着这样的现象:工具越强大,涌现的想法就越多,随之而来的是更多想要完成的工作。感觉这里的每个人都在投入更多时间,处理更多事务,而每周需要交付的软件产出预期也在持续攀升,越来越高。

它只是不断攀升,攀升,再攀升。它正在加速。是的,这是一种享乐主义的适应,你知道吗,就像,嘿,哦,现在它更强大,我能做更多工作了。

是啊是啊 >> 这确实是贾冯悖论在起作用 >> 这确实是贾冯悖论在起作用 >> 这确实是贾冯悖论在起作用,而且我认为存在很多担忧,而且我认为存在很多担忧,而且我认为存在很多担忧,比如软件工程岗位会消失,比如软件工程岗位会消失,比如软件工程岗位会消失。我并不认为会这样,我并不认为会这样,我并不认为会这样。我的意思是,根据所有情况来看,我的意思是,根据所有情况来看,我的意思是,根据所有情况来看。

我的意思是,根据你告诉我们的一切,以及我们正在经历的这些情况——我认为我们正处于一个扩张的市场中。我们正在让非开发者不必成为开发者,对吧?我想你也知道,这个市场正在扩大。同时,我们在内部也看到各种角色正在逐渐融合。

所以角色在某种程度上融合了。就像产品经理、设计师、工程师,一个人承担了所有三个角色的工作,对吧。所以我们有一位产品经理,他在内部进行白盒编码,最近就是这样。

嗯,最近我们内部观察到一种现象,就是现在很多原本需要五六人团队完成的工作,现在只需要一名工程师或一名产品经理就能搞定。YC的下一期项目正在接受申请。你心中有创业的火花吗?请访问y combinator.com/apply提交申请。

请访问y combinator. com/apply进行申请。请访问y combinator. com/进行申请。尽早填写申请表永远不嫌早,提交申请能让你的创意更上一层楼。好了,回到视频内容。好了,回到视频内容。好了,回到视频内容。>> 我们能看看“涌现”的演示吗?>> 我们能看看“涌现”的演示吗?>> 我们能看看“涌现”的演示吗?>> 哦,当然可以。是的。那么,这就是>> 哦,当然可以。是的。那么,这就是>> 哦,当然可以。是的。那么,

这就是新兴界面的样子,这就是新兴界面的样子,这就是新兴界面的样子,嗯,我打算在这里放一个提示,嗯,我打算在这里放一个提示,嗯,我打算在这里放一个提示,就像因为我们是为了这个而来,就像因为我们是为了这个而来,就像因为我们是为了这个播客而来,我们我想你知道播客,我们我想你知道播客,

我想,应该有个应用能让你练习播客问题,或者当你准备求职面试时,可以用来练习问题,对吧?这样,你就能在Emergent上构建一个全栈应用,开发一个移动应用。我们的提示引擎非常智能。

我们的提示引擎足够智能,一旦你给出提示,它就能明白这是在讨论一款移动应用。因此,它会识别出应该使用移动应用构建器作为合适的代理工具。

所以即使你选错了标签页,这就像是,嗯,后台自动处理。我明白你的意思。那么,趁这个程序还在运行,让我也快速给你展示几个用户应用。这个是由伊利诺伊州的某人开发的。

嗯,他经营着一项音视频业务,主要是做音视频设备的安装配置。他们通常通过手动操作来完成,比如使用电子表格处理这类信息收集表格,并通过其他沟通方式逐步完善,整个过程完全不需要任何编程背景。

环绕知识,就像这样,嘿,这就是知识,就像这样,嘿,这就是知识,就像这样,嘿,这就是我想要的那种AV设备配置,嗯,所以你就去搭建你的房间,然后你就去搭建你的房间,然后你就去搭建你的房间,然后你得到的是一个潜在客户生成器,一种形式,但这实际上是一个相当全栈的应用。关于这一点,我注意到的一点是设计真的很棒,比如图标,它看起来就像一个设计精良的应用程序。

精心设计的应用程序。实际上,我们投入了大量时间,确保设计真正出色。过去,设计和功能之间往往存在巨大权衡,比如若侧重设计优化,功能表现可能就不那么突出。

功能可能不会那么强大。所以我们得想办法,如何以一种设计也能得到改善的方式分享背景信息。还有一位来自挪威的人,他之前卖掉了自己的公司。

他将之前的公司卖给了一家私募股权公司,并深刻体会到律师在处理电子表格等事务上有多么挣扎。因此,他为律师们打造了一款客户关系管理系统。他形容自己像是一位业务开发者。我很喜欢他用的这个词——业务开发者。他并没有……

他没有编程背景。所以很多编程背景。所以很多编程背景。

我们看到很多与CRM相关的应用,特别是面向小型企业的CRM应用,这是你的第二个盈利渠道。那么,Emergent的一个独特之处在于,在代理开始构建之前,它会向你寻求一些澄清,因为它想确保自己正确理解了你的需求。另外,非技术用户可能不了解API密钥的概念。

如何获取Open AI的API密钥。如何获取Open AI的API密钥。如何获取Open AI的API密钥?那么在这种情况下,我可以直接说:使用紧急LLM密钥。直接说:使用紧急LLM密钥。直接说:使用紧急LLM密钥。这样你就不必担心从第三方获取API密钥。不必担心从第三方获取API密钥。不必担心从第三方获取API密钥。

这感觉像是一个很好的例子,说明你之前提到的观点,因为这类“问我们航空问题”的技能虽然包含代码,但你只是将其抽象化,然后融入到用户体验中,让那些对此一无所知的人也能轻松使用。

对于初次使用,我会说,嘿,先采用紧急API关键预设,假设采用紧急API关键预设,假设采用紧急API关键预设,采用良好默认设置然后开始。这是良好默认设置然后开始。这是良好默认设置然后开始。这是我第一次将任务交给代理,就像第一次将任务交给代理,就像第一次将任务交给代理,就像此刻我可以直接合上我的笔记本电脑。我们还有移动应用。所以笔记本电脑。我们还有移动应用。所以笔记本电脑。我们还有移动应用。

这样你就可以随时随地继续尝试,随时随地继续尝试,随时随地继续尝试,以便在代理需要时提示代理,如果代理需要,就提示代理,如果代理需要,就提示代理,如果代理需要额外的东西。一旦完成,一旦完成,一旦完成,你就能看到应用的预览。所以在这里,你就能看到应用的预览。所以在这里,你就能看到应用的预览。所以在这里,例如在这个案例中,我可以练习,例如在这个案例中,我可以练习,例如在这个案例中,我可以练习我的起源故事是什么。嗯,我可以录制,我的起源故事是什么。嗯,我可以录制,我的起源故事是什么。

呃,我可以记录下我的起源故事,然后继续回答各种问题,最终完成。这是一款播客准备应用。是的,你可以随时回顾自己在应用中给出的回答。我们注意到……

因此我们注意到,许多人开发个人应用时倾向于移动应用,而在构建商业应用时,则普遍选择开发网页应用。这大致是我们观察到的趋势。

我还想展示的另一件事是,这是我们团队内部构建的一个真实的Asana克隆版,由我们的一位QA工程师完成。所以这是真实的新兴数据。我很好奇是什么促使了它的诞生。

是不是Asana缺少了某些功能,或者有什么它没做到的地方,让他们觉得“嘿,我们干脆自己造一个吧”?>> 是的,这起初有点像是一位QA工程师的好奇心驱使。他——我看了他以前的工作记录,他的第一个提示就是这样开始的。

我首先查看了他过往的工作内容。第一个项目是克隆Jira。好的。第一个项目是克隆Jira。好的。第一个项目是克隆Jira。好的。然后他就一直持续跟进这个项目,然后我想另一件不同之处在于我们的工作方式略有不同。例如,我们每天会进行三次部署,分别在早晨、傍晚和夜间。因此我们构建了这样的流程。

所以我们基本上是按照我们的工作方式高度定制化地构建了它,比如我们在很多很多方面都有质量保证操作的参与。

嗯,确实,当我们使用Asana时,它非常……嗯,即使想要根据你的工作风格进行定制也不容易,而且我们每月还能节省大约3000到4000美元的订阅费用。>> 是的,这确实是个人软件的世界。

个人软件。个人软件。>> 是的。有没有人真正编辑过这个代码,还是说这是100%通过商家构建的?

百分之百地,商家与优质商品共同塑造了商家本身,而商家与优质商品共同塑造了商家本身,而商家与优质商品共同塑造了商家本身,关键在于,比如我想添加一个功能,关键在于,比如我想添加一个功能,关键在于,比如我想添加一个功能,我只需前往那个项目并添加功能,我只需前往那个项目并添加功能,我只需前往那个项目并添加功能,它就会开始构建。它就会开始构建。它就会开始构建。

对你们来说,以这种方式测试平台可能很有用,因为这很可能处于人们用Emergence构建的最复杂应用的边缘。这样可以让你们测试当人们接触到如此复杂的应用时会发生什么。

事实上,许多团队内部现在都在使用新兴技术构建应用。例如,我们的营销团队就基于新兴平台打造了一套完整的客户关系管理系统。

我们现在正在构建一个客户支持团队,这个团队正在开发一款完全基于Emergent平台的客户支持软件。其优势在于,这些开发者是最贴近实际问题的人,他们深刻理解问题所在,并且能够迅速构建出这些应用。我们内部应用的上线速度简直快得惊人。

内部应用简直多到离谱。内部应用简直多到离谱。>> 但这到底有多夸张呢?我很好奇,>> 但这到底有多夸张呢?我很好奇,>> 但这到底有多夸张呢?我很好奇,比如在公司内部,是不是也有人想要比如在公司内部,是不是也有人想要比如在公司内部,是不是也有人想要他们自己定制版的内部Asana?所以目前,是不是公司里的每个人都在用内部Asana?

目前公司里每个人都在用这个工具,这个工具是大家协作开发的。比如产品经理可以提个功能,测试人员可以提个功能,甚至人力资源团队的同事也能提个功能来逐步完善它。那么,你觉得在这样一个世界里——任何人只要写几句话就能更新他们正在使用的软件——版本控制和功能开关这些东西会如何发展呢?

他们正在使用的软件。是的,所以有一个测试阶段,还有一个部署阶段,对吧。

因此我们维护着不同的版本,并且有一个主要的软件负责人,也就是当前实际管理它的人。所以你知道,它的发展过程涉及有人提出功能需求,然后由代理人来构建实现。

代理会负责构建,一旦构建完成并得到认可,就会进入发布阶段。不过,这并不是通过Git管理的,更像是你自己的工作流程。所以,如果你愿意,可以连接GitHub,就像我们内部为项目所做的那样。而且,如果Emergent之外的非技术开发人员,他们实际上会直接调用GitHub。

对吧?所以他们拥有GitHub GitHub,对吧?所以他们拥有GitHub GitHub,对吧?所以他们拥有非常有限的GitHub知识,因此我们负责处理版本控制,即使他们不连接GitHub。那么谈到你如何管理团队,你的招聘方式肯定非常不同。

我的意思是,你们团队非常精干且规模很小。你们是如何招聘工程师的?>> 是的。实际上我们从第一天起就非常清楚我们想要打造什么样的团队,基本上我们主要看重两点。

一是解决问题的能力,即你解决问题的能力有多强?二是……

其次,我们看重的是责任感,我们认为那些能够真正、真正、真正承担起责任的人,你知道,我们非常看重这一点。我们早期的很多招聘对象,你知道,我们当时非常痴迷于那些排名前100的IT人才。

所以我们当时启动了一个项目,我告诉团队说,我们必须招聘排名前100的IT人才。现在,我们已经有排名第一、第十二等顶尖人才加入我们,而且很多最初的人才也来自Dunzo,因为我能够从那里吸引他们。

因此,我之所以能够从Dunzo起步,是因为我成功组建了一支非常出色的团队。我们组建了一支非常出色的团队。我们组建了一支非常出色的团队。我们得以从那里吸引到一些最初的成员。我们得以从那里吸引到一些最初的成员。我们得以从那里吸引到一些最初的成员。我们专注的核心,本质上就像一两个人承担着通常一个公司所做的工作。我们专注的核心,本质上就像一两个人承担着通常一个公司所做的工作。我们专注的核心,本质上就像一两个人承担着通常一个公司所做的工作。例如,我们的部署工作,通常需要公司规模才能完成。例如,我们的部署工作,通常需要公司规模才能完成。

例如,我们的部署几乎与Vercel的模式如出一辙,仅由两人完成,这就像我们的记忆系统,多个初创公司致力于解决记忆问题,却往往仅由一人构建。因此,我认为这种方式……

所以我认为,我们赋予了人们更多的责任,而且我认为人们通常会被那些他们想要解决的难题所吸引。那么你的团队在哪里呢?目前团队大部分成员都在班加罗尔,也就是我们的印度办公室。

嗯,在印度我们有办公室,然后在旧金山这边我们也有一个很小的办公室,大概三到五个人。你们自己也是两边都有分布,能解释一下这种设置是如何运作的吗?>> 是的,我本人住在旧金山,我一直都在湾区这边。

过去十年左右,我一半时间在旧金山,一半在班加罗尔,总是被时差困扰。我认为你们可能是最成功的AI公司,虽然严格来说不能完全算作一家印度公司,但确实在印度有着显著的影响力。

在印度有显著的存在感,是的。在印度有显著的存在感,是的。为什么会这样呢?为什么会这样呢?为什么会这样呢?>> 我的意思是,我觉得就像我回到印度的时候,你知道,在Google之后,我一直有个疑问,为什么印度没有自己的Google或Facebook呢?所以从第一天起,我就……

所以从一开始我就在想,虽然我创立安佐时,它是一家专注于印度市场的公司,但当我着手创办第二家公司时,我始终认为,我们必须意识到,我们拥有如此多的人才,如今有大量的人才储备可供利用。

如今,印度拥有大量可用的资本,一切资源应有尽有,为何人们不致力于打造真正意义上的全球科技领军企业呢?这正是我们起步时的雄心所在。在我看来,很大程度上取决于个人的抱负——如果你敢于梦想远大,从零开始就真正具备全球视野。我认为,由于互联网现已全面普及,人们能够从世界各地获取知识和见解。

我认为知识无处不在。我认为每个国家都有机会面向全球观众进行建设,如果你拥有那样的思维和抱负,我相信我们将看到更多来自印度的公司崭露头角,实现同样的目标。

我很好奇实际运营这种公司是什么感觉——团队主要在印度,但产品绝大部分用户在美国和欧洲,而产品本身完全不为印度市场设计。这究竟是怎样一种体验?

经营这家公司会是怎样的体验?如果当初你建立的是一个典型的硅谷风格公司,完全扎根于此,情况会有何不同?>> 在内部,我们设定了极高的标准,将其视为一款全球性的产品。

我的意思是,无论是在招聘方面,还是在产品开发的初期阶段,我认为我们投入时间在这里也很有帮助。我们非常坚持做的一件事是,公司里的每个人每周都会与客户交流一两次。

公司里的每个人,没错,他们都会与客户沟通,每个人都会。我们当时就像是一个客户支持团队,实际上我们是一个非常非常小的工程团队,只有12个人。其中一个人总是随时待命处理客户支持问题。这对我们来说是一个非常艰难的决定,因为你知道,团队规模实在太小了。

你知道你们团队规模很小,必须快速交付产品,然后迅速调整方向,就像把最得力的引擎调去处理客户支持那样,虽然过程很艰难,但这确实帮助我们从一开始就建立起对客户的同理心。考虑到我们的很多分销都是在线进行的,这一点尤为重要。

线上分发正如线上分发那样,团队能够从数字化事物中学习并据此构建产品。但我认为,我们从零开始就建立起的客户同理心——比如从一开始就与用户深入交流——确实极大地帮助我们弥合了差距,即用户当前的需求。有趣的是,当我们刚上线时,头五天我几乎都粘在办公桌前处理客服支持,而且大部分客户请求都是用法语等不同语言发来的。

德语就像你懂法语一样,德语就像你懂法语一样,德语之所以重要,是因为很多很多用户是全球性的,多亏了人工智能,我们能够理解那个回复,并且我认为这也在帮助我们弥合差距。是的,弥合差距。是的,弥合差距。是的。>> 而且我们正在S地招聘。所以,呃,如果>> 而且我们正在S地招聘。

所以,呃,如果 >> 我们正在旧金山招聘。所以,呃,如果有人,你知道的,有兴趣,呃,如果有人,你知道的,有兴趣,呃,如果有人,你知道的,有兴趣,呃,你知道的,加入,呃,各种职位,你知道的,加入,呃,各种职位,你知道的,加入,呃,各种职位,比如研究类职位,涵盖各个领域,比如研究类职位,涵盖各个领域,比如研究类职位,涵盖各个领域,比如后端工程师、前端,比如后端工程师、前端,比如后端工程师、前端工程师,我们正在旧金山招聘,工程师,我们正在旧金山招聘,工程师,我们正在旧金山招聘,以及在班加罗尔。在班加罗尔。在班加罗尔。

>> 我想回到我们之前讨论的个性化软件话题,以及你认为这对SAS整体意味着什么?是的,我想那个引人深思的问题是:SAS现在是否已经过时了?我的意思是,你们基本上已经用自己的方式取代了Asana。

这对Asana和其他SaaS公司来说是不是很糟糕?>> 我的意思是,我确实认为当前SaaS的运作方式需要改变。我觉得存在两大强劲的逆风。其中之一是越来越多的这类……

越来越多的SaaS工作流将被智能代理所接管,除非你的SaaS公司转型为以代理为核心的企业,否则我认为生存将变得相当艰难。第二个明显的挑战是,正如大家所知,用户习惯正在发生变化……

显然,人们渴望越来越个性化的软件,那种他们可以在此基础上构建的软件,就像我们打造自己的项目管理工具那样。我们看到越来越多的人正在平台上构建这些内部工具和软件,比如我们的平台。我感觉软件本身的本质正在发生变化。

我认为软件本身正在发生变化。我认为软件本身正在发生变化。我认为越来越多的软件将变得具有agentic特性。嗯,现在很多人都在构建具有agentic特性的软件。嗯,现在很多人都在构建具有agentic特性的软件。嗯,如今许多人在新兴领域进行开发,大约有20%的应用实际上是agentic应用。所以,大约有20%的应用实际上是agentic应用。所以,大约有20%的应用实际上是agentic应用。

所以人们实际上是在这些应用中嵌入我们自己的涌现式智能体,以此来驱动一系列工作流程。这听起来真的很酷,有什么有趣的例子吗?是的,比如我喜欢人们用这种方式……

是的,我是说我喜欢M刚才展示的那个应用,就是那个律师用的CRM系统。它是一个agentic应用,代理可以接手一个工作流程,然后运行整个程序。软件本身……

软件本身正在演变,你知道吗,就像很多人只是想要,你知道吗,打造能够真正独立完成更多工作的代理。那么,随着代理处理任务的视野越来越长远,你认为这会走向何方?

我是说其中那个米和更长的?我是说其中那个米和更长的?我是说其中那个米>>米图表 对>>米图表 对>>米图表 对>>图表是最近非常>>图表是最近非常>>图表是最近非常令人震惊的一个。是的,我认为那是令人震惊的。是的,我认为那是令人震惊的。是的,我认为那是年度图表,我会这么说对吧年度图表,我会这么说对吧年度图表,我会这么说对吧就像那个米的指数级增长就像那个米的指数级增长就像那个米的指数级增长然后比如4 4.5大概在我想然后比如4 4.5大概在我想然后比如4 4.5大概在我想四个小时和4。

6点是在10小时,呃,还有4小时和4点。6点是在10小时,呃,还有4小时和4点。6点是在10小时,呃,我们内部现在有点像你们,我们内部现在有点像你们,我们内部现在有点像你们,正在尝试代理群组,正在尝试代理群组,正在尝试代理群组,让代理能够实际工作,呃,让代理能够实际工作,呃,让代理能够实际工作,呃,在更长的时间跨度上,多个在更长的时间跨度上,多个在更长的时间跨度上,多个代理可以协调完成一个代理可以协调完成一个代理可以协调完成一个单一任务。嗯,初步结果看起来单一任务。嗯,初步结果看起来单一任务。

嗯,初步结果看起来非常非常令人振奋。嗯,你知道,非常非常令人振奋。嗯,你知道,非常非常令人振奋。

嗯,你知道,我们拭目以待。我认为,我认为到今年年底,你会看到那些全天候运行的智能代理,也许会有数百个代理协同完成单一任务。这就是我们目前所看到的未来发展方向。

>> 你们是如何为此构建的?

>> 你们是如何为此构建的?

>> 人们的任务正在增加,对吧

>> 人们的任务正在增加,对吧

>> 人们的任务正在增加,对吧

就像,所以我们想要给予

就像,所以我们想要给予

就像,所以我们想要给予

代理更多自主权,对吧

代理更多自主权,对吧

代理更多自主权,对吧

所以,关键是要确保

所以,关键是要确保

所以,关键是要确保

轨迹不会偏离。

轨迹不会偏离。

轨迹不会偏离。

因此,你总是希望拥有

因此,你总是希望拥有

所以你总是需要一个监督代理,对吧?比如,假设有几个代理在协作,那么同时也会有一个监督代理,它并行地监控整个任务,对吧?所以我们正在尝试许多不同的架构。

正确的架构设计,即便是像拉尔夫·维格姆循环那样简单的现象,你可能听说过,对吧?其核心思想是:持续激励智能体,直到任务完成。而这一切只有在具备良好验证循环的前提下才可能实现。关键在于:你能否为智能体提供自主验证反馈,比如判断任务是否已完成。

因此,我们内部的大量工作仍在进行中,主要集中在构建最佳的验证器上,同时也在进行一些定制化的微调。我们非常谨慎,避免直接与模型竞争,也就是说,我们并不打算打造一个类似4.0的版本。

我们并不想立刻构建一个4.5的替代品,但我们确实希望通过我们自定义的fine-tune验证层来增强它。因此,我们在研究方面所做的一些有趣工作正是围绕这一方向展开的。

对于相反方向的某些运动,您有何看法?我们讨论了相反方向的问题。

我们讨论了模型本身可能变得更强大,这对所有基于它们进行开发的人意味着什么。但至少有一些模型公司明确表示,他们正在尝试构建应用程序并自己拥有应用层。如果其中一家公司……

如果其中一家公司决定,比如你知道那些公司决定,比如你知道那些公司决定,比如你知道为非技术用户提供代码服务,为非技术用户提供代码服务,为非技术用户提供代码服务,是一个非常有价值的应用来构建,非常有价值的应用来构建,非常有价值的应用来构建,这对你有什么影响,这对你有什么影响,这对你有什么影响?>> 我认为最终最终我认为 >> 我认为最终最终我认为 >> 我认为最终最终我认为,比如,你了解你的客户,比如,你了解你的客户,比如,你了解你的客户需求真的真的很好,你是需求

真的非常出色,你是否真的非常出色地满足了他们的需求?我认为,我认为与他们建立更紧密的联系,我认为,我认为与他们建立更紧密的联系,我认为,我认为所有这些基础,比如所有这些基础,比如所有这些基础,比如初创企业的构建原则始终如一,初创企业的构建原则始终如一,初创企业的构建原则始终如一,我想你知道,对我们来说,只要我想你知道,对我们来说,只要我想你知道,对我们来说,只要我们专注于真正地、真正地、真正地理解我们用户的需求,真正地理解我们用户的需求,真正地理解我们用户的需求,真的做到最好,我想你知道,我们真的会做到最好。

我想你知道我们最终会在产品上竞争,在产品上竞争,在产品上竞争 >> 你觉得我的意思是,也许你觉得 >> 你觉得我的意思是,也许你觉得 >> 你觉得我的意思是,也许你觉得所有模型公司都差不多,还是它们之间有差异 >> 如果你看模型本身 >> 如果你看模型本身 >> 如果你看模型本身,它们确实非常不同,比如你知道,嗯,opus就是

你知道,T158显然是个主力,就像Codex在后端调试方面真的很出色,而T123在前端调试方面也很强。所以我认为所有这些模型都有各自的特点,对我们来说一个好处是,我们能够利用这些模型的特长,为用户提供最佳体验。

为用户提供最佳体验。我认为最终,至少在我看来,大多数这些模型将会变得高度商品化,届时所有模型的行为都会趋于相似。

嗯,他们会让你了解价格竞争力,嗯,在他们之间,你已经可以看到,开源项目可能落后三到六个月,对吧?而且我们有足够的灵活性,来真正构建上层,在那里我们真正满足用户的需求。

我们真正与用户相遇的地方,是在他们所处的阶段,并在他们的旅程中给予支持。真正理解客户需求,并能够为此构建解决方案的一方,将有望赢得市场。已经构建了700万个应用程序,这些应用程序的用户是谁?看到人们用它做什么,有什么让你感到惊讶?来到我们平台的用户通常是那些想要构建严肃应用程序的人。

喜欢开发严肃应用的人。那些真正拥有商业用例,希望实现自动化,或者有商业想法想要启动的人。嗯,来找我们的主要用户是中小型企业主。

他们如今依靠电子邮件、WhatsApp和电子表格来运营业务,原本可能会找开发公司定制软件以实现业务自动化。现在他们正转向新的解决方案。

他们正转向我们,看看我们提供的价格点,看看我们正在降低的成本,要知道,原本开发这款软件可能需要花费约50万美元。而现在,你完全可以自己动手,仅用5000美元就能完成。嗯,这可以说是一种自主掌控的方式。

嗯,呃,这就像是一种,你知道的,解锁,我们正在某种程度上,你知道的,解锁,我们正在某种程度上,你知道的,解锁,我们正在某种程度上,现在带给世界。呃,现在带给世界。呃,现在带给世界。

呃,比如今天早上,我和一位用户克里斯蒂聊天,她住在阿拉斯加。她是一名临床心理学家,同时也是一名马术运动教练。她想要将这两个领域结合起来,就像你知道的那样。

我知道她在心理学方面有很多独到见解,在心理学方面有很多独到见解,在心理学方面有很多独到见解,在骑马方面也有很多独到见解,在骑马方面也有很多独到见解,在骑马方面也有很多独到见解。她说她到处寻找一个能实现这个功能的应用程序,到处寻找一个能实现这个功能的应用程序,到处寻找一个能实现这个功能的应用程序,但没能找到,但没能找到,但没能找到,所以她想要自己开发一个。实际上,所以她想要自己开发一个。实际上,所以她想要自己开发一个。实际上,她去了一家开发公司,她去了一家开发公司,她去了一家开发公司。>> 这绝对是学习的交汇点,>> 这绝对是学习的交汇点,>> 这绝对是学习的交汇点,她正在学习,她正在学习,她正在学习。>> 是的,然后她去了新斯科舍省的一家开发公司,>> 是的,然后她去了新斯科舍省的一家开发公司,>> 是的,然后她去了新斯科舍省的一家开发公司,试图找到能开发它的人。试图找到能开发它的人。试图找到能开发它的人。

他们是能够构建它的人。他们向她收取了巨额费用。于是她,你知道的,发现了Emergent,开始着手开发,并且就在几周前刚刚推出了她的应用。在应用商店里,它叫做Equine。

实际上,它将她的心理学见解与体育教练工作相结合。

嗯,她现在有几百个用户,目前有几百个用户在使用这个平台。我认为,这正是我们试图实现的关键突破——吸引那些长久以来一直怀揣想法的人们,那些真正酝酿已久的人们。

那些真正接近领域专家、真正接近问题核心的人,现在可以去构建、去建设了。我们也有很多事情要做。

嗯,我们平台上也有很多独立创业者,他们原本可能需要聘请一位技术总监来开发这些应用。我们在平台上看到的成功案例,比如最近有人联系我说,有家公司仅凭一个广告就筹集了大约400万美元。

他们通过一个基于Emergent平台构建的广告筹集了大约400万美元。是的,确实是基于Emergent。我需要获得他们的许可才能分享更多细节。不过,我认为现在我们正真正见证这一突破:那些非常接近问题领域的专家,却一直受限于技术障碍的人们,终于迎来了转机。

被技术所阻碍,你知道,技术障碍确实阻碍了他们充分表达自我,就像是通过沉浸式体验来构建这些东西一样。而且,这些人还告诉我们,这不仅仅是钱的问题,比如我可以给钱。

在开发过程中,很多想法会在传达时丢失,尤其是在向开发者表达你的构思时。他们可能会说:“如果我能直接说出来,我自己就能做得更好。”就像我之前提到的那位挪威人所说:“在我的团队里,我是唯一的构建者,我甚至不需要引入其他人,因为我清楚地知道要构建什么,而其他人则专注于商业层面。”

所以这就像是它的单一层面。这种独行侠般的态度,比如“我要自己来,我有专业领域知识,信息传递毫无损耗”。那种自主权,正是人们期待这类平台能带来的。是的,我认为如此。

我认为这是一个非常重要的故事,一个实际上被讲述得不够多的故事,那就是你们正在构建的东西对社会来说确实非常必要。当前社会上有太多关注点集中在人工智能将取代工作、知识型工作正在消失这类话题上。

这对就业意味着什么,这对就业意味着什么,这对就业意味着什么,还有社会动荡,但好像没人,还有社会动荡,但好像没人,还有社会动荡,但好像没人真正在谈论这样一个事实,真正在谈论这样一个事实,真正在谈论这样一个事实,实际上,如果你有一些,实际上,如果你有一些,实际上,如果你有一些感兴趣的机构,你想开始,感兴趣的机构,你想开始,感兴趣的机构,你想开始自己的事业,拥有自主权,自己的事业,拥有自主权,自己的事业,拥有自主权,掌控自己的生活,就像你在赋予自己力量,掌控自己的生活,就像你在赋予自己力量,掌控自己的生活,就像你在赋予自己力量。

就像你在scale那里所做的那样。就像你在scale那里所做的那样。就像你在scale那里所做的那样。>> 你释放的人类创造力真是酷毙了。>>

你释放的人类创造力真是酷毙了。>>

你释放的人类创造力真是酷毙了。>>

谁能想到世界需要的是一款将临床心理学与骑马结合起来的应用。

谁能想到世界需要的是一款将临床心理学与骑马结合起来的应用。

谁能想到世界需要的是一款将临床心理学与骑马结合起来的应用。

>> 嗯,在一个软件功能受限的世界里,那个应用根本不可能被开发出来。但在一个软件功能不受限的世界里,你不仅能开发那个应用,还能开发其他700万个应用,这些应用可能永远都不会有人去开发。>> 你触及到了细分中的细分领域。>> 是的。

所以这就像是PG之前写过的一个趋势的延伸,对吧?

比如,在二战后,出现了几家大公司,人们在这些公司里建立整个职业生涯,可能从底层做起,工作几十年然后退休。接着,创业浪潮兴起,世界突然变得不同。

随着世界变得愈发高清,人们的追求也愈发清晰。或许我该创立自己的公司,或许我该创立自己的公司,或许我该创立自己的公司,或者至少加入一家规模较小的企业工作,或者至少加入一家规模较小的企业工作,或者至少加入一家规模较小的企业工作,同时在多家公司任职或创立多家公司,同时在多家公司任职或创立多家公司,同时在多家公司任职或创立多家公司。这就像是企业发展的下一阶段,这就像是企业发展的下一阶段,这就像是企业发展的下一阶段,即每个人都经营着自己的事业,即每个人都经营着自己的事业,即每个人都经营着自己的事业,这些事业位于临床心理学、这些事业位于临床心理学、这些事业位于临床心理学、科技与马术的交汇点,科技与马术的交汇点,科技与马术的交汇点,并以此找到受众,并以此找到受众,并以此找到受众,以及生活的依托。

那样。那样。 >> 是的,我是说我们对很多事情都感到兴奋 >> 是的,我是说我们对很多事情都感到兴奋 >> 是的,

我的意思是,我们对这么多想法能够实现感到兴奋,我们真的希望缩小想法与现实之间的差距,真正让人们能够表达自己,并真正迎来想法的寒武纪大爆发,这对YC来说无疑是件大好事。

我认为这对YC来说非常有利。

我认为,实际上并不需要非得像那样——不必非得像那样——不必非得像那样。我觉得真正有趣的是整个现象——整个现象——整个现象,即能够创办那些无需风险投资、无需筹集大量资金的企业。这就像是一个人追随自己的热情,并掌控自己的生活。

我认为这就像是超越了他们的生活。我认为这就像是一个真正令人振奋的信息,真的非常鼓舞人心,对吧?而且我认为我们现在还只是处于这个过程的早期阶段。就像我觉得这个指数增长将会持续,我们会看到越来越大的项目建立在涌现之上。是的。

建立在涌现之上。是的。建立在涌现之上。是的。>>好的,我们今天的时间就到这里。马昆达·马达夫,非常感谢您的参与。这是一次非常引人入胜的对话,祝贺您取得的所有进展,我们很期待看到未来的发展。>>谢谢。

非常感谢您的邀请。

原视频 导出PDF