【长期主义】第279期智能说:扎克伯格最新2万字访谈,价值百亿美元最强开源大模型Llama3,XR版安卓时刻降临

2024年4月18日,Meta重磅推出Llama 3,称其为迄今能力最强开源大模型,影响AI大模型竞争格局,引爆AI圈;同日,Meta CEO 扎克伯格与科技播客主持人Dwarkesh Patel专访同步发出,在长达80分钟访谈里,主要围绕Llama 3、AGI、能源问题、AI安全问题、开源风险与意义进行探讨。

2024年4月22日,Meta宣布将头显操作系统Meta Quest OS更名为Meta Horizon OS,并将对竞争对手开放,希望为VR与MR设备打造计算平台。Meta表示,华硕、联想将使用Meta Quest OS操作系统打造为特定活动定制的设备,同时Meta打造限量版Quest,灵感来自微软Xbox游戏机。

本期长期主义,选择扎克伯格接受Dwarkesh Patel专访纪要、Meta发布XR版操作系统Horizon OS,华尔街见闻、三次方AIRX发布,六合商业研选精校,分享给大家,Enjoy!

扎克伯格最新访谈:价值百亿美元的最强开源大模型Llama3与背后的一切

时间:2024年4月19日

来源:华尔街见闻

字数:18,276

4月18日,Meta重磅推出Llama 3,称其为迄今能力最强的开源大模型,Llama3的登场,又一次影响AI大模型竞争格局,引爆AI圈。

同日,Meta CEO 扎克伯格与知名科技播客主持人Dwarkesh Patel专访同步发出,在长达80分钟访谈里,主要围绕Llama3、AGI、能源问题、AI安全问题、开源的风险与意义进行探讨。

扎克伯格称,AI已成为Meta核心,Meta AI现在是目前可免费使用的最智能的AI助手,即将推出的Llama 3大型版本将拥有超过4,000亿参数。

AI模型训练与发展方面,扎克伯格提到Llama 3的出现,证实大规模数据与计算资源对AI模型的重要性,未来,训练大型AI模型,可能面临资本与能源限制等挑战,强调AI的出现,不是试图取代人类,而是为了赋予人们更强大的工具,完成更有挑战性的任务。

扎克伯格称,AI发展遇到GPU供应与资金不足问题前,会首先遇到能源问题;Meta可能很快就会在自研芯片上训练大模型。

访谈全文:

Llama 3顶配版仍在训练

Dwarkesh Patel:Mark,欢迎来到这个播客。

Mark Zuckerberg:谢谢你邀请我,我是你播客的忠实粉丝。

Dwarkesh Patel:非常感谢你的赞美。让我们先聊聊这次采访发布时,也会同步发布的产品。能跟我讲讲关于Meta AI与相关模型的最新进展吗?有哪些令人兴奋的地方?

Mark Zuckerberg:我想大多数人会关注到Meta AI新版本,我们正在做的最重要事情是升级模型。我们发布Llama 3,我们以开源方式提供给开发者社区,同时它将为Meta AI提供支持。

关于Llama 3有很多值得讨论的地方,我认为最重要的一点是,我们现在认为Meta AI是人们可免费获得最智能的AI助手,我们整合了Google与Bing以获取实时知识。

我们将让它在我们应用中更加突出,在Facebook、Messenger顶部,可以直接使用搜索框来提出问题。

我们增加了一些我认为非常酷、人们会喜欢的创作功能。我觉得动画是很好的例子,你基本上可以拿任何图像,让它动起来。

人们会觉得非常惊艳的一点是,它现在可以如此快速生成高质量图像,是在你输入的同时,实时生成与更新。你输入查询,它就会去适配,比如给我看一张牛站在有山脉背景的田野里,吃着夏威夷果,喝着啤酒的图片,它会实时更新图像,这非常酷,我想人们会很喜欢,我觉得这将是大多数人在现实世界中能感受到的。

我们正在推出它,不是所有地方,我们从少数几个国家开始,未来几周与几个月会扩大范围。我认为这将是很了不起的事情,我真的很兴奋能把它交到人们手中,这是Meta AI的一大进步。

如果你想深入了解一下,Llama 3是技术上最有趣的。我们正在训练三个版本:分别是80亿、700亿、4,050亿的密集模型,4,050亿模型仍在训练中,我们今天并未发布。

但我对80亿与700亿表现非常兴奋,按照它们的规模来看是领先的。我们会发布一篇博客文章,附上所有基准测试结果,人们可以去看看,它是开源的,大家有机会试用它。

我们有一个新版本的路线图,将带来多模态性、更多的多语言性,以及更大的上下文窗口。

希望在2024年晚些时候,我们能推出4,050亿参数版本。目前的训练情况看,它在MMLU上已经达到85分左右,我们预计它在许多基准测试中都会有领先的成绩,我对这一切都非常兴奋。

700亿版本也非常棒,我们今天发布它,在MMLU上大约是82分,在数学与推理方面有领先的成绩,我觉得把它交到人们手里,会非常酷。

Dwarkesh Patel:有意思,这是我第一次听说MMLU作为一个基准,这太令人印象深刻。

Mark Zuckerberg:80亿参数的版本,几乎与我们发布的最大版本Llama 2一样强大。最小的Llama 3,基本上与最大的Llama 2一样强大。

Dwarkesh Patel:在我们深入讨论这些模型之前,我想回到过去。我猜想你们是在2022年开始采购H100,或者你可以告诉我具体是什么时候,当时股价受到重创。

人们问这些资本支出是怎么回事,人们不买账元宇宙。我想你花费资本支出来购买这些H100,你当时是如何知道要买H100的?你怎么知道你需要GPU?

Mark Zuckerberg:我想是我们当时在开发Reels,我们总是希望有足够算力来构建一些我们看不到未来的东西。我们在开发Reels时,遇到这样的情况,我们需要更多GPU来训练模型,这是我们服务的一个重大进化。

我们不仅是对你关注的人或主页的内容进行排序,我们开始大力推荐非关联内容,也就是来自你没有关注的人或主页内容。

我们可能向你展示的内容候选库,从数千个量级扩大到数百万个量级,它需要完全不同的基础设施。我们开始着手进行这项工作,但在基础设施方面受到限制,无法以我们想要的速度赶上TikTok进度。

我基本上是这样看的,我想我们必须确保不再陷入这种境地。让我们订购足够的GPU来完成Reels、内容排名与信息流方面需要做的事情,让我们再加倍。再次强调,我们的普遍原则是,总会有一些我们还看不到未来的事物。

通往AGI之路

Dwarkesh Patel:你知道那会是AI吗?

Mark Zuckerberg:我们认为那将是与训练大型模型有关的事情,当时我认为可能与内容有关,这只是经营公司的一种模式匹配,总会有另一个需要应对的方向,当时我深陷试图让Reels与其他内容的推荐系统运作良好。

这对Instagram与Facebook来说是巨大突破,能够向人们展示来自他们甚至没有关注人的有趣内容。

事后看来,这个决定非常正确,这决定源于我们的落后。这并不是,我想得太多了。事实上,大多数时候,我们之所以做出一些后来看起来不错的决定,是我们之前搞砸了一些事情,只是不想重复犯错。

Dwarkesh Patel:2006年你没有以10亿美元价格出售,但我想你心里肯定有一个你愿意出售的价格,你有没有心里盘算过,我认为Facebook当时实际估值是多少,他们给的价格并不合理?如果他们出价5万亿美元,你当然会卖。你当时是如何权衡这个选择?

Mark Zuckerberg:我觉得有些事情只是个人层面,我不知道当时我是否有足够的精明去做那样分析。我周围的人,都在为10亿美元找各种论据,比如我们需要创造这么多收入,我们需要做到这么大,这是很多年以后的事,这远超出我们当时的规模,我当时并没有真正具备参与那种辩论所需的金融专业知识。

内心深处,我相信我们正在做的事情。我做了一些分析,如果我不做这个,我会做什么,我真的喜欢创造东西,我喜欢帮助人们沟通,我喜欢了解人与人之间正在发生的事情与互动。

我想,如果我卖掉这家公司,我可能会再建一家类似的公司,而我还挺喜欢现在这家。那又何必呢?我认为人们做出的很多最大的赌注,往往只是基于信念与价值观。要做前瞻性分析,往往非常困难。

Dwarkesh Patel:Facebook  AI研究已经很长时间了。现在它似乎已成为你公司的核心。在什么时候,让AGI,或者无论你如何看待这个使命,成为 Meta 正在做的事情的一个关键优先事项?

Mark Zuckerberg:一段时间以来,这都是一件大事。大约 10 年前,我们开始 FAIR。我们想法是,在通向AGI或任何你想称之为的东西的道路上,将会出现所有这些不同的创新,这将改善我们所做的一切。我们并没有将其视为一种产品,它更像是一个研究小组。

过去10年里,它创造了许多不同东西,改进了我们所有产品。它推动了该领域发展,允许该领域其他人创造出同样改进我们产品的东西,我认为那太好了。

随着 ChatGPT 与围绕图像创建的扩散模型的出现,过去几年,发生了很大变化。这是一些非常疯狂的东西,很明显会影响人们与每个应用程序的交互方式。

那时,我们成立第二个小组,GenAI 小组,目标是将这些东西带入我们产品中,并构建领先的基础模型,来为所有这些不同的产品提供动力。

当我们开始这样做时,最初的理论是我们正在做的很多事情都是相当社交的。它帮助人们与创作者互动,帮助人们与企业互动,帮助企业销售产品或提供客户支持。还有基本的辅助功能,无论是我们的应用程序、智能眼镜还是VR 。

因此,一开始并不完全清楚你是否需要完整的 AGI 才能支持这些用例。通过所有这些微妙的方式,通过对它们的努力,我认为已经很清楚你是这样做的。例如,当我们开发 Llama 2 时,我们没有优先考虑编码,人们不会在 WhatsApp 中向 Meta AI 问很多编码问题。

Dwarkesh Patel:现在他们会了,对吧?

Mark Zuckerberg:我不知道。我不确定WhatsApp、Facebook、Instagram,是否是人们会提出大量编码问题的UI,也许是我们正在推出的网站meta.ai。

过去18个月中,令人有些惊讶的结果是,编码对许多领域都很重要,而不仅是编码。即使人们没有提出编码问题,对编码模型进行训练也可以帮助他们更加严格回答问题,并帮助他们在许多不同类型的领域进行推理。

这是一个例子,对于Llama 3,我们真正专注于通过大量编码来训练它,即使人们主要不问编码问题,这也会让它在所有这些事情上做得更好。

推理是另一个例子,也许你想与创作者聊天,或者你是一家企业,并且你正在尝试与客户互动。这种互动并不只是这个人给你发了一条消息,你只需回复。这是一个多步骤的互动,你试图思考我如何实现这个人的目标。很多时候,当客户来时,他们不一定确切知道自己在寻找什么或如何提出问题。因此,AI 的工作并不仅回答问题。

你需要更全面思考它,这真的变成推理问题。如果其他人解决了推理问题,或者在推理方面取得良好进展,而我们坐在这里使用基本的聊天机器人,与其他人正在构建的产品相比,我们产品就很弱。最终,我们基本上意识到,我们必须解决AGI问题,我们只是加大赌注与投资,以确保我们能够做到这一点。

Dwarkesh Patel:将为用户解决所有这些用例的 Llama 版本,是否足够强大,可以取代你在这栋大楼中可能拥有的程序员?

Mark Zuckerberg:我不知道时间表具体如何,我觉得这些事情都会随着时间逐步推进。Dwarkesh Patel:最终的情况是:Llama-10。

Mark Zuckerberg:我觉得这个问题包含很多内容,我不确定我们是在取代人,还是更多在给人们提供工具来做更多事情。

Dwarkesh Patel:有了Llama-10之后,这栋大楼里的程序员会变得生产力提高10倍吗?

Mark Zuckerberg:我希望不止10倍。我不认为人类有一个单一的智力阈值,人们有不同的技能。我认为在某个时刻,AI可能会在大多数事情上超过人类,这取决于模型的强大程度。

我认为这是循序渐进的,我不认为AGI只是一件事。你基本上是在添加不同的能力。多模态是我们现在关注的一个关键点,最初是照片、图像、文本,最终会延伸到视频。我们非常关注元宇宙,3D类型的东西也很重要。

我非常关注的一种模态,我没有看到业内有很多其他人关注,那就是情感理解。人类大脑有如此多的部分,只是专门用来理解人、理解表情与情绪。我认为这本身就是一种完整的模态,使AI能够真正理解并表达情感,人与机器之间的互动,将会变得前所未有的自然与深入。

除了在推理与记忆方面,有很大改进外,还有许多不同的能力,是你希望训练模型去关注的,记忆本身就是一个完整的事情。

我认为未来我们不会主要把东西,塞进一个查询上下文窗口,来提出更复杂的问题。会有不同的存储器存储或不同的定制模型,它们会更加个性化,这些都只是不同的能力,还有把它们做大做小,我们两者都关注。

如果你运行的是像Meta AI这样的东西,那是非常基于服务器的。我们也希望它能在智能眼镜上运行,而智能眼镜中没有太多空间,你希望有一个非常高效的东西来实现这一点。

Dwarkesh Patel:如果你在工业规模上使用智能进行价值数百亿美元,甚至最终价值数千亿美元的推理,用例是什么?是模拟吗?是元宇宙中的AI吗?我们将把数据中心用于什么?

Mark Zuckerberg:我们的赌注,是它基本上会改变所有产品,我认为将会有一种Meta AI通用助手产品。我认为它将从更像聊天机器人的东西,你问一个问题,它会制定一个答案,转变为你给它更复杂的任务,它会离开,并完成这些任务。这需要大量推理,需要大量计算与其他方式。

我认为,与其他人的其他智能体互动,将是我们所做的一大部分,无论是针对企业,还是创作者。我对此的一个重要理论是,不会只有一个你与之交互的单一AI,每个企业都会想要一个代表他们利益的AI,他们不会想主要通过一个会销售竞争对手产品的AI与你互动。

我认为创作者将是一个很大的群体,我们平台上大约有2亿名创作者。他们基本上都有这样的模式,他们想吸引他们的社区,他们受到时间的限制。他们的社区通常想吸引他们,他们不知道自己受到白天时间的限制。

如果你能创造出一种东西,让创作者基本上可以拥有AI,按照他们想要的方式训练它,并让他们社区参与进来,我认为这也会非常强大,所有这些事情都会有大量的参与,这些只是消费者使用案例。

我与妻子经营我们的基金会,陈-扎克伯格倡议。我们在科学方面做了很多工作,有很多AI工作将推进科学、医疗保健与所有这些事情。因此,它最终会影响产品与经济的基本上每个领域。

Dwarkesh Patel:你提到AI可以为你做一些多步骤的事情,这是一个更大的模型吗?例如,对于Llama 4,是否仍然会有一个700亿参数的版本,你只需要在正确的数据上训练它,它就会非常强大?进展是什么样?是纵向扩展吗?还是像你说的那样,同样大小,但不同的数据库?

Mark Zuckerberg:我不知道我们是否知道这个问题的答案。我认为一个似乎是一种模式的东西是,你有Llama模型,你在它周围构建某种其他特定于应用程序的代码。其中一些是针对用例的微调,但有些是,例如,Meta AI应该如何使用Google或Bing等工具来引入实时知识的逻辑,这不是基础Llama模型的一部分。

对于Llama 2,我们有一些这样的东西,它更多是手工设计。我们对Llama 3的部分目标,是将更多这样东西纳入模型本身。

对于Llama 3,当我们开始进入更多这些类似agent行为时,我认为其中一些将是更多手工设计的。

我们对Llama 4的目标,将是将更多这样东西纳入模型。

在每一步中,你都会感觉到在地平线上什么是可能的。你开始摆弄它,在它周围做一些hack。我认为这有助于磨练你的直觉,知道你想尝试在下一个版本的模型中训练什么。这使得它更加通用,对于任何你手动编码的东西,你可以解锁一些用例,它本质上是脆弱与非通用的。

Dwarkesh Patel:当你说纳入模型本身时,你是指在模型本身想要的东西上训练它吗?你说的纳入模型本身是什么意思?

Mark Zuckerberg:对于Llama 2,工具的使用非常具体,Llama 3在工具使用方面要好得多。我们不必手动编写所有的东西,来让它使用Google,并进行搜索,它可以直接做到这一点。

类似,对于编码与运行代码,以及许多类似的东西,也是如此。一旦你获得这种能力,你就可以瞥见我们接下来可以开始做什么。

我们不一定要等到Llama 4出现,才开始构建这些功能,我们可以开始在它周围做一些hack。你做了大量的手工编码,至少在过渡期内,这会使产品变得更好。然后这有助于为我们想要在下一个版本模型中构建的东西指明方向。

Dwarkesh Patel:你最期待Llama 3的哪个社区微调?也许不是对你最有用的那个,而是你最享受玩的那个。他们在古代对它进行了微调,你就会与维吉尔交谈之类的。你对什么感兴趣?

Mark Zuckerberg:我认为这类东西的本质,是你会感到惊讶。任何我认为有价值的具体事物,我们可能都在构建。我认为你会得到蒸馏版本,我认为你会得到较小的版本。

有一点是,我认为80亿还不够小,无法满足大量用例。随着时间推移,我很乐意得到一个10~20亿参数的模型,甚至是一个5亿参数的模型,看看你能用它做什么。

如果有80亿个参数,我们几乎与最大的Llama 2模型一样强大,有10亿个参数,你应该能做一些有趣的事情,速度更快。

在将其提供给最强大模型,以完善提示应该是什么之前,它非常适合于分类,或者人们在理解用户查询意图方面所做的许多基本事情,我认为这可能是社区可以帮助填补的一个空白。我们也在考虑自己开始蒸馏其中一些东西,现在GPU都被用来训练4,050亿的模型。

Dwarkesh Patel:你有所有这些GPU,我想你说过到2024年底会有35万个。

Mark Zuckerberg:那是整个系列,我们建造了两个,我想是2.2万或2.4万集群,这是我们用来训练大型模型的单个集群,是在我们所做的很多事情中。我们很多东西都用于训练Reels模型、Facebook新闻源、Instagram信息流。

推理对我们来说是一件大事,我们为大量人提供服务。考虑到我们所服务社区的庞大规模,我们所需的推理计算与训练之比,可能比大多数从事这些工作的其他公司要高得多。

Dwarkesh Patel:在他们事先与我分享的材料中,有一点很有趣,你在训练时使用的数据,比仅用于训练的计算最优数据还要多。推理对你们来说是一个大问题,对社区也是如此,在里面放入数万亿个token是有意义的。

Mark Zuckerberg:尽管有了700亿参数的模型,有一件有趣的事情是,我们认为它会更加饱和。我们用大约15万亿个token,对它进行了训练。我想我们一开始的预测是,它会更多的渐近,即使在最后它仍在学习。我们可能本可以给它更多token,它就会变得更好一些。

某种程度上,你在经营一家公司,你需要做这些元推理问题。我是想把我们GPU花在进一步训练700亿模型上,我们是想继续下去,以便开始测试Llama 4的假设。我们需要做出这个决定,我认为我们在这个版本的700亿中,取得合理的平衡。

未来还会有其他的700亿,多模态的那个,会在接下来一段时间内推出。令人着迷的是,这一点上,架构可以接受如此多的数据。

能源瓶颈制约发展

Dwarkesh Patel:这真的很有趣。这对未来的模型意味着什么?你提到Llama 3的80亿,比Llama 2的700亿还要好。

Mark Zuckerberg:不,它几乎一样好。我不想夸大其词,它在同一数量级上。

Dwarkesh Patel:这是否意味着,Llama 4的700亿将与Llama 3的4,050亿一样好?未来看起来如何?

Mark Zuckerberg:这是个很棒的问题,我想没有人知道。

这个世界上,计划指数曲线是最棘手的事情之一。它会持续多久?我认为我们很可能会继续下去。我认为值得投资数百亿,或超过1,000亿美元来构建基础设施,并假设如果它继续发展,你将获得一些真正惊人的东西,这将创造出惊人的产品。

我不认为业界有任何人,真的可以肯定的告诉你,它肯定会以那种速度继续扩展。一般来说,在历史上,你在某些时候会遇到瓶颈。现在有如此多的能量投入到这个领域,也许那些瓶颈会很快被打破,我认为这是一个有趣的问题。

Dwarkesh Patel:在没有这些瓶颈的世界里,会是什么样?假设进展只是以这种速度继续下去,这似乎是可能的。从更广的角度看,忘记Llamas...

Mark Zuckerberg:会有不同的瓶颈。过去几年里,我认为有GPU生产的问题。即使是有钱购买GPU的公司,也不一定能得到他们想要的多,有所有这些供应限制,现在我认为这种情况正在减少。你看到一群公司,现在正在考虑投入大量资金来建设这些东西。我认为这将持续一段时间。有一个资本问题。在什么时候投入资本,就不值得了?

我认为在我们遇到这个问题之前,将遇到能源限制。我不认为有人已经建造千兆瓦级的单一训练集群,你遇到的这些东西最终会在世界上变得更慢。获得能源许可,是一项受到严格管制的政府职能。

你从软件开始,软件在某种程度上受到监管,我认为它比许多技术界人士认为的要受到更多监管。如果你正在创办一家小公司,也许你会感觉到这一点。我们与世界各地不同政府与监管机构互动,我们有很多规则需要遵守,并确保我们做得很好。毫无疑问,能源是受到严格管制的。

如果你在谈论建设大型新电厂或大型扩建,建设穿越其他私人或公共土地的输电线路,那只是一件受到严格管制的事情,你说的是多年的准备时间。

如果我们想建立一些大型设施,为其供电是非常长期的项目。我认为人们会这样做,我不认为这是一件可以像达到一定的AI水平、筹集一大笔资金,投入进去,模型就会......你会在过程中遇到不同的瓶颈。

Dwarkesh Patel:你提到Meta即使研发预算或资本支出预算是现在10倍,也无法负担得起的事情吗?有没有这样的事情,也许是与AI相关的项目,也许不是,即使像Meta这样的公司也没有资源?有没有你脑海中闪过的事情,以现在的Meta,你甚至无法为此发行股票或债券?它的规模比你的预算大10倍?

Mark Zuckerberg:我认为能源是一个方面,我认为如果我们能获得能源,我们可能会建造比目前更大的集群。

Dwarkesh Patel:这在极限情况下,从根本上受到资金的限制吗?如果你有1万亿美元......

Mark Zuckerberg:我认为是时间问题,这取决于指数曲线走多远。现在许多数据中心规模在50兆瓦或100兆瓦左右,或者一个大的数据中心可能是150兆瓦。拿一个整个数据中心,装满你需要做训练的所有东西,你建造你能建造的最大的集群,我认为有一群公司正在做这样的事情。

但当你开始建造300兆瓦、500兆瓦或1吉瓦的数据中心时,还没有人建造过1吉瓦的数据中心,我认为这将发生,只是时间问题,但不会是2025年的事,一些事情需要几年的时间来建设。只是为了说明这一点,我认为千兆瓦的数据中心,相当于一个有意义的核电站,只用于训练一个模型。

Dwarkesh Patel:亚马逊没有这样做吗?他们有950兆瓦的。

Mark Zuckerberg:我不确切知道他们做了什么,你得问他们。

Dwarkesh Patel:但它不一定要在同一个地方,如果分布式训练有效,它可以是分布式的。

Mark Zuckerberg:我认为这是个大问题,它将如何工作。未来似乎很有可能,我们所说的这些大模型的训练,更接近推理生成合成数据,再将其输入模型。

我不知道这个比例会是多少,我认为合成数据的生成,比今天的训练更像是推理。如果你这样做是为了训练一个模型,它就是更广泛的训练过程的一部分。这是一个悬而未决的问题,这个平衡以及它将如何发展。

Dwarkesh Patel:这是否可能适用于Llama 3,也许从Llama 4开始?

就像你把它放出来,如果有人有大量算力,他们就可以使用你放出的模型,让这些东西变得任意智能。假设有一些随机的国家,比如科威特或阿联酋,它们有大量算力,它们可以只使用Llama 4来制造更智能的东西。

Mark Zuckerberg:我认为会有这样的动态,我也认为模型架构有一个根本的限制。我认为像我们用Llama 3架构,训练的700亿模型可以变得更好,它可以继续发展。

正如我所说,我们觉得如果我们继续给它更多数据或再次轮换高价值token,它就会继续变得更好。

我们已经看到世界各地一群不同的公司,基本上采用Llama 2 700亿模型架构,构建一个新的模型。

但是当你对Llama 3 700亿或Llama 3 4,050亿进行代际改进时,今天还没有任何类似的开源模型,我认为这是一个巨大的阶跃。人们能够在此基础上建立的东西,我认为不能无限从那里发展。在你达到下一个阶跃之前,可以对其进行一些优化。

AI未来会发展到哪一步

Dwarkesh Patel:让我们从具体的模型,甚至你需要获得能源审批的多年准备时间稍微放大一点。大局来看,未来几十年,AI会发生什么?它感觉像是另一种技术,比如元宇宙或社交,还是感觉像是人类历史进程中根本不同的东西?

Mark Zuckerberg:我认为它将是非常根本性的,我认为它将更像是计算机本身的创造。你将获得所有这些新的应用,就像你获得网络或移动电话时一样。

人们基本上重新思考了所有这些体验,以前不可能的很多事情,都变得可能。我认为这将会发生,我认为这是一个低得多的创新层次。我的感觉是,它将更像是人们从没有电脑到有电脑。

宇宙尺度上,这会在几十年时间内迅速发生。有一些人担心它真的会失控,并在一夜之间从有点智能变成极其智能。

我只是认为,有所有这些物理限制,使得这不太可能发生,我只是不认为这会发生,我想我们会有时间适应一点,但它会改变我们工作方式,并为人们提供所有这些创造性的工具来做不同的事情,我认为它将真正使人们能够做更多他们想做的事情。

Dwarkesh Patel:也许不是在一夜之间,从宇宙尺度看,我们能以这种方式思考这些里程碑吗?人类进化了,AI出现了,他们去了银河系。也许需要几十年,也许需要一个世纪,但这就是现在正在历史上发生的宏伟蓝图吗?

Mark Zuckerberg:抱歉,从什么意义上说?

Dwarkesh Patel:从这个意义上说,还有其他技术,如计算机,甚至是火,AI本身的发展与人类进化一样重要。

Mark Zuckerberg:我认为这很棘手。人类历史就是人们基本上认为人性的某些方面在不同方面真的很独特,接受这不是真的这一事实,人性仍然非常特别。我们认为地球是宇宙的中心,事实并非如此,但人类仍然非常棒,非常独特。

我认为人们倾向于有的另一种偏见,是认为智能在某种程度上与生命有根本联系,它并不清楚是否如此。我不知道我们是否有足够清晰的意识或生命的定义,来充分审视这一点。

所有这些科幻小说关于创造智能,它开始呈现出所有这些类人行为与类似东西。目前所有这些东西的化身,感觉它正朝着一个方向发展,在这个方向上,智能可以与意识、能动性与类似的东西进行分离,我认为这只是使它成为一个超级有价值的工具。

开源的风险平衡

Mark Zuckerberg:预测这些事物随时间发展的方向极具挑战性,我认为任何人都应避免以教条方式规划它们的开发或用途。

每次发布新产品时,我们都需要重新评估。我们非常支持开源,并不意味着我们会公开所有成果。

我倾向于认为,开源对社区与我们自身都是有益的,这将促进创新。如果某个时刻,这些技术能力发生质的变化,我们觉得开源是不负责任,我们会选择不公开,这一切都充满了不确定性。

Dwarkesh Patel:如果你在训练Llama-5或Llama 4时,看到什么具体的质变,会让你觉得是否要开源它?

Mark Zuckerberg:抽象回答这个问题有点困难,任何产品都可能表现出负面行为,只要你能减轻这些行为,就没问题。

社交媒体有不好的东西,我们努力去缓解。Llama 2也有不好的地方,我们花了很多时间努力确保它不会帮助人们实施暴力行为或类似事情。

这并不意味着它是一种自主的或智能体,这只是意味着它学到很多关于世界的知识,它可以回答一些我们认为让它回答是没有帮助的问题。我认为问题不在于它会表现出什么行为,而在于它表现出这些行为后,我们不能缓解什么。

我认为有太多方式可以让事物变得好或坏,以至于很难事先列举出所有这些方式,看看我们在社交媒体中不得不应对的情况与各种伤害。

我们基本上已经总结出大约18或19类人们会做的有害事情,我们基本上已经建立了AI系统来识别这些事情是什么,并尽可能确保这些事情不会在我们网络上发生。

随着时间推移,我认为你也能把它分解成一个更详细的分类。我认为这是我们花时间研究的事情,我们想确保我们理解这一点。

Dwarkesh Patel:在我看来,这是个好主意。如果在未来,AI系统没有广泛部署,每个人都无法访问它们,我会感到失望。

同时,我想更好理解缓解措施。如果缓解措施是微调,关于开放权重的问题是,你可以移除微调,微调通常是在这些能力之上的表面功能。如果它就像在Slack上与生物学研究人员交谈,我认为模型离这还很远。

现在,它们就像Google搜索。但是如果我能向它们展示我的培养皿,它们能解释为什么我的天花样本没有生长以及需要改变什么,你如何缓解这个问题?有人可能会对这些模型进行微调以满足自己的需求。

Mark Zuckerberg:这是真的。我认为,大多数人会选择直接使用现成模型,也有一些心怀不轨的人,可能会试图利用这些模型进行不良行为。

我在哲学上如此支持开源的原因之一是,我认为未来如果AI过度集中化,潜在风险可能不亚于它的广泛传播。

许多人都在思考:如果我们能够做到这些,这些技术在社会上的广泛应用是否会成为坏事?

另一个值得思考的问题是,如果一个机构拥有比其他所有人更强大的AI,这是否也是一件坏事?

我想到一个安全类比,许多不同的事物中存在如此多的安全漏洞。如果你能回到一两年前,假设你只是多了一两年关于安全漏洞的知识,你几乎可以侵入任何系统,这不是AI。

相信一个非常智能的AI,可能能够识别一些漏洞,基本上就像一个人类可以回到一两年前,并破坏所有这些系统,这并非完全是天方夜谭。

我们作为一个社会,是如何应对这种情况的?一个重要部分是开源软件,它使得当软件得到改进时,它不会只局限于一个公司的产品,而是可以广泛部署到许多不同系统中,无论是银行、医院还是政府的东西。

随着软件变得更加强大,这是更多的人可以看到它,更多的人可以敲打它,关于这些东西如何工作有一些标准,世界可以一起很快升级。

我认为,在一个AI被非常广泛部署的世界里,它已经随着时间的推移逐步得到强化,所有不同的系统都会以某种方式受到制约。

在我看来,这从根本上比更集中要健康得多。各方面都有风险,我认为这是一种我没听到人们谈论得多的风险,有AI系统做坏事的风险。

但我整夜担心的是,一个不值得信赖的行为者,拥有超级强大的AI,无论是敌对政府、不值得信赖的公司,还是其他什么,我认为这可能是一个大得多的风险。

Dwarkesh Patel:他们有一种别人都没有的武器?

Mark Zuckerberg:或者只是制造大量混乱。我直觉是,由于经济、安全与其他原因,这些东西最终变得非常重要与有价值。

如果你不信任的人,或对手得到更强大的东西,我认为这可能是一个问题。也许缓解这种情况的最佳方式,是拥有良好的开源AI,使其成为标准,并在许多方面成为领导者,它只是确保这是一个更加公平与均衡的竞争环境。

Dwarkesh Patel:这在我看来似乎是合理的。如果这成为现实,将是我更喜欢的未来。我想从机制上理解,世界上存在开源AI系统这一事实,如何防止有人用他们的AI系统制造混乱?以某人带着生物武器的具体例子来说,是不是我们会在世界其他地方做一堆研发来快速找出疫苗?发生了什么?

Mark Zuckerberg:如果你以我提到的安全问题为例,我认为拥有较弱AI的人,试图侵入由较强AI保护的系统,成功的可能性会更小,就软件安全而言。

Dwarkesh Patel:我们怎么知道世界上的一切都是这样?如果生物武器不是这样呢?

Mark Zuckerberg:我意思是,我不知道世界上的一切都是这样的。生物武器,是最担心这类事情的人,关注的领域之一,我认为这很有道理。

有一些缓解措施,你可以尝试不把某些知识训练到模型中。有不同的做法,但在某种程度上,如果你遇到一个非常糟糕的行为者,你没有其他AI来平衡他们,并了解威胁是什么,可能就是一种风险,这是我们需要注意的事情之一。

Dwarkesh Patel:在部署这些系统时,你能看到什么情况?比如你在训练Llama 4,它欺骗了你,它认为你没有注意到什么,你就想这是怎么回事?

这在Llama 4这样的系统中,可能不太可能,但你能想象有什么类似情况,会让你真正担心欺骗性,以及数十亿个这样的副本在野外传播?

Mark Zuckerberg:我意思是,现在我们看到很多幻觉,更多的是这样。我认为这是一个有趣的问题,你如何区分幻觉与欺骗。有很多风险与需要考虑的事情,至少在经营我们公司时,我努力在这些长期的理论风险,与我实际认为当今存在的相当真实的风险之间取得平衡。

当你谈到欺骗时,我最担心的形式,是人们利用这个来制造错误信息,通过我们的网络或其他网络来传播。我们对抗这种有害内容的方式,是建立比对抗性更智能的AI系统。

这也是我对此理论的一部分。如果你看看人们通过社交网络做或试图做的各种伤害,有一些并不是非常具有对抗性的。

例如,仇恨言论在人们没有在种族主义方面变得更好这个意义上,并不是超级对抗性的。这一点上,我认为AI总体上变得越来越复杂,速度比人们在这些问题上要快得多。

我们两方面都有问题。人们做坏事,无论是试图煽动暴力还是其他什么,我们也有很多误报,基本上是我们不应该审查的东西。我认为这可以理解,让很多人感到恼火。我认为随着时间推移,拥有一个在这方面越来越精确的AI将是好事。

在这些情况下,我仍然考虑让我们的AI系统以比他们更快的速度变得更加复杂的能力。这是一场军备竞赛,我认为我们至少目前正在赢得这场军备竞赛,这是我花时间思考的很多东西。

是的,无论是Llama 4还是Llama-6,我们都需要思考我们观察到的行为。

Dwarkesh Patel:你把它开源的部分原因是,还有很多其他人也在研究这个。

Mark Zuckerberg:是的,我们想看看其他人在观察什么,我们在观察什么,我们可以改善什么,我们会评估是否可以将其开源。

我认为在可预见的未来,我对我们能够做到这一点持乐观态度。短期内,我们也不能忽视人们今天试图利用模型进行不当行为的问题。即使这些行为并非毁灭性,但在运营我们的服务时,我们也深知一些相当严重的日常危害。

Dwarkesh Patel:我发现合成数据的事情真的非常有趣。使用当前的模型,通过反复利用合成数据,可能会存在一个性能渐近线,这是有理论依据的。但假设这些模型变得更加聪明,能够利用你在论文或即将发布的博客文章中提到的那种技术,找到最正确的思维链。

你为何认为这不会导致一个循环,模型变得更聪明,产生更好的输出,进而变得更聪明,如此往复?

这种变化不会一夜之间发生,经过数月或数年持续训练,模型的确有可能变得更加智能。

Mark Zuckerberg:我认为,在模型架构的参数范围内,这种循环提升是有可能发生的。就目前80亿参数模型而言,我并不认为它们能够达到与拥有数百亿参数、并融入最新研究成果的先进模型相同的水平。

Dwarkesh Patel:关于这些模型,它们也将是开源的?

Mark Zuckerberg:是的,确实如此。这一切的前提,是我们必须成功解决先前讨论过的那些挑战与问题。我们当然希望如此,我也深知在构建软件的每个阶段,尽管软件本身有着巨大的潜力与可能性,但在某种程度上,运行仍然受到芯片性能的物理限制。

我们总是面临各种物理层面约束。模型能够变得多大,取决于我们所能获取并用于推理的能量有多少。

我对AI技术的未来持非常乐观的态度,相信它们将继续迅速发展和改进。与此同时,我也比一些人更为谨慎。我并不认为失控的情况会特别容易发生,我们仍然需要保持警惕,并认真考虑各种可能的风险,我认为保持开放选择是非常有意义的。

Dwarkesh Patel:Meta作为一家大公司,你可以两者兼顾。至于开源的其他危险,我认为你提出了一些真正合理的观点,关于力量平衡的问题、以及我们可以通过更好的对齐技术或其他方式消除的危害。我希望Meta有某种框架,其他实验室有这样的框架,他们会说如果我们看到这个具体的事情,那就不能开源,甚至可能不能部署。只是把它写下来,这样公司就做好了准备,人们对此有所期待等。

Mark Zuckerberg:关于存在性风险方面,这是一个很好的观点。现在我们更关注我们今天看到的风险类型,更多的是这些内容风险,我们不希望模型做一些帮助人们实施暴力、欺诈或以不同方式伤害人们的事情。

谈论存在性风险,可能在智力上更有趣,我认为,需要更多精力来缓解的真正危害是,有人拿着模型做一些伤害他人的事情。实践中,对于当前的模型,我猜测下一代模型,甚至再下一代模型,这些都是我们今天看到更普通的危害,比如人们互相欺诈之类的。我只是不想低估这一点,我认为我们有责任确保在这方面做好工作。

Dwarkesh Patel:Meta是一家大公司。你可以两者兼顾。

Mark Zuckerberg:没错。

对元宇宙的看法

Dwarkesh Patel:让我们来谈谈其他事情,元宇宙。你最想去人类历史上的哪个时期?公元前10万年~现在,你只是想看看那时候是什么样子?

Mark Zuckerberg:一定要是过去吗?

Dwarkesh Patel:是的,一定是过去。

Mark Zuckerberg:我对美国历史与古典历史非常感兴趣,我对科学史也很感兴趣。我认为看到并试图了解更多关于一些重大进展是如何发生的,会很有趣。关于这些东西,我们所拥有的只是一些有限的知识。

我不确定元宇宙是否能让你做到这一点,对于我们没有记录的事情,要回到过去是很难的,我不确定回到过去是否会是一件重要的事情。我认为这对历史课之类的东西会很酷,这可能不是我对元宇宙整体最兴奋的用例。

对我而言,最主要的事情是,无论我们身处世界哪个角落,都能与他人实时互动、共同存在,我坚信这才是杀手级应用。

在我们进行关于AI的对话中,很多内容都是关于所有这些背后的物理限制。

我认为技术的一个教训是,你要尽可能将事物从物理约束领域转移到软件中,软件的构建与发展要容易得多。你可以让它更加民主化,不是每个人都会有数据中心,但很多人可以编写代码,并修改开源代码

元宇宙版本的目标,是实现真实的数字化存在。这将是绝对巨大的差异,人们不会觉得他们必须为很多事情在一起。现在我认为,在一起可能会有一些更好的东西,这些事情不是非黑即白的。

不会像是,现在你不需要再这样做了。总的来说,我认为这对社交、与人联系、工作、工业的某些部分、医学以及许多其他事情来说,都将是非常强大的。

Dwarkesh Patel:我想回到你在谈话开始时说的一件事,你没有以10亿美元的价格出售公司。

关于元宇宙,你知道你要做这件事,即使市场因此而猛烈抨击你,我很好奇。这种优势的来源是什么?你说,价值观,我有这种直觉,每个人都这么说。如果你要说一些你特有的东西,你会如何表达?你为什么如此确信元宇宙?

Mark Zuckerberg:我认为这涉及到几个不同的问题。

首先,关于是什么驱动我不断前进?我们已经讨论了很多主题。我热爱创造,特别是围绕人们如何交流、表达自己与工作的创造。

大学时,我主修计算机科学和心理学,这两个领域的交集对我来说一直是非常关键的,这也是我强烈的驱动力所在。

我不知道如何解释,我内心深处总觉得,如果我不去创造一些新东西,我就做错了什么。即使在我们为投资1,000亿美元于AI、或元宇宙制定商业计划时,我们的计划已经相当清晰表明,如果这些项目成功,将会带来巨大回报。

当然,你不能从一开始就确定一切。人们总会有各种争论和质疑。就像你怎么会有足够的信心去做这件事?

对我来说,如果有一天我停止尝试创造新东西,我就失去自我,我会去别的地方继续创造。

根本上说,我无法想象自己只是运营某样东西,而不去尝试创造我认为有趣的新事物。对我来说,我们是否要尝试建造下一个东西,这不是问题,我就是无法停止创造。

不仅在科技领域,我在生活其他方面也是如此。例如,我们家在考艾岛建了一个牧场,我亲自参与所有建筑的设计工作。当我们开始养牛时,我就想:我要养出世界上最好的牛。我们开始规划,如何建立起我们需要的一切来实现这个目标。这就是我。

Dwarkesh Patel:我不确定,我对另一件事很好奇。19岁的你,读了很多古代与古典作品,包括高中与大学期间。我想知道,你从这些书籍中学到了哪些重要的教训?不仅是你觉得有趣的内容,更重要的是,考虑到你当时所接触的知识范围毕竟有限。

Mark Zuckerberg:有一件事情让我深感着迷,那就是凯撒·奥古斯都如何成为皇帝,并努力建立和平。那个时候,人们对和平并没有真正概念,他们理解的和平,只不过是在敌人再次攻击之前的短暂间歇。他有着改变经济,从依赖雇佣军与军事主义,到实现正和游戏的远见,这在当时是非常新颖的想法。这反映了非常基本的事实:人们在当时所能想象到的合理工作方式的边界。

这个观念既适用于元宇宙,也适用于AI这样的领域。许多投资者与其他人难以理解我们为什么要开源这些技术。

他们可能会说:我不明白,既然开源了,你们制作专有技术的时间岂不是会缩短?

我认为,这在技术领域是一个深刻的观念,它实际上创造了更多赢家。我不想过分强调这个类比,我确实认为,很多时候,人们难以理解构建事物的模型,难以理解这对人们为什么会是一件有价值的事情,或者为什么这会是世界上一个合理的状态。实际上,合理的事情比人们想象的要多得多。

Dwarkesh Patel:这非常有趣。我能告诉你,我在想什么吗?关于你可能从中得到的东西?这可能完全不对,我认为关键是其中一些人有很重要的角色,他们在帝国中的年龄有多小。例如,凯撒·奥古斯都,在他19岁时,已经是罗马政治中最重要的人物之一。他正在领导战斗,组建第二次三头统治。我想知道19岁的你,是否在想我能做到这一点,凯撒·奥古斯都做到了。

Mark Zuckerberg:这是个有趣的例子,无论是在很多历史,还是美国历史中都是如此。我最喜欢的一句话是毕加索的这句话,所有的孩子都是艺术家,挑战在于随着年龄增长保持艺术家的身份。

当你年轻时,有疯狂的想法更容易。在你生活中,以及对于你的公司或你建立的任何东西,都存在所有这些与创新者困境的类比。

你在轨迹上处于较早的位置,更容易转向,并接受新的想法,而不会破坏对不同事物的其他承诺,我认为这是经营公司的一个有趣的部分。你如何保持动态?

开源价值100亿美元的模型

Dwarkesh Patel:让我们回到投资者与开源的话题。设想一下,我们拥有价值高达100亿美元的模型,这个模型经过严格的安全评估。同时,评估者们也能对模型进行微调。你会开源价值100亿美元的模型吗?

Mark Zuckerberg:只要这对我们有利,开源就是值得考虑的选项。

Dwarkesh Patel:会有帮助吗?100亿美元研发,现在它是开源的。

Mark Zuckerberg:这也是一个,我们需要随着时间推移进行评估的问题。我们有很长的开源软件历史,我们不倾向于开源我们产品,我们不会拿Instagram代码来开源。

我们采用很多底层基础设施,并将其开源。我们历史上最大的一次,可能是我们的Open Compute项目,我们采用我们所有服务器、网络交换机与数据中心的设计,并将其开源,最终它被证明非常有帮助。

很多人可以设计服务器,但业界现在都采用我们设计标准,这意味着供应链基本上都是围绕我们设计建立的。

产量上升,对每个人来说都更便宜,为我们节省数十亿美元,这太棒了。

开源可能对我们有帮助的方式有多种。一种是如果人们想出如何更便宜运行模型。随着时间推移,我们将在所有这些东西上花费数百亿美元,甚至更多。

如果我们能提高10%效率,我们就能节省数十亿或数百亿美元,这本身可能就值得很多。尤其是如果还有其他有竞争力的模型,我们的东西并不是在赠送某种疯狂的优势。

Dwarkesh Patel:你的观点是训练将被商品化吗?

Mark Zuckerberg:我认为这可能有很多种发展方式,这是其中之一。

商品化,意味着它将变得非常便宜,有很多选择。这可能发展的另一个方向,是质的改进。你提到微调,现在,你可以用微调其他主要模型做的事情非常有限。

有一些选择,但通常不适用于最大的模型。有能力做到这一点,不同的特定应用程序的事情或特定用例的事情,或者将它们构建到特定的工具链中。我认为这不仅会实现更高效的开发,还可能实现质的不同。

这里,我想用一个类比来说明。移动生态系统中,一个普遍存在的问题,是存在两家守门人公司苹果与谷歌,它们对开发者构建的内容施加限制。

从经济层面看,这就像我们在构建某样东西时,它们会收取高额费用,更让我担忧的是质量层面。

很多时候,我们想要发布某些功能,苹果会拒绝,这确实令人沮丧。

我们需要思考的是,我们是否正在为AI设置一个由少数几家运行封闭模型公司主导的世界,它们控制API,从而决定开发者能够构建什么?

就我们而言,我可以肯定说,我们构建自己的模型,是为了确保不会陷入这种境地。我们不希望其他公司来限制我们创新能力。

开源角度看,我认为许多开发者也不希望受到这些公司限制。

关键问题在于围绕这些模型构建的生态系统,会呈现出怎样的面貌?将会涌现出哪些有趣的新事物?它们能在多大程度上改进我们产品?

我相信,如果这些模型的发展,最终能够像我们数据库、缓存系统或架构那样,社区将能够为其贡献宝贵的价值,使我们的产品更加出色。

我们仍将努力保持独特性,不会受到太大影响。我们将能够继续专注我们的核心工作,并从中受益。

随着开源社区的发展,所有系统,无论是我们自己的,还是社区的,都将得到改进与提升。

也存在一种可能性,模型本身最终可能会成为产品。这种情况下,是否选择开源,就需要进行更为复杂的经济考量。

一旦选择开源,就相当于在很大程度上将自己模型商品化。从我目前所观察到的情况来看,我们似乎还没有达到那个阶段。

Dwarkesh Patel:你是否期望从向云提供商许可你的模型中,获得可观的收入?他们必须支付费用,才能实际提供该模型。

Mark Zuckerberg:我们希望有这样的安排,我不知道它会有多重要。这基本上是我们对Llama的许可,在很多方面,它是非常宽松的开源许可,只是我们对最大公司使用它有一个限制,这就是我们设置这个限制的原因。

我们不是试图阻止他们使用它,我们只是希望他们来与我们交谈,如果他们打算基本上拿走我们构建的东西,转售它,并从中赚钱。

如果你是像Microsoft Azure或Amazon这样的公司,如果你打算转售该模型,我们应该在其中分一杯羹。在你去做之前,先来与我们谈谈,事情就是这样发展的。

对于Llama 2,我们与基本上所有这些主要云公司都有交易,Llama 2作为托管服务在所有这些云上都可用。

我假设,随着我们发布越来越大的模型,这将成为一件更大的事情。这不是我们正在做的主要事情,但我认为,如果这些公司要销售我们模型,我们应该以某种方式分享其中的好处,这是有道理的。

Dwarkesh Patel:关于开源的其他危险,我认为你提出了一些真正合理的观点,关于力量平衡的问题,以及我们可以通过更好的对齐技术或其他方式消除的危害。

我希望Meta有某种框架,其他实验室有这样的框架,他们会说如果我们看到这个具体的事情,那就不能开源,甚至可能不能部署。只是把它写下来,这样公司就做好准备,人们对此有所期待等。

Mark Zuckerberg:关于存在性风险方面,这是一个很好的观点。现在我们更关注我们今天看到的风险类型,更多的是这些内容风险。

我们不希望模型做一些帮助人们实施暴力、欺诈,或以不同方式伤害人们的事情。

谈论存在性风险,可能在智力上更有趣,但我认为,需要更多精力来缓解的真正危害是,有人拿着模型做一些伤害他人的事情。在实践中,对于当前的模型,我猜测下一代模型,甚至再下一代模型,这些都是我们今天看到的更普通的危害,比如人们互相欺诈之类的。我只是不想低估这一点。我认为我们有责任确保在这方面做好工作。

Dwarkesh Patel:开源而言,我感到好奇的是,你认为PyTorch、React、Open Compute等开源项目对世界的影响,是否有可能超越Meta在社交媒体方面的影响?我曾与这些服务的用户交流过,他们认为这种可能性是存在的,毕竟互联网的大部分运行都依赖这些开源项目。

Mark Zuckerberg:我们的消费产品,在全球范围内拥有庞大用户基础,几乎覆盖全世界一半人口。

我认为开源正成为一种全新、强大的构建方式,它可能会像贝尔实验室一样,最初他们研发晶体管是为了实现长途通话,这一目标实现了,并为他们带来可观利润。

5~10年后,当人们回顾他们最引以为傲的发明时,可能会提到其他更有深远影响的技术。

我坚信,我们构建的许多项目,如Reality Labs、某些AI项目、以及一些开源项目,将对人类的进步产生持久、深远的影响。

具体的产品,会随着时间推移不断发展、出现与消失,它们对人类社会的贡献却是持久的。这也是我们作为技术从业者能够共同参与、令人振奋的部分。

自研芯片上训练模型

Dwarkesh Patel:关于你们Llama模型,它何时会在你们自己的定制芯片上进行训练?

Mark Zuckerberg:很快,我们正在努力推动这一进程,Llama 4可能不是首个在定制芯片上进行训练的模型。

我们采取的方法是,自研定制芯片,先处理我们的排名与推荐类型的推理任务,比如Reels、新闻源广告等。

一旦我们能够将这些任务,转移到我们自己芯片上,我们就能将更昂贵的英伟达GPU用于训练更复杂的模型。

不久的将来,我们有希望使用自己的芯片,我们可以首先用它来训练一些比较简单的模型,最终训练这些非常大的模型。

我要说这个项目进展得很顺利,我们正在有条不紊推进,我们有一个长期路线图。

如果扎克伯格成为Google+ CEO

Dwarkesh Patel:如果你被任命为Google+ CEO,你能让它成功吗?

Mark Zuckerberg:Google+?我不知道,这是一个非常困难的反事实。

Dwarkesh Patel:当Gemini推出时,你们是否感受到压力?

Mark Zuckerberg:我想我们现在更温和了,这是个好问题,问题是Google+没有CEO。它只是公司内部一个部门。

你之前问过什么是最稀缺的商品,但你问的是美元方面的问题。

我认为,对于大多数这种规模的公司来说,最稀缺的是专注。

当你是一家初创公司时,也许你在资金方面更受限制。你只专注于一个想法,你可能没有所有的资源。某个时候,你会跨越一个门槛,进入你所做事情的本质。

你正在构建多个东西,你在它们之间创造更多价值,但你在能够投入其中的精力上变得更加受限。

总有一些情况,组织中会随机发生一些很棒的事情,我甚至都不知道,那些都很棒。但我认为一般来说,组织的能力在很大程度上受到CEO与管理团队能够监督与管理内容的限制,这对我们来说一直是一个重点。

正如本·霍洛维茨所说,我们应该把主要的事情放在首位,并尽量专注于你的关键优先事项。

Dwarkesh Patel:非常好,非常感谢。马克,你做得太棒了。

XR版安卓时刻降临,Meta发布XR版操作系统Horizon OS,开放、开源

时间:2024年4月23日

来源:三次方AIRX

字数:3,011

XR版安卓时刻终于到来,Meta将Quest软件平台重新品牌升级为Meta Horizon OS,并向第三方头戴式设备制造商开放。

运行该平台的头戴式设备,将在包装盒上贴有内置Meta Horizon OS标签。它们将享有与Meta Quest相同的核心软件与平台服务,包括Meta的追踪与混合现实技术以及应用商店。与Quest头戴式设备一样,使用它们将需要Meta账户。

Meta Quest Store将改名为Meta Horizon Store。Quest将仅作为Meta头戴式设备的硬件品牌,Meta将继续推出新的Quest头戴式设备。

目前已经有两家第三方公司,公开宣布他们正在开发全新的运行Meta Horizon OS的头戴式设备:华硕ASUS旗下玩家ROG品牌,推出性能游戏头戴式设备;联想Lenovo推出用于生产力、学习与娱乐的头戴式设备系列。

2024年2月,Meta与LG宣布XR战略合作,包括下一代XR设备开发,表明LG可能正在开发运行Meta Horizon OS的头戴式设备。

Meta CEO扎克伯格表示,他可以想象针对特定用途进行优化的第三方Meta Horizon OS头戴式设备,例如:一款与桌上电脑配对的轻量级头戴式设备,为用户提供最佳工作体验;一款专注沉浸式娱乐,观看电影与视频,具有最高分辨率OLED屏幕;一款完全针对游戏优化,支持各种不同的外设与触觉反馈的头戴式设备;一款专为锻炼设计的额外轻便、具有排汗材料的头戴式设备。

目前不清楚这些是否指的是华硕或联想的头戴式设备,或者只是公司未来可能采取的潜在途径。

Meta正在与微软Xbox部门合作创建限量版Meta Quest头戴式设备,带有Xbox品牌。这款头戴式设备的概念图,表明它将是Quest 3特别版本,扎克伯格表示,盒子里将包含Xbox游戏手柄。

今天的新闻发布仅在两个月前曝光,当时有报道称谷歌试图说服Meta放弃Quest平台,现在是Horizon OS,并转向谷歌即将发布的Android XR平台,预计将在3周后的Google I/O上宣布。

三星是首个宣布采用Android XR的硬件制造商,据称谷歌还在努力争取其他公司的合作。

Meta新战略与已经获得多家主要公司的支持,可能对谷歌在该领域野心构成重大打击,尤其是考虑到联想曾是谷歌2018年前一款VR平台Daydream的合作伙伴。

Meta反复表示,希望谷歌将其Play Store的2D Android应用带到Quest,现在是Horizon OS,承诺可以继续获得现有2D应用销售收入的份额。

谷歌似乎决心拥有完整的XR平台,而不仅仅是Meta的2D应用部分。

未来几年,Meta与谷歌,可能会竭力说服第三方硬件制造商采用他们各自XR平台。技术发展历史表明,除了苹果的封闭平台外,只有一个开放平台。对于XR来说,也会如此?如果是的话,是Meta还是谷歌?

Meta博客原文

混合现实新时代

今天,我们正朝着为元宇宙构建更开放的计算平台的愿景迈出下一步。

我们将为Meta Quest设备提供动力的操作系统,开放给第三方硬件制造商,为消费者提供更多选择,为开发者构建更大的生态系统。

我们正在与全球领先的科技公司合作,使这一新生态系统焕发生机,并使开发者更容易在平台上构建应用,并触及受众。

这个新的硬件生态系统,将运行在Meta Horizon OS上,这是为我们Meta Quest头显提供动力的混合现实操作系统。我们选择这个名字,是为了反映我们对围绕人与连接构建计算平台的愿景,以及使这一切成为可能的共享社交纽带。

Meta Horizon OS,结合了支持当今混合现实体验的核心技术,并提供了一套功能,将社交存在感,置于平台中心。

Meta Horizon OS是Meta 10年来,为构建下一代计算平台而努力的成果。为了开创独立头显,我们开发如 inside-out跟踪等技术;为了更自然的交互系统与社交存在感,我们开发眼睛、面部、手部与身体跟踪技术。

对于混合现实,我们构建一整套技术,用于融合数字与物理世界,包括高分辨率的Passthrough、场景理解与空间锚点。

这项始于Android开源项目的移动优先基础的长期投资,已经产生由数百万人使用的完整混合现实操作系统。

开发者与创造者,可以利用我们为创建混合现实体验而构建的定制框架与工具,并通过内置于操作系统的内容发现与商业化平台,触及他们的社区,并发展他们业务。

这些包括包含世界上最好的沉浸式应用与体验库的Meta Quest商店,我们将把它重新命名为Meta Horizon商店。

目前为Meta Quest设备提供动力的Horizon社交层,将扩展到这个新的生态系统。它使人们身份、头像与朋友群,能够在虚拟空间中随他们移动,并允许开发者将丰富的社交功能集成到他们应用中。

这个社交层,旨在连接多个平台,人们可以在跨越混合现实、移动与桌面设备的虚拟世界中共同度过时间。

Meta Horizon OS设备,也将使用Meta Quest所有者今天使用的相同移动社交应用,我们将把它重新命名为Meta Horizon应用。

新一代硬件

混合现实市场的增长,以及游戏、娱乐、健身、生产力与社交存在感等用例的日益普及,为专业硬件创造新的机会。

正如我们在PC与智能手机行业中所看到的,消费者最好由一个广泛的硬件生态系统服务,该生态系统生产通用计算设备与更专业的产品,所有这些都运行在共同的平台上。

领先的全球科技公司,已经在Meta Horizon OS上开发新的设备:

华硕ROG品牌,将利用作为游戏解决方案领导者的专业知识,开发一款全新的性能游戏头显。

联想,将利用在共同设计Oculus Rift S、以及在工程领先设备(如ThinkPad笔记本电脑系列)方面的深厚专业知识,开发用于生产力、学习、娱乐的混合现实设备。

微软Xbox与Meta,2023年联手将Xbox Cloud Gaming(Beta)引入Meta Quest,让人们可以在混合现实中的大尺寸2D虚拟屏幕上玩Xbox游戏。现在,我们再次合作,共同创造一款受Xbox启发的限量版Meta Quest。

所有这些设备,都将从我们与高通技术公司的长期合作中受益,该公司构建了与我们软件与硬件堆栈紧密集成的Snapdragon®处理器。

高通技术公司的最新Snapdragon XR2 Gen 2平台,与Meta Quest 3一起推出,提供了突破性的性能,推动混合现实可能性的界限。

为这个新生态系统构建硬件的公司,也可以利用这些芯片组与定制软件增强功能的好处。

更开放的应用生态系统

当我们开始向更多设备制造商开放Meta Horizon OS时,我们还在扩大应用开发者触及他们受众的方式。

我们正在开始移除Meta Horizon商店与App Lab之间的障碍,App Lab允许任何满足基本技术与内容要求的开发者在平台上发布软件。

App Lab的标题,很快就会在我们所有设备上商店的一个专门部分中展示,使它们更容易被更广泛的受众发现。

商店上一些最受欢迎的应用,如Gorilla Tag与Gym Class,就是从App Lab开始的,我们很高兴能更容易让开发者在平台上快速发布他们产品。

我们还在开发新的空间应用框架,帮助移动开发者创建混合现实体验。

开发者将能够使用他们已经熟悉的工具,将他们移动应用带到Meta Horizon OS上,或者创建全新的混合现实应用。

开发者可以在这里申请访问,https://developers.facebook.com/m/spatial-app-framework/。

除了更开放的应用商店,Meta Horizon OS将继续为人们提供更多选择,以访问应用的方式。

我们不限制用户只能从我们自己的应用商店获取标题,在Meta Horizon OS上,有多种方式可以获取优秀内容,包括流行的游戏服务,如Xbox Game Pass Ultimate,或者通过Steam Link或我们Air Link系统,无线的将PC软件流式传输到头显上。

我们鼓励Google Play 2D应用商店,来到Meta Horizon OS,在这里,它可以与其他平台上的经济模型一样运作。

混合现实未来

消费者与开发者,都将从多个硬件制造商在一个共同平台上构建的生态系统中获益最多,我们合作伙伴对与我们一起开始这段旅程感到兴奋。

华硕联席CEO S.Y. Hsu:我们被围绕虚拟与混合现实形成的强大游戏社区所鼓舞,我们知道最热情的游戏玩家需要高性能硬件。有了Meta Horizon OS,华硕与ROG将构建下一代游戏头显。

联想董事长、CEO杨元庆:混合现实正在改变人们与计算机交互方式,通过整合数字体验与物理空间,达到新的生产力、学习、娱乐水平。联想正在将Meta Horizon OS,与我们在个人计算领域的领导力与创新结合起来,加速采用新的混合现实用户场景,如虚拟屏幕、远程存在、内容消费、沉浸式培训。

高通公司总裁、CEO Cristiano Amon:物理空间与数字空间融合正在加速,我们看到虚拟现实、混合现实、增强现实正在成为下一个计算平台。为了实现这一未来,这些高性能设备,需要全新的Snapdragon处理器类别。我们与Meta合作,产生了非凡体验,已成为行业基准,我们很高兴看到新生态系统形成。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论