【智能前线】第3期:黄仁勋GTC媒体交流纪要,李飞飞对话英伟达首席科学家Bill Dally

2024年3月19日,黄仁勋完成英伟达GTC 2024开场演讲后第2天,接受全球媒体采访,针对开场演讲中核心内容与市场关注话题,回答媒体提问,涉及AGI何时到来、如何看待中国市场、OpenAI视频生成模型Sora、Sam Altman扩大芯片规模计划、Blackwell GPU定价与销售策略、与台积电关系等,黄仁勋认真回答与阐释,带来更多精彩观点。

2024年3月19日,英伟达GTC 2024大会期间,美国国家工程院院士、斯坦福大学教授李飞飞,与英伟达首席科学家Bill Dally,围绕AI发展、人类在AI时代角色定义、李飞飞新书等话题展开对话。

本期智能前线,选择黄仁勋GTC答媒体问全文、李飞飞对话英伟达首席科学家Bill Dally,腾讯科技发布,六合商业研选精校,分享给大家,Enjoy!

黄仁勋GTC答媒体问全文:未来每个人的计算体验都将变成生成式的

时间:2024年3月21日

来源:腾讯科技

字数:11,002

英伟达2024年GTC大会第2天,黄仁勋接受全球媒体采访,表示芯片制造涉及复杂产业链,一台包含英伟达GPU与GPT的超级电脑,包含数万、甚至数十万部件。许多部件来自中国,这是事实。

回答英伟达与台积电关系是否过密时,黄仁勋表示双方关系可以更紧密,英伟达与所有合作伙伴关系,还可以变得更紧密。

采访中,黄仁勋强调英伟达在未来增长的数据中心市场,将占据更大份额,2023年该市场规模达2,500亿美元,在以每年20%~25%速度增长,英伟达将在其中占据更大份额。

黄仁勋对生成式AI未来表达信心,从能耗角度看,目前传统检索模式的能耗,实际上要比生成式更大。

黄仁勋表示,他与Sam Altman,都相信未来几乎每次与计算机的交互、计算机上显示的每个像素,都将由生成式芯片产生;尽管如今的生成式芯片处起步阶段,但希望通过Blackwell以及未来几代产品,在这一领域做出更多贡献;未来每个人的计算体验,都将变成生成式,对这一点,不会感到意外。

核心要点:

中国大陆市场已经有定制产品L20与H20,已经为相关产品做了最好的性能优化。

Blackwell系列产品,暂时没有报价,接下来会根据成本定价。

全球数据中心业务目前市场规模大概在2,500亿美元左右,英伟达机会不仅在芯片,追求的是数据中心业务增长。

英伟达在以色列有3,300名员工,会持续在以色列投资,印度与日本应该利用自身数据打造AI,而不是出口原材料,进口附加值。

2024年、2025年,对CoWos产能的需求非常大,我们还处在AI与加速计算初期,未来市场与需求依旧庞大,台积电技术很好,他们现在的市场地位是实至名归。

现场提问实录:

Q:请问英伟达今天发布的这些产品,卖到中国的价格会是多少,如果可能的话,能否透露英伟达在中国大陆市场定制产品计划?

黄仁勋:现在展示的就是我们今天发布的所有产品,不管会向中国大陆市场出口哪些具体的SKU,也都会销往全球。关于中国大陆市场,我们提供L20与H20等产品,我们也在为这些版本做最好的性能优化。

Q:你在主题演讲中提到,NVIDIA AI Foundry正与许多企业合作,能告诉我们更多关于你的总体战略与目标吗?

黄仁勋:AI Foundry不是一个软件工具,它的目标是构建软件,NVIDIA始终是一家软件公司。我们很久以前创建的最重要的软件之一叫Cg,后来成为RTS,另一个非常重要的软件叫cuDNN,cuDNN是AI的库,我们有各种不同的库。

未来的库是一个微服务NIMS,未来的库不仅用数学来描述,还用AI来描述。这些库,我们过去称之为Cu,有cuBLAS、cuFFT、cuSPARSE等各种库,未来将是NIMS。

这些NIMS是超级复杂的软件,你只需访问我们AI网站,就可以直接使用它,或者下载它并带到另一个云,或者下载并在你的计算机上运行。

它足够小,可以在你的PC、工作站、数据中心运行,我们会打造NIMS,使其性能非常好。所以这是一种使用NVIDIA库的新方式,当企业运行这些库时,我们有一个你可以许可的操作系统,该操作系统每GPU每年4,500美元。只要你愿意,你可以在上面运行任意多的模型。

Q:你提到旗舰产品价格在3~4万美元之间,没有明确具体是哪一款,现在能提供定价吗?你之前说数据中心业务市值2,500亿美元,英伟达占比会更高,能否详细说明一下英伟达市场占比?

黄仁勋:关于价格问题,我们现在还没有具体报价,很显然,我们并不是单纯的销售芯片。搭载Blackwell芯片的不同系统,价格显然不同,这些系统当中不仅只有Blackwell芯片,也包括NVLink技术。

接下来我们会根据技术成本,给不同产品定价,英伟达不制造芯片,它提供的是数据中心产品。

你可以关注我给大家展示的PPT最后一页,我给大家展示的东西,显然不是芯片。

我们开发了大量软件,为了打造数据中心产品,我们几乎做了所有相关工作,包括英伟达自身也在建设数据中心,我们希望通过这种尝试,让数据中心尽可能高效,再将其拆分成不同规格,以让客户们能够更好决定如何选购数据中心产品,因为客户的网络、存储、控制面板、安全性需求都会有差异,至少在运行管理上都是不同的。

我们会与客户合作,尝试将这些产品整合到客户系统中,我们也组建了相关团队,这与过去买卖芯片的生意是不同的。

我们实际上是在设计数据中心,将我们数据中心整合到其他企业的数据中心当中,这才是我们商业模式。

按照这个逻辑,英伟达的机会在哪里?我想英伟达机会一定不是GPU,这是芯片的机会。你能做GPU,市面上也有大量企业具备这个能力,这与我们追求的数据中心市场是完全不同的。

全球数据中心业务目前市场规模大概在2,500亿美元左右,现在正在快速向加速计算转变,目前生成式AI的发展也证实这样的趋势,这才是我们机会,英伟达已经证明这项业务的成功,我认为我们非常有前景。

Q:Sam Altman一直在与整个芯片行业的人探讨扩大AI芯片的规模,你理解他的意图吗?怎么看待他的做法?这对英伟达会产生什么影响?

黄仁勋:我认为Sam Altman讨论扩大AI芯片规模的意图,主要是因为他看到生成式AI将是巨大的市场机会。

我同意他的观点,认为我们需要回到第一性原则来理解这一点。

目前,计算机生成图像的过程,包括检索、解压缩,最终显示在屏幕上。尽管业内普遍认为这个过程能耗很低,实际上却相反。

每次用户与设备交互,无论是触摸手机,还是发出指令,设备都需要连接到数据中心,从中检索与处理数据,这一过程消耗的能量,远比人们想象的要多。

相比之下,如果我必须每次回答问题,都跑到办公室去,而不是直接回答,无疑会更加耗能。

我与你的交流,在很大程度上依赖生成式AI,这种方式比传统的基于检索的方式更为高效。未来,我们预见到的是,计算过程将越来越多采用生成式,而非基于检索的模式。这种生成方式不仅需要智能化,还要能够理解上下文等因素。

我们,包括我与Sam Altman,都相信未来几乎每次与计算机的交互、计算机上显示的每个像素,都将由生成式芯片产生。尽管如今的生成式芯片还处于起步阶段,我们希望通过Blackwell以及未来几代产品,在这一领域做出更多贡献。

如果未来每个人的计算体验都变成了生成式,我不会感到惊讶,尽管目前尚未实现这一点。这无疑是一个巨大的市场机会,我认为Sam Altman的观点是对的,这对英伟达而言也是积极的发展方向。

Q:我们已身处被大语言模型或其他基础模型完全改变的世界,未来我们人人都会拥有自己的基础模型,你怎么看?

黄仁勋:问题在于我们如何拥有自己的个人大语言模型。

首先得有人,通过持续微调,这是相当耗时的过程,接着是提示词的优化,这涉及到提示词工程,以及上下文的记忆等,我的答案是将这些工作进行组合。

未来人们可能只需要对少数高权重的参数进行微调,聚焦在提示工程、上下文这些工作上,所有这些元素的叠加,就是你自己的特殊大模型,它可以部署在某个云服务中,也可以部署在你的个人计算上。

Q:在你演讲之后,AI芯片初创公司Groq在X上发声,说它们产品还是比你们快,对此有何评论?

黄仁勋:我真的很生气,我对这个芯片并不太了解,我知道Token生成是非常困难的事情,这还取决于你的模型是什么。

Token生成确实很困难,每个模型都需要它自己特定的分区方式,因为transformer并不是每个模型的名称,而是一项技术。

每个人谈到的transformer,都与transformer技术有关,它们的名称中都包含了transformer。它们之间都非常不同,其中一些使用混合专家模型Mixture of Experts,MoE的技术,而不是前馈网络。

有的专家模型混合,有2个专家网络Experts,有的有4个专家网络Experts。它们工作的划分方式,以及信息如何从一个专家路由到另一个专家的方式都是不同的。因此,每一个这样的模型都需要非常特殊的优化。

如果计算机太专一,它被设计来做非常具体的事情,它就需要以非常特定的方式工作,这就变成一台可配置的计算机,而不是一台可编程的计算机。可配置计算机也有它的用处,但它无法从软件创新的速度中获益。

这就是为什么CPU的神奇之处,不能被低估的原因。CPU之所以能够持续作为CPU,并且多年来一直超越主板上这些可配置的东西,原因非常简单:CPU是可编程的,软件工程师的创造力可以通过CPU得以实现。如果你把它固定在芯片上,你就切断了软件工程师的智慧。

NVIDIA找到一种方法,能够从一种非常专门的计算形式中获益:并行计算,大规模多线程,基于流的计算模型,容忍延迟。

NVIDIA的处理器,有一系列不同的属性,使其性能非常出色。与此同时,它也是可编程的。如果你留意,从AlexNet开始,实际上只有一种架构持续存在。从AlexNet到所有其他的Net,如ResNet、RNet、PLUSNet、GRU以及强化学习模型,然后是Transformer的出现。

有很多不同种类的Transformer以及其他模型,状态空间模型,Transformer与状态空间模型的结合。

人们处理上下文、记忆与架构的方法,简直太疯狂了。能够让一个模型工作得很好,是很重要的,这是一个重要的发现。最终,AI不是关于芯片模型,而是软件模型。芯片的作用,是为了促进软件,我们任务是促进下一个软件的进步。

Q:昨天宣布的NIM等软件,带来哪些增长机会?你在采访中曾提到,未来人们不再需要编码,只需用语言即可表达需求。你是在暗示大家应该掌握这些新的技能吗?

黄仁勋:我首先来回答第二个问题。我认为人们应当广泛学习各种技能,比如弹钢琴,小提琴可能真的很难,数学、代数、微积分与微分方程等方面知识同样重要。

我认为人们应该尽可能掌握更多技能,这并非意味着编程是成为成功人士的必要条件。曾有一段时间,学习编程被广泛提倡,很多行业领袖也有类似观点,并认为这样能提高效率,我认为这种观念是错误的。

学习C++等编程语言,并不是每个人的必修课,计算机的发展应该帮助降低编程门槛,让更多人能够轻松使用。

有一点可能被忽略了,我认为AI对社会最大的贡献在于打破了技术壁垒。你不一定要成为C++程序员,你现在可以成为一名提示词工程师。这门槛是大大降低的,就像我妻子与我交流时,她就是一个优秀的提示词工程师,我们之间的沟通非常顺畅。

我认为我们都需要学习如何有效提示AI,这与我们学习如何与团队成员沟通并无本质区别。根据你的工作需求与对结果质量的期望,你可能会以不同的方式提示对方。将来,你也会以类似方式与AI互动。根据你对答案的期望程度,你可以采用不同提示方式提示它。

每个人都知道如何使用电脑,未必了解背后编程原理。我相信AI所实现的伟大成就之一,就是缩小技术门槛,让更多人能够轻松享受科技带来的便利。YouTube上,你可以看到很多人创作关于AI的视频,他们并没有编写任何程序,却能利用AI创造出有趣的内容。这正是我想要表达的观点。

当然,如果企业有需求雇佣程序员,也是可以的,我们在不同领域都需要专业的人才。

至于第一个问题,你提到的关于增长的最大机会。我认为我们目前正在建设的两种类型的数据中心,为我们提供了巨大机遇。一种是安全、现代化的加速数据中心,另一种是AI生成中心,也可以称之为提示生成中心。这是我们最近的重点项目,也是我们认为的长远发展机会。

我们目标是帮助客户构建与利用AI。目前市场上已经有很多优秀的AI产品被创造出来,但很多企业在实际应用中遇到困难。有些算法以原始形式存在,很难直接应用于实际场景。

我们将积极投入研发,创建新的模型,并与一些合作伙伴共同合作。我们会选择最受欢迎的模型,并将它们开源,以便更多人可以使用。

仅仅拥有这些可用、预训练的模型,并不足以满足所有需求,用户仍然需要根据自己需求进行调整,以便更好适应特定场景。

为了确保项目的安全性与可访问性,我们需要提供一系列服务,这些我们称之为NIM服务。

一旦我们完成这些工作,我们软件就可以在任何地方运行。本质上讲,我们不仅要发明AI,还要制造AI。通过制造这些AI,并将其嵌入到我们软件中,每个人都可以在自己产品中使用它们。目前,我们软件业务已经价值近10亿美元。我相信,制造AI将成为庞大的业务。

Q:你刚提及的技术鸿沟问题,我认为确实存在,可能正在扩大。如今,许多非技术背景专业人士,如医生、律师、经理以及服务行业的领导者,对AI等新技术带来的变革,以及它们将如何引领业务发展的认识并不深刻。他们擅长自己专业工作,但可能并不清楚这些技术在未来几年内,将如何重塑他们行业。你能给他们什么建议?

黄仁勋:回答你问题时,我注意到一个现象:参加GTC大会的,不仅有计算机行业的公司,更有来自医疗保健、医药、金融服务、制造、工业、消费、广告、汽车、运输以及物流等多个领域的公司。这充分说明,大多数公司并非专注计算机行业,计算只是他们业务中一个环节,他们才是各自行业领域的核心。

由于AI技术快速发展,计算机已经变得更容易使用,我们已经帮助这些公司跨越技术鸿沟。无论是医疗保健提供商,还是其他行业公司,现在都有比以往任何时候拥有更大机会,利用AI与计算技术来推动他们自己业务发展。

我们看到AI领域初创公司数量正在急剧增长,他们目标是各个行业。事实上,他们目标远不止计算机行业。我们可以清晰看到,各行各业都已经开始认识到,我们产品所具备的不可思议的能力,他们都有能力充分利用这些技术。

Q:你谈到在模拟中使用生成式AI来大规模训练机器人。具体我们不知道如何模拟,特别是当机器人需要从结构化环境,转移到家庭这样非结构化环境时。我想知道,你认为模拟的极限是什么?当我们达到这些极限时,会发生什么?我们如何继续训练机器人?

黄仁勋:有几种不同的方式,来考虑这个问题。

首先,大语言模型为我们提供独特、强大的试验场,用于测试与调整各种想法。这些模型在完全开放与非结构化环境中运行,确实带来一些挑战,也为我们提供巨大的创新空间。

大语言模型的泛化能力,令人惊叹。它们不仅能够概括信息,还能根据上下文进行微调。通过几次迭代或者简单提示,我们可以引导模型理解特定场景,比如制作煎蛋卷。这个过程中,我们可以详细描述环境、工具、限制条件等,让模型生成符合要求的文本或指令。

这引发一系列科学问题。如何更好利用大语言模型的泛化能力?如何优化提示,使模型更准确理解我们意图?模型生成的符号token,如何与机器人学中的实际操作相结合?这些都是值得深入探讨的问题。

你提到的token化,对于软件来说,没有区别,无论是文本,还是机器人动作,都可以被转化为token进行处理。

这为我们提供了统一的方式来描述与操作各种信息。计算机科学家正在解决这个问题,他们确实会不断研究与探索,将各种信息包括手势、动作等转化为token,并建立起相应的概括与语境化机制。这样,机器人就能够根据输入的token进行理解与处理,最终输出相应结果。

你提到的强化学习与人类反馈是非常关键的部分。通过大量的问答示例与适当答案,机器人可以学习到如何根据问题给出合适回应。这种基于人类反馈的强化学习,使得机器人能够不断优化自己回答,提高准确性与可靠性。

你给出的咖啡示例,非常生动与形象,它展示了机器人如何通过类比来理解,并执行任务。这种类比思维,在机器人学中具有重要意义,它使得机器人能够更好适应各种复杂与多变的环境。

最后,你提到我们大脑对语言与机器人运动之间区别的局限性。我们往往很难区分这两者,但对于计算机来说,它们只是数字而已。这种认识上的差异,使得我们需要更加深入探索机器人学的本质与可能性。

Q:你是如何看待AI幻觉,特别是在医疗等关键任务中,你必须信息确保100%准确。你认为这个问题可以解决吗?

黄仁勋:关于生成式AI的幻觉现象,确实是需要关注的问题。

通过采用检索增强生成的方法,我们可以有效解决这一问题。检索增强生成强调在生成答案之前,首先进行广泛网络查询与搜索,确保答案准确性与可靠性。这种方法避免AI编造答案的情况,而是直接从网络上读取相关信息。通过对搜索结果的优先级排序与筛选,我们可以选出最准确、最真实的答案来回答你的问题。

也许AI知道某个网站某些信息,也许它只知道该网站上描述,有些内容可能是不正确的,它会拒绝所有不正确的信息,找到最有意义的答案,AI会重新描述这个答案给你。

这个AI实际上是在为你做研究,不仅是在回答你的问题。它首先进行研究,确定哪个答案最好,总结给你。

这样解释清楚了吗?这根本就不是幻觉,而是在做研究。你现在拥有的这个聊天机器人不仅是一个闲聊的机器人,它实际上是一个研究助手,为你总结信息,根据信息的重要性,坚持要求它在回答我的问题之前先进行研究。

以下场景不是AI的真正意义所在,如果我知道答案是常识,只是不知道确切的答案到底是什么,比如热茶的温度是多少?我不太确定,你可以查一下,这完全没有必要让AI来做。

Q:我想知道,构建像Blackwell这样平台时,你们是如何预估算力需求。亦或者说,如果目标基本上只是以尽可能快的速度把算力提高到无穷大,你们是如何从功耗与可持续发展角度考虑的?

黄仁勋:这个问题的答案很简单。我们必须弄清楚我们物理极限是什么,我们要尽可能超越这些物理极限。现在,我们应当如何超越物理极限?超越物理极限的方法是提高能效,我们要做的第一件事就是提高能效。

正如我昨天展示的那样,过往训练1.8万亿参数的模型,需使用8千个Hopper GPU,功耗15兆瓦。相比之下,同样工作,只需要2千个Blackwell GPU即可完成,功耗降低到4兆瓦。可以说,Blackwell能效更高,仅仅是Hopper的4/15。因为能效更高,所以我们可以突破极限。

能效与成本效率是首要任务。我向你们展示了我们能够以30倍速度,为大型语言模型生成Token。换种说法,地球上没有东西比它快30倍。我们把速度提高30倍这一事实表明,我们这样做,节省了大量能源,也就是说,生成同等数量Token,只需要1/30能源。能效与成本效率,实际上是我们所做的一切的核心。

Q:有没有让你感到特别兴奋的重大技术突破?

黄仁勋:这样的例子太多了。其中一些让我兴奋是技术原因,还有一些让我兴奋是因为第一次接触到它们。

我举一些例子,我对Sora的出现倍感兴奋,我认为Sora非常的神奇。自动驾驶公司Waymo 2023年展示的技术,同样令我感到兴奋。

你可以看到我们2年前所做的一些例子,它与文生视频有关,模型必须对物理有敏感的认识。当放下杯子时,杯子会放在桌子中间;行人会在路面上行走。这些并不遵守物理定律,而是要对物理有所感知。

举例来说,预测3公里范围内天气,所需要的超级计算机的运算量,比目前用于天气预测的计算机大2.5万倍。这种情况,我们能够预测出极端天气对当地社区的影响。

要实现天气的精准预测,就要尽可能多地取样。我们将能效提高3,000倍,我们可以采样1万次而不是一次。我们获得正确答案或最可能答案的能力,大大提高。

对生物技术公司来说,能够根据氨基酸序列预测蛋白质形状非常重要,这些公司可以利用这些预测,来设计新药、改良作物、可生物降解塑料等各种产品。我们如今可以使用AI模型来完成这项工作,不必再使用超级计算机完成它。

Q:能否更深入了解你对药物发现的看法?量子计算能否对药物发现有所帮助?

黄仁勋:英伟达可能是全球最大的不构建量子计算机的量子计算公司。我们这样做的原因,是因为我们相信量子计算,量子计算不仅是一台量子计算机。当它发生时,量子计算机很可能是一个加速器,有点像是视频加速器。量子计算被用于非常特殊的领域,不会适用于所有计算。这就是我们推出CUDA-Q量子计算平台,而不是量子计算机的原因。CUDA Quantum平台,能够让我们模拟量子计算机。

目前,我们模拟的量子计算速度比量子计算机更快。我们可以用它在量子电路中发送信号,以便算法专家可以开始在量子计算机上工作。

我们可以用它来做后量子密码学Post-Quantum Cryptography,让世界为量子时代的到来做好准备,所有的数据都已经被编码了,我们可以为量子计算做出贡献。

我们与全球绝大多数量子计算机公司、研究人员、以及量子计算机制造商合作。可以说,我们信赖量子计算。

关于数字生物学,事实上,我们新推出的AI推理微服务NIM全部的感受力都来自我们对数字生物学的研究。

Q:能否谈谈英伟达与台积电关系?过去几年间,随着封装等问题的复杂性不断增加,你们两家公司间关系发生哪些变化?

黄仁勋:台积电可能是英伟达最密切的伙伴关系之一。我们做的事情非常困难,台积电工作非常出色。台积电在中国台湾省组装我们设备,考虑到零部件来自全球各国与地区,供应链并不简单。台积电做了大量工作与各个大公司协作,这家公司也意识到紧密协作在未来是必须的。可以说,台积电帮我们解决了一切问题。

在设备组装完成之后,还需要第三家公司对它进行测试;第四家公司必须将其整合到一个大系统中。你需要一台超级计算机来测试它。为了把它置入数据中心,想象制造车间就是一个巨大的数据中心,可以说,数据供应链的复杂性与变化非常大。

我们不仅是在制造芯片,单是这个芯片就是一个奇迹。当人们问我,你们造的是什么,或者你们如何制造GPU这样问题时,他们可能认为制造芯片有点像是制造集成电路。在我看来,GPU不仅涉及到硬件制造,台积电对我们非常重要。

Q:在英伟达向云业务转移同时,一些云制造商也开始制造芯片。你对这种趋势有何看法?我的问题有两个部分。

首先,大型科技公司生产芯片,会对你长期定价策略产生影响吗?其次,英伟达云战略是什么,尤其是在中国市场,英伟达是否会在中国市场发布VGX?如果不会,英伟达会提供什么解决方案?

黄仁勋:我们推出了HGX,并把技术出售给戴尔。戴尔把HGX植入计算机,再对外出售。我们这样做的原因是,我们开发了在戴尔设备上运行的软件。我们创造市场需求,把戴尔推给同行。戴尔并不像我们一样了解英伟达技术,我们必须去帮助戴尔创造需求,帮助戴尔创建这些系统,并为其开发软件。

我们的云业务,采用相同策略。我们与云服务提供商合作,把NVIDIA云放在他们云中。我们不是一家云计算公司,我们的云被称为VGX云,实际上是在他们云服务当中。我们目标与对待戴尔目标一样,是让客户使用他们的云服务。

我们自己开发软件,培养开发人员,我们为使用英伟达架构的云服务提供商创造需求。这与其他公司开发芯片没有任何关系。我们之所以这样做,是因为英伟达是一家计算平台公司,计算平台公司必须培育自己开发人员,这也是我们召开GTC开发者大会的主要原因。

如果我们是一家x86公司,为什么需要召开开发者大会?世界上每个人都使用x86,召开开发者大会,是因为我们的架构仍在被接受,它的使用很复杂,我们必须召开GTC大会。DRAMs不需要开发者大会,以太网不需要开发者大会,英伟达这样的计算平台需要开发者大会,我们需要开发人员。

Q:2023年纽约召开的GTC大会上,你曾说AGI将会在5年内出现。你现在是否仍是这种观点?

黄仁勋:首先是关于AGI的定义问题,我相信每个人都很难做到这一点。我希望你具体定义一下AGI,这样我们每个人都知道我们什么时候能够实现它。就像是定义圣克拉拉的位置一样,它的地理位置非常具体,所有人都知道何时能够到达那里。再比如说,即便是所处的时区不同,我们所有人都知道新年何时会到来。

AGI有点不太一样,如果我们指定AGI是非常具体的东西,这意味着大量的测试,数学测试、阅读测试、逻辑测试、医学考试、律师考试、经济测试、GMAT、SAT等。

当我说AGI的定义,就是它能够通过这一整套测试,比超过80%的人都要好,你认为计算机能够在5年内实现这一目标吗?答案当然是肯定的。

当我每次回答这个问题时,我对AGI的定义就是这些,并不是所有人都这么认为。究竟什么是AGI,取决于你们目标是什么。我的目标是与你们交流,你们目标是弄清楚要讲什么故事。在我看来,AGI将会在5年内出现。

Q:2023年你提到有一句非常激进的话,认为将来每个像素都将被生成,而不是被渲染。你认为我们距离每个像素都在实时帧率下生成的世界还有多远?

黄仁勋:我认为在技术上,几乎所有事情的S曲线都不会超过10年,10年后,你就在S曲线的另一端。从现在开始到未来5年,一切都在实时发生变化,可能某一段,我们都会身处于S曲线10年中的某2年。

Q:最新财报发布后,你们市值创下历史新高,也吸引日本市场关注。能否分享一下英伟达在扩大日本AI能力方面取得的进展,对于英伟达在日本市场的产品与业务,你有什么期望?

黄仁勋:我认为日本现在更加意识到提高生产力的重要性。我们都知道,当一家公司生产力提高时,收益就会提高。收益提高后,我们会雇用更多人。公司变得更有生产力时,我们收入就会增长,收入增长后,就会雇佣更多人,生活质量也会提高。

像许多国家一样,日本也需要提高生产力。AI是提高国家生产力的最佳方式,我认为日本意识到这一点,你们还意识到日本拥有独特的大数据与语言及文化,没有理由仅通过第三方收集这些数据后创建AI,再导入日本,让日本市场为此付费,这毫无意义,你们应该自己创建AI。

出于AI主导性的需求,以及国家生产力与企业生产力的考虑,AI在日本将变得极为重要。

Q:你对以色列员工提供了前所未有的支持,是否会让你面临来自投资者或其他方面的反对意见?英伟达是否计划在以色列扩大业务、开设更多研发中心、收购更多公司?英伟达与以色列的未来,会有什么样的合作?

黄仁勋:以色列是英伟达最重要的基地之一,在人均算力上,以色列是英伟达最大的驻扎地之一。目前,我们在以色列有3,300名员工,以色列还汇聚了我们一些最有才华的工程师与我们的重要投资。

特别的是,BlackWell架构的其中一种核心技术,也是来自以色列。以色列这个地区,对我们来说至关重要,我们将继续在以色列进行大量投资。我们也在西岸招聘员工,支持所有在西岸的巴勒斯坦员工,我们会照顾他们及其家人,保证他们每一个人都能获得帮助。

员工需要知道公司是支持他们的,一个人只有知道自己拥有牢固的基础,才能充分发挥出自己工作能力。

英伟达是一家强大的公司,我们有着坚实的基础,我们对员工给予明确支持。我们会继续在以色列投资,并给予当地员工支持。

Q:印度最近承诺通过公私合作伙伴关系,获得1万个GPU,英伟达是其中之一吗?印度的AI计算能力,目前不到世界的2%,你的看法是什么?

黄仁勋:如果印度正在购买用于AI的GPU,我想就此发表一下我的想法。我认为英伟达制造了非常优秀的AI GPU,当你回去时,请告诉大家:我们在这方面做得很好;第二,我对此很感兴趣。

如果有人想买一些GPU,我愿意做生意。请传播这个消息:英伟达愿意做生意,我认为AI确实是巨大的机会。

当我去印度时,通常有机会见到莫迪总理。这确实是件非常非凡的事情,他曾对我说,Jensen,印度不应该出口面粉进口面包。

这很有道理。为什么要出口原材料、进口其附加值?为什么要出口印度数据,以便你可以进口AI?我们应该在印度找到它,为它增值,这是第一点。

第二点,印度拥有世界上最多的IT专业人员,他们正在重新培训以适应AI。当我与印度领导人会面时,他们非常清楚,这是他们重新培训自己的最大机会之一。他们将不再只是为公司后台服务的IT,而是成为在公司前台创造价值的IT。

AI被用于工程、营销、销售、财务、业务运营、营销策略等。所有这些都属于前台工作,而不是后台。印度正寻求进入IT的前台,那里拥有最大的市场机会。

Q:我们都知道台积电很关键,尤其是CoWos的产能,大家都希望有更高产能,有消息说今需求增加了3倍,你怎么看3倍这个数字?

黄仁勋:你想要具体的数字?这很有趣。2024年,我们对CoWos需求非常大,这是你们想要的答案吗?

我们正处于向AI过渡的开始阶段,正处于向AI与加速计算的平台转变的开始阶段。我们只进入了几千亿美元的旅程,这个世界有1万亿美元的计算机。我们处在这段旅程的开始部分,还有很长的路要走。

我非常有信心台积电会不断增长。他们做了一些艰苦工作,理应得到现在位置。他们的技术很棒,人们工作非常努力,他们为通往AI的旅程,做好完美准备,他们的定位非常好。

Q:三星或SK海力士,除了HBM业务,其他方面怎么样?

黄仁勋:除了HBM业务,三星、SK海力士怎么样,这个问题就好像在问,除了家人之外,台积电怎么样?或者说,你们还想与英伟达合作除了GPU以外的业务吗?

实际上,HBM内存非常复杂,有很高附加值,我们在这个业务上投入很多资金。

三星表现非常出色,韩国制造了世界大多数先进产品,但是HBM内存非常复杂,不要将它等同DDR5,这完全不是一回事,它更像逻辑芯片一样。我们与三星关系非常好,也希望能够更加紧密合作。SK海力士非常出色,这就是为什么他们在各自领域成为世界领先的原因。

李飞飞对话英伟达首席科学家Bill Dally:AI就像电力,给它设置单独监管机构没意义

时间:2024年3月20日

来源:腾讯科技

字数:10,734

这次对谈中,李飞飞讲了个故事。当她完成自己的书初版时,好朋友、哲学家、斯坦福以人为本AI研究院联合主任约翰·埃奇门迪看了初稿后建议她重写。他说很多人都在写关于AI的书,李飞飞有一段独特的历程,能代表很多觉得自己在AI领域没有发言权或找不到认同感的人。这些人包括移民、年轻女性、各行各业的人,他们不一定是典型的硅谷AI人士。如果李飞飞能给他们一个声音,这将更有力量。

李飞飞,一面是斯坦福大学教授,美国工程学院院士,AI视觉领域顶尖专家,业内称为AI教母;另一面是出生在北京,长于四川,12岁随双亲前往美国,因生活拮据不得不去餐馆打工,这就是艾奇门迪提到的李飞飞的独特的经历。

整场对谈,李飞飞用一种很不同的思考AI视角,来给这个AI时代失语的普通人一个声音。是一种更有人文情怀,更具社会责任,也更女性细腻的视角。

这次访谈中,李飞飞直接回答关于AI的技术发展路径与未来应用等具体行业问题,只占全部讨论不到1/4。

这并不是对谈者,英伟达首席科学家Bill Dally没问这些问题,他问了Sora发展会如何影响影视行业,李飞飞回答是宫崎骏动画的无可替代,以此证明只有人能利用AI创作能触动他人、启发他人或服务他人的内容,AI做不到。

Bill Dally问了AI科学未来的影响,李飞飞答案是AI在医疗领域的应用可能是最深远的。答案很中规中矩,她的理由是在这个领域工作的女性与有色人种,可以借由AI摆脱艰苦、被忽视的照护工作,老年人可以通过技术获得更有尊严的暮年。

哪怕是在关于技术路径的问题中,她的回答也朝向人的细腻与独特。像辛顿、杨立昆一样,李飞飞不相信单纯依靠缩放定律,就能高效解决一切问题,她认为我们需要结构化的模型引导AI。

与其他人都不同,她最终理想模型是感知的、超越语言互动的模型,只有能掌握人类在5.4亿年时间里形成的细微的、比文字更人性的感知,AI才算有了基础模型。

其他时间里,李飞飞都在聊公共部门在AI发展中面对的困境,聊AI监管模式,这些看似离人们非常远的话题,李飞飞还是站在每个人的角度思考着。

公共部门意味着公共利益,意味着与每个人相关。只有公共部门得到足够支持,才能推动科学发现创新、为公众提供客观解释、培养负责任的人才,让AI的繁荣落在每一个人头上。

在李飞飞那里,所有AI的发展都是关于人,具体的人。

整场对谈最后一分钟半,Bill Dally问题已问完,请李飞飞讲她想传递给所有人的话。李飞飞先讲自己故事,一个住在美国乡镇里爱跳舞的女孩故事,她不是计算机科学家,不是理科毕业的,甚至家里连电脑都没有,她还是与AI产生如此多的联系,在AI发展中扮演了一个角色。

我们不要被时髦的术语吓到,不要迷茫于AI时代自己角色。只要把AI当成工具,人类不仅是工具创造者,我们也是如何使用工具的决策者。去拥抱它,去做决策者,做让它被正确使用,变得更好的人。我们在AI时代的未来一定会像马丁路德想的那样,让人类文明的弧线朝着正义、希望、仁爱方向发展。

这就是我们每个人,每个普通人,非硅谷精英应该在这个AI时代里的角色。

这也是李飞飞对每个人的恳求:在AI发展中有一个角色。

我不是盲目乐观,我相信AI会带来好的未来

Bill Dally:感谢来到GTC。李飞飞是斯坦福以人为本AI研究院HAI Stanford的联合创始人。到目前为止,你认为AI对人类影响最大的领域是什么?你认为未来AI将在哪些领域产生最大影响?

李飞飞:这是非常宏大的问题。AI目前对人类影响是什么?我认为AI可能是21世纪最深刻的技术,它正在改变我们生活、工作与未来,AI是一种智能技术。

在这之前,人类技术发明,大多停留在不涉及智能层面,无论是发明工具让我们走得更快、飞得更高,还是发明工具让我们能看到人眼看不到的东西,这些都还是机械性。

AI的发明,如理解语言、翻译语言、做决策、发现模式等,这些都是人类基本能力,现在都受到这项深刻技术的挑战。

在我看来,AI的影响是对人类本质、能力与定义的深刻影响。

Bill Dally:你认为在人类某些特定领域,如医疗、教育或交通等,AI会产生比其他领域更大的影响吗?

李飞飞:我认为AI的应用,非常广泛。我担任谷歌云首席科学家时,我看到商业分析是AI一大应用领域。我完全同意你的看法,医疗、交通、教育、软件工程等领域,AI影响将是无边无际。

Bill Dally:一些业界名人如马斯克与Sam Altman,认为AI可能对人类构成生存威胁。你怎么看?AI可能带来的最大风险是什么?是换脸技术,还是失业?AI的不利影响有哪些?

李飞飞:我认为这是合理的问题,作为大学里的人,尤其是在大学校园工作,我们应该被允许提出各种问题,包括AI是否对人类构成生存威胁。

智力角度说,这是一个重要的关于未来的问题。作为一个物种,人类应该认识到,我们发明的一切,不仅是AI,还包括我们正在改变地球的方式,改变我们与环境关系的方式,都需要我们审慎对待。

就AI而言,我更关注更直接与紧迫的灾难性风险。你提到的一些风险,是深层次的社会问题。

例如,AI可能错误信息而影响民主,可能取代工作或改变劳动力市场格局,可能影响我们与数据的关系、隐私与公平性。如果我们不能很好管理这项技术的应用,这些都可能带来灾难性的社会风险。

Bill Dally:你最近写了一本关于AI的科学回忆录,我这里有一本。大家现在应该都从亚马逊上订购这本书。你能告诉我们一些关于这本书的情况吗?你为什么要写这本书?

李飞飞:这本书是一本科学回忆录。就像你说的,我把科学这个词放在第一位。这本书有一个双螺旋结构,通过我作为一名计算机视觉科学家的视角,讲述了AI发展历程。我看到,智能在自然界的进化,始于对世界感知。

过去十几年里,AI的进化,特别是深度学习的历史,与计算机视觉这个领域的进化,紧密交织在一起。这是AI在过去10年左右的发展历程,也与一个年轻科学家的个人成长历程交织在一起。

我之所以觉得有必要写这本书,是当我被要求写一本关于AI的科普书时,我确实花了1年时间在疫情大流行期间写了一本只关于AI的书。

我们好朋友,哲学家、斯坦福以人为本AI研究院联合主任约翰·埃奇门迪看了我初稿,基本上说我应该重写,我当时非常沮丧。

他说,很多人都在写关于AI的书,但你有一段独特的历程。你代表了很多觉得自己在AI领域没有发言权或找不到认同感的人,这些人包括移民、年轻女性、各行各业的人,他们不一定是典型的硅谷AI人士。如果你能给他们一个声音,这将更有力量。我把这本书的结构,改成了双螺旋结构。

Bill Dally:非常有趣。AI的发展历程,与你作为一名科学家的成长历程,交织在一起。

假设AI在10年后变得成熟,如果你要为这本书写个续集,你认为它会是什么样?

李飞飞:我不认为我想写续集。如果这么做的话,这肯定是一项充满爱的工作。如果我要为这本书写续集,我想写一个人类胜利的故事。

我要讲述我们如何利用这项技术,让生活与工作变得更好。我这么说,并不是出于盲目乐观,我知道世界非常复杂。

对年轻人来说,这个世界有时甚至感觉有点反乌托邦。但如果你看人类文明发展历程,它是很长的。

正如马丁·路德·金所说,如果我们能以正确方式使用技术,人类文明的弧线是朝着正义、希望、仁爱的方向发展的。

就像在这次GTC大会上,我们只是看到技术改变生活的冰山一角。我们看到如何利用这项技术改变医疗,从药物发现、到个性化治疗、再到医疗服务。

我们才刚开始思考,教育如何从根本上被改变,突然之间我们有了一个教学助手,可以进行深度个性化学习与教学。

我们看到,科学发现,可以在强大的机器与认知助手的帮助下加速,这些助手可以真正加速人类已进行了数百年的科学发现过程。

所有这些,都给了我们希望之光,希望我们在5~10年内能利用AI寻找气候解决方案,普及医疗服务,照顾好地球与我们自己。

如果我要写续集,我想写的就是这些。

Bill Dally:我希望这就是我们要写的未来,这是一个非常乐观与积极的世界观。

李飞飞:我之所以乐观,是我们正在一起努力。我不是坐在这里空谈,而是真的相信,如果我们相信,我们就去做。

Bill Dally:没错,我们一起努力创造我们想要的未来。

李飞飞:是的。

公共部门没有GPU,基础创新就不会再发生

Bill Dally:你一直呼吁为学术界提供资源,以推进AI研究。迄今为止,真正掌握训练模型所需GPU与数据的,还是资金雄厚的大公司。你认为未来这种情况,会如何发展?国家AI研究资源NAIRR能否实现并民主化AI,让学术界与小公司也能接触到?还是人才将继续从学术界流向大公司?

李飞飞:我认为我们俩现在都在白宫的各种顾问职位,你是总统科技顾问委员会PCAST成员,我是拜登总统NAIRR特别工作组成员。对不知道NAIRR是什么的人,NAIRR是国家AI研究资源试点项目。

几年前,斯坦福HAI倡导联邦政府考虑增加对公共部门AI的资源投入,尤其是计算资源与数据资源。这转化为一项目前仍在国会讨论的法案,名为创建AI法案CREATE AI BILL。如果这项法案获得通过与拨款,它将创建联邦基金,用以建立一个国家AI云、以及供公共部门使用的数据存储库。

斯坦福HAI一直在引领这场运动。我之所以在华盛顿特区花这么多时间,是我相信公共部门AI与私营部门AI同样重要。

就像Bill说的,现在的平衡如此失衡。这个国家,现在没有一所大学能训练出GPT聊天模型。我们没有成千上万GPU,更不用说A100、H100或B200。

有些人可能会问,这有什么问题?反正我们有伟大的公司,伟大的大型科技公司在创造伟大的技术。我认为这是事实,私营部门在蓬勃发展。

我想让大家认识到,公共部门创造公共利益。什么是公共利益?公共利益有几个维度,对我们当下与未来都很重要。

首先,公共利益包括好奇心驱动与知识驱动的发现与创新,这太重要了。你们现在所知道关于AI的一切,最初都始于学术界无人知晓的好奇心驱动的研究课题。从感知机、到反向传播算法、再到ImageNet,这些都来自公共部门。这种天马行空式、好奇心驱动的研究,至关重要。它是一种公共利益,对我们社会的持续创新很重要。

公共利益第二部分,是作为公众值得信赖的合作伙伴去解释、教育与评估技术。

私营部门有自己的目标,谁来作为值得信赖的合作伙伴,让我们了解这项技术有多安全?透明度指数是多少?数据是否有偏差?我们如何以公平、值得信赖的方式,使用这个推论?这些都是公共部门正在做,而且可以帮助公众的重要话题。

最后,同样重要的是,公共利益一种形式是最重要的,那就是人才,这是为了明天的人才。我们肩负很大责任,教育出不仅能发展未来科技的劳动力,而且是能对世界负责任的劳动力。这些劳动力不仅要学习如何编写AI代码,还要学习AI的道德框架,AI的社会影响。这些都是公共利益,支持公共部门AI很重要。

Bill Dally:在人才话题下继续,如果我们要发展公共部门AI,意味着我们需要把AI专家吸引到公共部门。鉴于目前AI人才市场的情况,正在上演激烈竞价战,开出的薪酬是联邦政府工资等级所能支付的好几倍。你设想如何吸引真正优秀的AI人才,进入公共部门?

李飞飞:这是很好的问题。我记得10年前,你还是系主任,想把人才吸引到学术界。

首先,在这个国家,进入私营部门的学生总是会更多,我们不是要实现50/50平衡。对那些一心想留在公共部门或去学术界的人,我真的希望给他们提供资源非常重要。他们不是在寻求英伟达级别的薪酬,他们想要获得的是计算资源。

就我个人而言,我与学生们希望有这样的计算资源,这样我们就可以与斯坦福医院合作,从事可能需要几百个GPU的项目,他们想要一个不会不断流失人才的社区。

他们同学、同事以及公共部门与私营部门的合作伙伴关系,在为他们提供资源方面可以发挥很大作用。

我也想呼吁公共部门本身的创新。我们公共部门,我们机构,这个国家已有几百年历史,那里的结构需要创新,这是为了应对当今快速变化的行业格局与人才格局。我们自己应该做一些工作,我希望双方都能努力,让情况变得更好。

Bill Dally:在公私合作标题下,你对NAIRR试点项目,有何看法?

我们非常勤奋的国会公共代表,正在推动法案,以授权与拨款NAIRR。与此同时,一个试点项目已启动,主要是捐赠资源,英伟达提供了3,000万美元,微软提供相当数量GPU。这会产生影响吗?你认为这将如何运作?

李飞飞:很好的问题。对那些不知道的人,NAIRR试点项目,就像Bill说的,是总统2023年11月AI行政命令拨款的一小部分计算资源,这是行政命令的一部分。

我积极的看到私营公司走到一起,试图支持这项工作。作为一名学者,我太忙于支持NAIRR,错过申请这些算力的截止日期。这一轮我不会受益,我确实看到全国各地申请这个项目的同事有可能受益。

我直言不讳地说,这个项目太小了,我不知道算不算杯水车薪。我不是想否定它,这是很好的第一步,我希望没有人对此感到满足。

我希望白宫、国会、行业领袖们,都不要满足于此,它实在是太小了。考虑到当前大模型规模、数据的规模,以及公共部门可以用这些计算资源做事情的潜力,这真的只是沧海一粟,我们还有很多工作要做。

AI就像电力,给它设置单独监管机构没意义

Bill Dally:你一直在把公共部门与私立大学混为一谈。如果把它们分开,问一下你认为政府实际上会如何使用AI?它会更好为人民服务吗?它会简化各种政府服务的途径吗?真正的公共部门应用有哪些?

李飞飞:即使是私立大学,也是非营利组织,我说的公共部门,更多的是非营利组织。

你提出一个很好的问题,关于政府使用AI这件事,就AI而言,政府既是服务提供者,也是监管者,我认为政府扮演着这两个角色。

在斯坦福HAI,我们有顶尖的学者与美国政府合作,无论是国税局、环保局还是其他机构,我们都在利用AI实现政府服务现代化,我们在座的人都会受此影响。

我们可能觉得许多政府部门的服务缺乏现代化,我认为AI真的可以像帮助企业一样,无论是呼叫中心还是个性化帮助,AI都可以大有作为。

在金融部门或者公共部门的金融领域,AI可以进行欺诈检测,可以帮助确定案件的优先级。上周我在华盛顿特区与退伍军人事务部部长交谈,讨论我们如何利用AI更好服务退伍军人。政府确实有很多应用,只是为了实现服务现代化,让服务更有效率、更有成效。

Bill Dally:你提到的政府,在AI方面的另一个角色是监管,欧盟最近通过一项AI监管法案。在美国,当然也有一些参议员与国会议员,在谈论做类似事情,许多情况下,他们觉得自己在社交媒体上错过机会,他们不想在AI上落后。你认为AI监管,将走向何方?它会带来好处,还是坏处?

李飞飞:这是非常深刻的问题。就安全至上的监管而言,欧盟往往在时间上领先于美国。美国作为一个社会,引以为豪的是我们创新环境。我绝对是中间派,这让我很无聊。

Bill Dally:你绝不无聊。

李飞飞:我绝对相信监管有它的作用。就像如果你有一个房子,如果你家里有孩子,就会有一些准则。对每一项创新,你都要设计对应安全带,想想安全带拯救了多少生命。临床监管努力使我们药品更安全,尽管还不完美。

AI是一项如此深远的技术,我们不能不监管它,但如何进行有效监管,非常关键。

你也在PCAST任职,政府角度看,我们有两种方向的力量:一种是让社会创新,利用这项技术,提升每个人与社会繁荣;另一种是确保它安全、可信、公平、透明;我认为这就是监管与激励之间的张力,我们必须深思熟虑去做。

举个例子,我个人确实相信垂直领域,尤其是医疗、金融、交通等这些我们已有监管框架的垂直领域,是时候更新它了。有许多迫切的用例,现在是时候让他们审视AI的影响。

例如,医疗器械。我们有很多医疗器械,它们受到很宽松的FDA检查或许可。我们应该真正关注这些垂直领域,看看我们如何在产品与服务中保证AI安全,让其在这些领域发挥作用。

更深层次的监管措施,比如它如何影响我们民主,社交媒体。我不得不承认,这是公民社会、学术界、政府等许多部门,正在进行的一场复杂斗争。

我认为在过去20年,或者至少15年里,我们做得并不好。我同意你的看法,希望我们不要继续犯错,至少我们需要从中吸取教训。

Bill Dally:我同意关注垂直领域是正确做法,每个垂直领域,无论是监管汽车AI的NHTSA,还是监管医药AI的FDA等。

我认为你可以将其应用于社交媒体,它对应的监管机构是FCC。FCC监管通信,无论是广播还是互联网。

有人建议,我们实际上需要一个新的机构来监管AI,独立于应用领域,这对我来说没有任何意义。你怎么看?

李飞飞:我认为AI在某种程度上,类似电力或计算机,我认为我们不能为电力或计算机设立一个机构。我很难想象一个独立的AI机构,AI是如此横向。

AI在医学中应用,可能是最深远、最广泛的

Bill Dally:从蛋白质折叠到天气模拟,AI正在迅速加速科学发展。过去一个博士生折叠一个蛋白质,AlphaFold一夜之间完成大约20万个。你认为AI在科学领域最大应用是什么?你认为这将如何改变科学事业?

李飞飞:我认为这是最令人兴奋的。我已提到,如果你看人类文明历史,最终还是这些科学发现与创新产生深远影响。AI作为一种辅助科学发现的新工具,是我们这个世纪的机遇。

我很荣幸坐在斯坦福校园里,与来自神经科学、材料科学、纳米科学、航空航天、肿瘤学、化学等领域朋友与同事交谈。

不管我把目光投向哪里,我都能看到他们对AI所产生数据的兴奋,对它们形成新假设的兴奋,以及AI如何成为加速他们发现过程的超级力量讨论。

我认为,回到公共部门,特别是大学的作用这个问题上,我认为加倍、三倍投入科学发现,正是大学应该做的,这就是机会所在。

Bill Dally:你个人非常投入,将AI应用于医学的许多努力。这个领域,你认为目前最令人兴奋的事情是什么?你认为这个领域10年后会是什么样?

李飞飞:说到写这本书续集,如果我要写续集,我希望一半的内容是关于医疗保健与医学,我认为AI在医学中的应用可能是最深远、最广泛的。我个人并没有从事上游药物发现、生物化学、基因组学等工作,但在那里,AI与生物技术结合正在迅速加速。

过去10多年里,我恰好从事医疗保健最下游的工作,也就是医疗服务提供。这是护士、医生、家庭护理工作者照顾病人、老人与慢性病患者的地方。这里安全是一个问题、也存在劳动力短缺。即使有护理人员,这也是非常不平衡的市场,往往主要是女性与有色人种在这个领域工作,他们甚至没有被计入GDP。医疗服务提供中存在很多不平衡、低效率与人类苦难。

我看到的机会是,AI真的可以成为守护天使或辅助守护天使。

例如,我与斯坦福医院合作,在病房中安装被动传感器,非侵入性、保护隐私的被动传感器,帮助医院监测重要的临床相关事件:比如病人即将跌倒的危险,病人病情突然恶化的征兆,临床医生不当的手部卫生习惯等。

这些都是当前医疗保健中,尚处于黑暗空间的临床相关工作,作为一种智能传感器的AI,真的可以帮助照亮黑暗空间,未来它甚至可以进入家庭。

如果我们相信技术将带来繁荣,将转变工作,我们需要相信人类生活需要继续以更有尊严、更独立、更自尊的方式生活。

随着社会老龄化,我们希望老年人拥有尊严、独立、良好的生活环境。AI可以帮助确保这一点:即使你独自生活,即使你患有慢性病,AI传感器与AI技术也可以在不侵犯你空间的情况下关注你,与你的护理人员或家人保持关于你健康状况的沟通。

这就是我工作的医疗服务提供领域,我对此充满热情。

除了缩放定律,AI另一个方向是建立感知的基础模型

Bill Dally:这是非常令人兴奋的未来。我们已看到模型从早期ImageNet时代的ContralNets,到用于语言的RNN,再到Transformer,它发展得非常快。接下来会是什么?这些新的状态空间模型是否有前景?或者你认为未来我们主导网络模型会是什么?

李飞飞:目前最新的是扩散模型,但我还没有一个名字给你。如果我有,我现在就会去注册。

我认为,首先,我继续相信数据的缩放定律,我认为我们还没有看到这方面的终点。关于我们是否已看到语言数据的极限,有很多猜测,我不知道答案,我不从事语言领域工作。

但就世界数据、多模态数据而言,还有很多数据可用,人类与自然正在生产并利用这些数据,继续看好使用支持这些数据的模型架构。

Bill Dally:如果你把这种chinchilla缩放定律应用于LLMs,应用于多模态数据,意味着随着我们获得越来越多的世界数据进行训练,我们需要越来越大的模型,你认为事情正朝着这个方向发展吗?

李飞飞:我认为这是一个方向,我相信的另一个方向是世界结构。我有点嫉妒那些搞NLP的同事,根本上说,语言是一个一维结构。我从事视觉工作,它从根本上是三维的。如果加上时间,就是四维的。三维结构要丰富得多,但也复杂得多。

当我们用大数据进行扩展时,如果是完全盲目扩展,我想英伟达会很高兴,你们会卖出更多芯片。我想看到的是结构化建模,或着说偏向三维感知与结构的模型与大数据相结合。我认为,要真正创造出空间智能,创造出我们今天仍然缺乏的世界模型。

Bill Dally:你是在暗示,类似许多类型科学模拟中使用的物理信息神经网络。你会扩展到利用人类对世界的先验知识,用它来使这些世界模型更有效?

李飞飞:是的,物理学就是对动力学与结构的信息输入及推导。

Bill Dally:你认为基础模型是会出现在世界层面上?也就是说我们可以问它任何关于世界的问题,它会以多模态四维格式回答我们?

李飞飞:我确实认为基础模型,会出现在世界层面。我认为你不需要只是问它问题,这是一种以语言为中心的交互方式,我认为实际上你应该可以与它互动。

看看人类,或者生物体,作为一个计算机视觉人,我想提醒大家一件事,自然花了5.4亿年时间来创造感知大脑,创造语言大脑只花了几十万年,感知是非常非常深刻的。

AI替代不了人性的部分,这就是未来的工作

Bill Dally:这是个很好的观点,感知领先语言几百万年。或者说感知更难,需要更长时间。人们对AI的一个担忧,是它会扰乱就业市场。你可以说它会创造就业机会,也可能使其他工作变得不重要。你认为什么样的人类工作,是AI或机器人永远无法取代的?

李飞飞:这是一个很棒的问题。你应该提前告诉我,你要问这个。这些问题,我几天前都给你发过了。这是一个危险的问题。

自人类文明伊始,我们祖先想象过的每一种工作,基本上都是由机器协作完成的。移动、飞行、计算等。我觉得工作的定义是什么?如果工作是一项任务,比如抓起某样东西或做一个煎蛋,我想它会被机器完成。

如果工作是人性的一部分,是定义我们创造力的一部分,定义我们独特性,定义我们意图、我们同情心、我们与他人独特的情感联系,以及我们每个人对他人或对社会可能产生的独特贡献,我认为这些永远不会被完全取代。

我们会利用机器,来帮助我们更好完成这类工作,但我没有看到一个根本性的取代。

让我们再次回到医疗保健领域,我花了几10年时间,在医院里照顾我年迈的外籍父母。每次我带着父母走进病房,我都会看着人类照顾人类,或者人类需要人类来照顾人类。在这种关系与互动中,有一些非常深刻的东西,是任何机器人、AI、电脑、AR/VR,或者你认为的任何下一代技术都无法完全取代的。

老师与孩子、父母与孩子也是如此,我们真正珍视的服务,我们所做的旅行。人性方面,在人与人的互动方面,有太多超越计算、机械的东西,我认为这些将是会保留下来,并不断演变的工作。这样我们将越来越多被机器赋予超能力,作为人类的核心,不会被取代。

Bill Dally:很明显,观众被你深深打动了。你以一种人性关怀的方式,与他们建立了联系。你是在暗示同理心、情感联系与关怀,还有创造力。创造力是人类的核心特质,如果我们选择训练AI模型具有这些特征,我们能做到吗?我们可以建立有同情心的AI模型,让它能在情感上与人联系吗?

李飞飞:某种程度上可以。我再次强调一下,我从事计算机视觉工作。现在已有了深度创造性的文本、到图像,以及文本到视频的生成模型。

我也认为,就像这里没有人能预测下一个爱因斯坦会是谁一样,这种创造力,创造力的不确定性,将永远存在我们人类社会中。

无论你如何训练机器,都无法训练出人类智能或人类创造力。这不仅是爱因斯坦,还有贝多芬、莎士比亚、梵高,还有太多太多,而且不一定非要是聪明的人。

我自己的孩子,我不认为任何机器都能创造出一个甜美、聪明、幽默的小家伙。

Bill Dally:这是独一无二的人性,机器无法取代。说到创造力,生成式AI正在做一些了不起的事情。

OpenAI最近推出Sora,你可以输入提示,就能得到看起来很棒的视频。我们最终,也许当你在10年后写续集时,是否会发展到如果你想看一部电影,只需写几行提示,它就会为你生成一部两小时的电影?

李飞飞:我不认为这需要10年。多生产一些B200,它很快就会出现。技术而言,我认为这即将到来,创建更长时间的生成性世界、生成性故事情节、生成性角色互动的能力,指日可待。

Bill Dally:这样一个世界里,我们有AI程序生成大部分内容,那些在好莱坞或游戏工作室等地方的人类内容创作者的角色是什么?

李飞飞:这又回到人类独特性,我不知道你们中有多少人是宫崎骏、吉卜力工作室粉丝。

是的,它是最棒的,我喜欢一遍又一遍看他们电影。从计算机图形学角度看,它相当初级,他们不做皮克斯与梦工厂那样复杂图形。

那些独特的故事,比如《龙猫》故事多简单,电影中人性表达单纯,除了宫崎骏,没有人,没有人能创造出那样的东西,我认为这仍然是人性。

AI会创作电影,会创作娱乐人们的内容,只有人能利用AI创作能触动他人、启发他人或服务他人的内容,AI做不到。我确实看到了这种共生的可能性。

不管那些技术词汇多陌生,我希望你在AI时代中有一个角色

Bill Dally:你是在暗示AI基本上会接管这些创意事物的制作部分,制作真正引人注目的视频,让图像看起来很棒。最终在情感层面上与人联系,去讲述一个能让人流泪的故事,这将是人类应该努力的部分。

李飞飞:没错。我一直强调的一点,就是在这个机器时代,不要忘记我们人性,不要忘记我们尊严,不要忘记彼此尊严与人性。这是我们的核心,这是我们的独特之处。这也是我们构建机器应用、使用机器的开端。

Bill Dally:我们还剩1分32秒。你还有什么想传达给观众的吗?也许能再次让他们给予掌声?

李飞飞:让观众鼓掌,这是一个很高的标准。

我想说的一点是,GTC是一个特别的会议。你们来到这里,是你们都以某种方式参与AI。当我写出这本书,并与全球各地观众,特别是年轻观众交谈时,我经常被问到一个问题。每次有人问这个问题,我仍然会被触动,我在这个AI时代的角色是什么?我不是计算机科学家,也不是斯坦福大学理科专业;我不做软件工程,我不是在有电脑的家庭长大。我热爱跳舞,我也会为我一个类似农村的社区服务。

所有这些来自各行各业的人都在问我,他们会在AI时代扮演什么角色。AI看起来如此复杂,它有7,000亿个参数,你怎么用自己的大脑来理解这么庞大的东西?然后是所有这些花哨的词,transformer、生成式、扩散式,它们似乎离每个人都很遥远。

我真的想把它归结为:这是一个工具,它是一个需要一些数学与计算来实现的工具。归根结底,人类不仅是工具创造者,我们也是如何使用工具的决策者;我们是工具应用的创造者,我们也是工具的用户;我们是决定如何管理工具,以及管理想要使用工具人的选民。在参与AI方面,有很多公民的可能性。

我特别希望年轻人,热爱艺术、热爱社区、热爱法律、热爱医学、热爱化学的人,无论你的兴趣是什么,都能以负责任的态度拥抱这项技术,你们实际上可以为让它变得更好、更好使用它,而有所作为。

这真的是我对每个人的恳求:你们在AI发展中,有一个角色,请加入我们,让它变得更好。

Bill Dally:谢谢你,飞飞。我想你激励了每个人,也给了我们很多思考的内容。非常感谢你抽出时间。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论