【智能前线】第3期：黄仁勋GTC媒体交流纪要，李飞飞对话英伟达首席科学家Bill Dally_老虎社区_美港股上老虎

【智能前线】第3期：黄仁勋GTC媒体交流纪要，李飞飞对话英伟达首席科学家Bill Dally

2024年3月19日，黄仁勋完成英伟达GTC 2024开场演讲后第2天，接受全球媒体采访，针对开场演讲中核心内容与市场关注话题，回答媒体提问，涉及AGI何时到来、如何看待中国市场、OpenAI视频生成模型Sora、Sam Altman扩大芯片规模计划、Blackwell GPU定价与销售策略、与台积电关系等，黄仁勋认真回答与阐释，带来更多精彩观点。

2024年3月19日，英伟达GTC 2024大会期间，美国国家工程院院士、斯坦福大学教授李飞飞，与英伟达首席科学家Bill Dally，围绕AI发展、人类在AI时代角色定义、李飞飞新书等话题展开对话。

本期智能前线，选择黄仁勋GTC答媒体问全文、李飞飞对话英伟达首席科学家Bill Dally，腾讯科技发布，六合商业研选精校，分享给大家，Enjoy！

黄仁勋GTC答媒体问全文：未来每个人的计算体验都将变成生成式的

时间：2024年3月21日

来源：腾讯科技

字数：11,002

英伟达2024年GTC大会第2天，黄仁勋接受全球媒体采访，表示芯片制造涉及复杂产业链，一台包含英伟达GPU与GPT的超级电脑，包含数万、甚至数十万部件。许多部件来自中国，这是事实。

回答英伟达与台积电关系是否过密时，黄仁勋表示双方关系可以更紧密，英伟达与所有合作伙伴关系，还可以变得更紧密。

采访中，黄仁勋强调英伟达在未来增长的数据中心市场，将占据更大份额，2023年该市场规模达2,500亿美元，在以每年20%~25%速度增长，英伟达将在其中占据更大份额。

黄仁勋对生成式AI未来表达信心，从能耗角度看，目前传统检索模式的能耗，实际上要比生成式更大。

黄仁勋表示，他与Sam Altman，都相信未来几乎每次与计算机的交互、计算机上显示的每个像素，都将由生成式芯片产生；尽管如今的生成式芯片处起步阶段，但希望通过Blackwell以及未来几代产品，在这一领域做出更多贡献；未来每个人的计算体验，都将变成生成式，对这一点，不会感到意外。

核心要点：

中国大陆市场已经有定制产品L20与H20，已经为相关产品做了最好的性能优化。

Blackwell系列产品，暂时没有报价，接下来会根据成本定价。

全球数据中心业务目前市场规模大概在2,500亿美元左右，英伟达机会不仅在芯片，追求的是数据中心业务增长。

英伟达在以色列有3,300名员工，会持续在以色列投资，印度与日本应该利用自身数据打造AI，而不是出口原材料，进口附加值。

2024年、2025年，对CoWos产能的需求非常大，我们还处在AI与加速计算初期，未来市场与需求依旧庞大，台积电技术很好，他们现在的市场地位是实至名归。

现场提问实录：

Q：请问英伟达今天发布的这些产品，卖到中国的价格会是多少，如果可能的话，能否透露英伟达在中国大陆市场定制产品计划？

黄仁勋：现在展示的就是我们今天发布的所有产品，不管会向中国大陆市场出口哪些具体的SKU，也都会销往全球。关于中国大陆市场，我们提供L20与H20等产品，我们也在为这些版本做最好的性能优化。

Q：你在主题演讲中提到，NVIDIA AI Foundry正与许多企业合作，能告诉我们更多关于你的总体战略与目标吗?

黄仁勋：AI Foundry不是一个软件工具，它的目标是构建软件，NVIDIA始终是一家软件公司。我们很久以前创建的最重要的软件之一叫Cg，后来成为RTS，另一个非常重要的软件叫cuDNN，cuDNN是AI的库，我们有各种不同的库。

未来的库是一个微服务NIMS，未来的库不仅用数学来描述，还用AI来描述。这些库，我们过去称之为Cu，有cuBLAS、cuFFT、cuSPARSE等各种库，未来将是NIMS。

这些NIMS是超级复杂的软件，你只需访问我们AI网站，就可以直接使用它，或者下载它并带到另一个云，或者下载并在你的计算机上运行。

它足够小，可以在你的PC、工作站、数据中心运行，我们会打造NIMS，使其性能非常好。所以这是一种使用NVIDIA库的新方式，当企业运行这些库时，我们有一个你可以许可的操作系统，该操作系统每GPU每年4,500美元。只要你愿意，你可以在上面运行任意多的模型。

Q：你提到旗舰产品价格在3~4万美元之间，没有明确具体是哪一款，现在能提供定价吗？你之前说数据中心业务市值2,500亿美元，英伟达占比会更高，能否详细说明一下英伟达市场占比？

黄仁勋：关于价格问题，我们现在还没有具体报价，很显然，我们并不是单纯的销售芯片。搭载Blackwell芯片的不同系统，价格显然不同，这些系统当中不仅只有Blackwell芯片，也包括NVLink技术。

接下来我们会根据技术成本，给不同产品定价，英伟达不制造芯片，它提供的是数据中心产品。

你可以关注我给大家展示的PPT最后一页，我给大家展示的东西，显然不是芯片。

我们开发了大量软件，为了打造数据中心产品，我们几乎做了所有相关工作，包括英伟达自身也在建设数据中心，我们希望通过这种尝试，让数据中心尽可能高效，再将其拆分成不同规格，以让客户们能够更好决定如何选购数据中心产品，因为客户的网络、存储、控制面板、安全性需求都会有差异，至少在运行管理上都是不同的。

我们会与客户合作，尝试将这些产品整合到客户系统中，我们也组建了相关团队，这与过去买卖芯片的生意是不同的。

我们实际上是在设计数据中心，将我们数据中心整合到其他企业的数据中心当中，这才是我们商业模式。

按照这个逻辑，英伟达的机会在哪里？我想英伟达机会一定不是GPU，这是芯片的机会。你能做GPU，市面上也有大量企业具备这个能力，这与我们追求的数据中心市场是完全不同的。

全球数据中心业务目前市场规模大概在2,500亿美元左右，现在正在快速向加速计算转变，目前生成式AI的发展也证实这样的趋势，这才是我们机会，英伟达已经证明这项业务的成功，我认为我们非常有前景。

Q：Sam Altman一直在与整个芯片行业的人探讨扩大AI芯片的规模，你理解他的意图吗？怎么看待他的做法？这对英伟达会产生什么影响？

黄仁勋：我认为Sam Altman讨论扩大AI芯片规模的意图，主要是因为他看到生成式AI将是巨大的市场机会。

我同意他的观点，认为我们需要回到第一性原则来理解这一点。

目前，计算机生成图像的过程，包括检索、解压缩，最终显示在屏幕上。尽管业内普遍认为这个过程能耗很低，实际上却相反。

每次用户与设备交互，无论是触摸手机，还是发出指令，设备都需要连接到数据中心，从中检索与处理数据，这一过程消耗的能量，远比人们想象的要多。

相比之下，如果我必须每次回答问题，都跑到办公室去，而不是直接回答，无疑会更加耗能。

我与你的交流，在很大程度上依赖生成式AI，这种方式比传统的基于检索的方式更为高效。未来，我们预见到的是，计算过程将越来越多采用生成式，而非基于检索的模式。这种生成方式不仅需要智能化，还要能够理解上下文等因素。

我们，包括我与Sam Altman，都相信未来几乎每次与计算机的交互、计算机上显示的每个像素，都将由生成式芯片产生。尽管如今的生成式芯片还处于起步阶段，我们希望通过Blackwell以及未来几代产品，在这一领域做出更多贡献。

如果未来每个人的计算体验都变成了生成式，我不会感到惊讶，尽管目前尚未实现这一点。这无疑是一个巨大的市场机会，我认为Sam Altman的观点是对的，这对英伟达而言也是积极的发展方向。

Q：我们已身处被大语言模型或其他基础模型完全改变的世界，未来我们人人都会拥有自己的基础模型，你怎么看？

黄仁勋：问题在于我们如何拥有自己的个人大语言模型。

首先得有人，通过持续微调，这是相当耗时的过程，接着是提示词的优化，这涉及到提示词工程，以及上下文的记忆等，我的答案是将这些工作进行组合。

未来人们可能只需要对少数高权重的参数进行微调，聚焦在提示工程、上下文这些工作上，所有这些元素的叠加，就是你自己的特殊大模型，它可以部署在某个云服务中，也可以部署在你的个人计算上。

Q：在你演讲之后，AI芯片初创公司Groq在X上发声，说它们产品还是比你们快，对此有何评论？

黄仁勋：我真的很生气，我对这个芯片并不太了解，我知道Token生成是非常困难的事情，这还取决于你的模型是什么。

Token生成确实很困难，每个模型都需要它自己特定的分区方式，因为transformer并不是每个模型的名称，而是一项技术。

每个人谈到的transformer，都与transformer技术有关，它们的名称中都包含了transformer。它们之间都非常不同，其中一些使用混合专家模型Mixture of Experts，MoE的技术，而不是前馈网络。

有的专家模型混合，有2个专家网络Experts，有的有4个专家网络Experts。它们工作的划分方式，以及信息如何从一个专家路由到另一个专家的方式都是不同的。因此，每一个这样的模型都需要非常特殊的优化。

如果计算机太专一，它被设计来做非常具体的事情，它就需要以非常特定的方式工作，这就变成一台可配置的计算机，而不是一台可编程的计算机。可配置计算机也有它的用处，但它无法从软件创新的速度中获益。

这就是为什么CPU的神奇之处，不能被低估的原因。CPU之所以能够持续作为CPU，并且多年来一直超越主板上这些可配置的东西，原因非常简单：CPU是可编程的，软件工程师的创造力可以通过CPU得以实现。如果你把它固定在芯片上，你就切断了软件工程师的智慧。

NVIDIA找到一种方法，能够从一种非常专门的计算形式中获益：并行计算，大规模多线程，基于流的计算模型，容忍延迟。

NVIDIA的处理器，有一系列不同的属性，使其性能非常出色。与此同时，它也是可编程的。如果你留意，从AlexNet开始，实际上只有一种架构持续存在。从AlexNet到所有其他的Net，如ResNet、RNet、PLUSNet、GRU以及强化学习模型，然后是Transformer的出现。

有很多不同种类的Transformer以及其他模型，状态空间模型，Transformer与状态空间模型的结合。

人们处理上下文、记忆与架构的方法，简直太疯狂了。能够让一个模型工作得很好，是很重要的，这是一个重要的发现。最终，AI不是关于芯片模型，而是软件模型。芯片的作用，是为了促进软件，我们任务是促进下一个软件的进步。

Q：昨天宣布的NIM等软件，带来哪些增长机会？你在采访中曾提到，未来人们不再需要编码，只需用语言即可表达需求。你是在暗示大家应该掌握这些新的技能吗？

黄仁勋：我首先来回答第二个问题。我认为人们应当广泛学习各种技能，比如弹钢琴，小提琴可能真的很难，数学、代数、微积分与微分方程等方面知识同样重要。

我认为人们应该尽可能掌握更多技能，这并非意味着编程是成为成功人士的必要条件。曾有一段时间，学习编程被广泛提倡，很多行业领袖也有类似观点，并认为这样能提高效率，我认为这种观念是错误的。

学习C++等编程语言，并不是每个人的必修课，计算机的发展应该帮助降低编程门槛，让更多人能够轻松使用。

有一点可能被忽略了，我认为AI对社会最大的贡献在于打破了技术壁垒。你不一定要成为C++程序员，你现在可以成为一名提示词工程师。这门槛是大大降低的，就像我妻子与我交流时，她就是一个优秀的提示词工程师，我们之间的沟通非常顺畅。

我认为我们都需要学习如何有效提示AI，这与我们学习如何与团队成员沟通并无本质区别。根据你的工作需求与对结果质量的期望，你可能会以不同的方式提示对方。将来，你也会以类似方式与AI互动。根据你对答案的期望程度，你可以采用不同提示方式提示它。

每个人都知道如何使用电脑，未必了解背后编程原理。我相信AI所实现的伟大成就之一，就是缩小技术门槛，让更多人能够轻松享受科技带来的便利。YouTube上，你可以看到很多人创作关于AI的视频，他们并没有编写任何程序，却能利用AI创造出有趣的内容。这正是我想要表达的观点。

当然，如果企业有需求雇佣程序员，也是可以的，我们在不同领域都需要专业的人才。

至于第一个问题，你提到的关于增长的最大机会。我认为我们目前正在建设的两种类型的数据中心，为我们提供了巨大机遇。一种是安全、现代化的加速数据中心，另一种是AI生成中心，也可以称之为提示生成中心。这是我们最近的重点项目，也是我们认为的长远发展机会。

我们目标是帮助客户构建与利用AI。目前市场上已经有很多优秀的AI产品被创造出来，但很多企业在实际应用中遇到困难。有些算法以原始形式存在，很难直接应用于实际场景。

我们将积极投入研发，创建新的模型，并与一些合作伙伴共同合作。我们会选择最受欢迎的模型，并将它们开源，以便更多人可以使用。

仅仅拥有这些可用、预训练的模型，并不足以满足所有需求，用户仍然需要根据自己需求进行调整，以便更好适应特定场景。

为了确保项目的安全性与可访问性，我们需要提供一系列服务，这些我们称之为NIM服务。

一旦我们完成这些工作，我们软件就可以在任何地方运行。本质上讲，我们不仅要发明AI，还要制造AI。通过制造这些AI，并将其嵌入到我们软件中，每个人都可以在自己产品中使用它们。目前，我们软件业务已经价值近10亿美元。我相信，制造AI将成为庞大的业务。

Q：你刚提及的技术鸿沟问题，我认为确实存在，可能正在扩大。如今，许多非技术背景专业人士，如医生、律师、经理以及服务行业的领导者，对AI等新技术带来的变革，以及它们将如何引领业务发展的认识并不深刻。他们擅长自己专业工作，但可能并不清楚这些技术在未来几年内，将如何重塑他们行业。你能给他们什么建议？

黄仁勋：回答你问题时，我注意到一个现象：参加GTC大会的，不仅有计算机行业的公司，更有来自医疗保健、医药、金融服务、制造、工业、消费、广告、汽车、运输以及物流等多个领域的公司。这充分说明，大多数公司并非专注计算机行业，计算只是他们业务中一个环节，他们才是各自行业领域的核心。

由于AI技术快速发展，计算机已经变得更容易使用，我们已经帮助这些公司跨越技术鸿沟。无论是医疗保健提供商，还是其他行业公司，现在都有比以往任何时候拥有更大机会，利用AI与计算技术来推动他们自己业务发展。

我们看到AI领域初创公司数量正在急剧增长，他们目标是各个行业。事实上，他们目标远不止计算机行业。我们可以清晰看到，各行各业都已经开始认识到，我们产品所具备的不可思议的能力，他们都有能力充分利用这些技术。

Q：你谈到在模拟中使用生成式AI来大规模训练机器人。具体我们不知道如何模拟，特别是当机器人需要从结构化环境，转移到家庭这样非结构化环境时。我想知道，你认为模拟的极限是什么？当我们达到这些极限时，会发生什么？我们如何继续训练机器人?

黄仁勋：有几种不同的方式，来考虑这个问题。

首先，大语言模型为我们提供独特、强大的试验场，用于测试与调整各种想法。这些模型在完全开放与非结构化环境中运行，确实带来一些挑战，也为我们提供巨大的创新空间。

大语言模型的泛化能力，令人惊叹。它们不仅能够概括信息，还能根据上下文进行微调。通过几次迭代或者简单提示，我们可以引导模型理解特定场景，比如制作煎蛋卷。这个过程中，我们可以详细描述环境、工具、限制条件等，让模型生成符合要求的文本或指令。

这引发一系列科学问题。如何更好利用大语言模型的泛化能力？如何优化提示，使模型更准确理解我们意图？模型生成的符号token，如何与机器人学中的实际操作相结合？这些都是值得深入探讨的问题。

你提到的token化，对于软件来说，没有区别，无论是文本，还是机器人动作，都可以被转化为token进行处理。

这为我们提供了统一的方式来描述与操作各种信息。计算机科学家正在解决这个问题，他们确实会不断研究与探索，将各种信息包括手势、动作等转化为token，并建立起相应的概括与语境化机制。这样，机器人就能够根据输入的token进行理解与处理，最终输出相应结果。

你提到的强化学习与人类反馈是非常关键的部分。通过大量的问答示例与适当答案，机器人可以学习到如何根据问题给出合适回应。这种基于人类反馈的强化学习，使得机器人能够不断优化自己回答，提高准确性与可靠性。

你给出的咖啡示例，非常生动与形象，它展示了机器人如何通过类比来理解，并执行任务。这种类比思维，在机器人学中具有重要意义，它使得机器人能够更好适应各种复杂与多变的环境。

最后，你提到我们大脑对语言与机器人运动之间区别的局限性。我们往往很难区分这两者，但对于计算机来说，它们只是数字而已。这种认识上的差异，使得我们需要更加深入探索机器人学的本质与可能性。

Q：你是如何看待AI幻觉，特别是在医疗等关键任务中，你必须信息确保100%准确。你认为这个问题可以解决吗？

黄仁勋：关于生成式AI的幻觉现象，确实是需要关注的问题。

通过采用检索增强生成的方法，我们可以有效解决这一问题。检索增强生成强调在生成答案之前，首先进行广泛网络查询与搜索，确保答案准确性与可靠性。这种方法避免AI编造答案的情况，而是直接从网络上读取相关信息。通过对搜索结果的优先级排序与筛选，我们可以选出最准确、最真实的答案来回答你的问题。

也许AI知道某个网站某些信息，也许它只知道该网站上描述，有些内容可能是不正确的，它会拒绝所有不正确的信息，找到最有意义的答案，AI会重新描述这个答案给你。

这个AI实际上是在为你做研究，不仅是在回答你的问题。它首先进行研究，确定哪个答案最好，总结给你。

这样解释清楚了吗？这根本就不是幻觉，而是在做研究。你现在拥有的这个聊天机器人不仅是一个闲聊的机器人，它实际上是一个研究助手，为你总结信息，根据信息的重要性，坚持要求它在回答我的问题之前先进行研究。

以下场景不是AI的真正意义所在，如果我知道答案是常识，只是不知道确切的答案到底是什么，比如热茶的温度是多少？我不太确定，你可以查一下，这完全没有必要让AI来做。

Q：我想知道，构建像Blackwell这样平台时，你们是如何预估算力需求。亦或者说，如果目标基本上只是以尽可能快的速度把算力提高到无穷大，你们是如何从功耗与可持续发展角度考虑的？

黄仁勋：这个问题的答案很简单。我们必须弄清楚我们物理极限是什么，我们要尽可能超越这些物理极限。现在，我们应当如何超越物理极限？超越物理极限的方法是提高能效，我们要做的第一件事就是提高能效。

正如我昨天展示的那样，过往训练1.8万亿参数的模型，需使用8千个Hopper GPU，功耗15兆瓦。相比之下，同样工作，只需要2千个Blackwell GPU即可完成，功耗降低到4兆瓦。可以说，Blackwell能效更高，仅仅是Hopper的4/15。因为能效更高，所以我们可以突破极限。

能效与成本效率是首要任务。我向你们展示了我们能够以30倍速度，为大型语言模型生成Token。换种说法，地球上没有东西比它快30倍。我们把速度提高30倍这一事实表明，我们这样做，节省了大量能源，也就是说，生成同等数量Token，只需要1/30能源。能效与成本效率，实际上是我们所做的一切的核心。

Q：有没有让你感到特别兴奋的重大技术突破？

黄仁勋：这样的例子太多了。其中一些让我兴奋是技术原因，还有一些让我兴奋是因为第一次接触到它们。

我举一些例子，我对Sora的出现倍感兴奋，我认为Sora非常的神奇。自动驾驶公司Waymo 2023年展示的技术，同样令我感到兴奋。

你可以看到我们2年前所做的一些例子，它与文生视频有关，模型必须对物理有敏感的认识。当放下杯子时，杯子会放在桌子中间；行人会在路面上行走。这些并不遵守物理定律，而是要对物理有所感知。

举例来说，预测3公里范围内天气，所需要的超级计算机的运算量，比目前用于天气预测的计算机大2.5万倍。这种情况，我们能够预测出极端天气对当地社区的影响。

要实现天气的精准预测，就要尽可能多地取样。我们将能效提高3,000倍，我们可以采样1万次而不是一次。我们获得正确答案或最可能答案的能力，大大提高。

对生物技术公司来说，能够根据氨基酸序列预测蛋白质形状非常重要，这些公司可以利用这些预测，来设计新药、改良作物、可生物降解塑料等各种产品。我们如今可以使用AI模型来完成这项工作，不必再使用超级计算机完成它。

Q：能否更深入了解你对药物发现的看法？量子计算能否对药物发现有所帮助？

黄仁勋：英伟达可能是全球最大的不构建量子计算机的量子计算公司。我们这样做的原因，是因为我们相信量子计算，量子计算不仅是一台量子计算机。当它发生时，量子计算机很可能是一个加速器，有点像是视频加速器。量子计算被用于非常特殊的领域，不会适用于所有计算。这就是我们推出CUDA-Q量子计算平台，而不是量子计算机的原因。CUDA Quantum平台，能够让我们模拟量子计算机。

目前，我们模拟的量子计算速度比量子计算机更快。我们可以用它在量子电路中发送信号，以便算法专家可以开始在量子计算机上工作。

我们可以用它来做后量子密码学Post-Quantum Cryptography，让世界为量子时代的到来做好准备，所有的数据都已经被编码了，我们可以为量子计算做出贡献。

我们与全球绝大多数量子计算机公司、研究人员、以及量子计算机制造商合作。可以说，我们信赖量子计算。

关于数字生物学，事实上，我们新推出的AI推理微服务NIM全部的感受力都来自我们对数字生物学的研究。

Q：能否谈谈英伟达与台积电关系？过去几年间，随着封装等问题的复杂性不断增加，你们两家公司间关系发生哪些变化？

黄仁勋：台积电可能是英伟达最密切的伙伴关系之一。我们做的事情非常困难，台积电工作非常出色。台积电在中国台湾省组装我们设备，考虑到零部件来自全球各国与地区，供应链并不简单。台积电做了大量工作与各个大公司协作，这家公司也意识到紧密协作在未来是必须的。可以说，台积电帮我们解决了一切问题。

在设备组装完成之后，还需要第三家公司对它进行测试；第四家公司必须将其整合到一个大系统中。你需要一台超级计算机来测试它。为了把它置入数据中心，想象制造车间就是一个巨大的数据中心，可以说，数据供应链的复杂性与变化非常大。

我们不仅是在制造芯片，单是这个芯片就是一个奇迹。当人们问我，你们造的是什么，或者你们如何制造GPU这样问题时，他们可能认为制造芯片有点像是制造集成电路。在我看来，GPU不仅涉及到硬件制造，台积电对我们非常重要。

Q：在英伟达向云业务转移同时，一些云制造商也开始制造芯片。你对这种趋势有何看法？我的问题有两个部分。

首先，大型科技公司生产芯片，会对你长期定价策略产生影响吗？其次，英伟达云战略是什么，尤其是在中国市场，英伟达是否会在中国市场发布VGX？如果不会，英伟达会提供什么解决方案？

黄仁勋：我们推出了HGX，并把技术出售给戴尔。戴尔把HGX植入计算机，再对外出售。我们这样做的原因是，我们开发了在戴尔设备上运行的软件。我们创造市场需求，把戴尔推给同行。戴尔并不像我们一样了解英伟达技术，我们必须去帮助戴尔创造需求，帮助戴尔创建这些系统，并为其开发软件。

我们的云业务，采用相同策略。我们与云服务提供商合作，把NVIDIA云放在他们云中。我们不是一家云计算公司，我们的云被称为VGX云，实际上是在他们云服务当中。我们目标与对待戴尔目标一样，是让客户使用他们的云服务。

我们自己开发软件，培养开发人员，我们为使用英伟达架构的云服务提供商创造需求。这与其他公司开发芯片没有任何关系。我们之所以这样做，是因为英伟达是一家计算平台公司，计算平台公司必须培育自己开发人员，这也是我们召开GTC开发者大会的主要原因。

如果我们是一家x86公司，为什么需要召开开发者大会？世界上每个人都使用x86，召开开发者大会，是因为我们的架构仍在被接受，它的使用很复杂，我们必须召开GTC大会。DRAMs不需要开发者大会，以太网不需要开发者大会，英伟达这样的计算平台需要开发者大会，我们需要开发人员。

Q：2023年纽约召开的GTC大会上，你曾说AGI将会在5年内出现。你现在是否仍是这种观点？

黄仁勋：首先是关于AGI的定义问题，我相信每个人都很难做到这一点。我希望你具体定义一下AGI，这样我们每个人都知道我们什么时候能够实现它。就像是定义圣克拉拉的位置一样，它的地理位置非常具体，所有人都知道何时能够到达那里。再比如说，即便是所处的时区不同，我们所有人都知道新年何时会到来。

AGI有点不太一样，如果我们指定AGI是非常具体的东西，这意味着大量的测试，数学测试、阅读测试、逻辑测试、医学考试、律师考试、经济测试、GMAT、SAT等。

当我说AGI的定义，就是它能够通过这一整套测试，比超过80%的人都要好，你认为计算机能够在5年内实现这一目标吗？答案当然是肯定的。

当我每次回答这个问题时，我对AGI的定义就是这些，并不是所有人都这么认为。究竟什么是AGI，取决于你们目标是什么。我的目标是与你们交流，你们目标是弄清楚要讲什么故事。在我看来，AGI将会在5年内出现。

Q：2023年你提到有一句非常激进的话，认为将来每个像素都将被生成，而不是被渲染。你认为我们距离每个像素都在实时帧率下生成的世界还有多远？

黄仁勋：我认为在技术上，几乎所有事情的S曲线都不会超过10年，10年后，你就在S曲线的另一端。从现在开始到未来5年，一切都在实时发生变化，可能某一段，我们都会身处于S曲线10年中的某2年。

Q：最新财报发布后，你们市值创下历史新高，也吸引日本市场关注。能否分享一下英伟达在扩大日本AI能力方面取得的进展，对于英伟达在日本市场的产品与业务，你有什么期望？

黄仁勋：我认为日本现在更加意识到提高生产力的重要性。我们都知道，当一家公司生产力提高时，收益就会提高。收益提高后，我们会雇用更多人。公司变得更有生产力时，我们收入就会增长，收入增长后，就会雇佣更多人，生活质量也会提高。

像许多国家一样，日本也需要提高生产力。AI是提高国家生产力的最佳方式，我认为日本意识到这一点，你们还意识到日本拥有独特的大数据与语言及文化，没有理由仅通过第三方收集这些数据后创建AI，再导入日本，让日本市场为此付费，这毫无意义，你们应该自己创建AI。

出于AI主导性的需求，以及国家生产力与企业生产力的考虑，AI在日本将变得极为重要。

Q：你对以色列员工提供了前所未有的支持，是否会让你面临来自投资者或其他方面的反对意见？英伟达是否计划在以色列扩大业务、开设更多研发中心、收购更多公司？英伟达与以色列的未来，会有什么样的合作？

黄仁勋：以色列是英伟达最重要的基地之一，在人均算力上，以色列是英伟达最大的驻扎地之一。目前，我们在以色列有3,300名员工，以色列还汇聚了我们一些最有才华的工程师与我们的重要投资。

特别的是，BlackWell架构的其中一种核心技术，也是来自以色列。以色列这个地区，对我们来说至关重要，我们将继续在以色列进行大量投资。我们也在西岸招聘员工，支持所有在西岸的巴勒斯坦员工，我们会照顾他们及其家人，保证他们每一个人都能获得帮助。

员工需要知道公司是支持他们的，一个人只有知道自己拥有牢固的基础，才能充分发挥出自己工作能力。

英伟达是一家强大的公司，我们有着坚实的基础，我们对员工给予明确支持。我们会继续在以色列投资，并给予当地员工支持。

Q：印度最近承诺通过公私合作伙伴关系，获得1万个GPU，英伟达是其中之一吗？印度的AI计算能力，目前不到世界的2%，你的看法是什么？

黄仁勋：如果印度正在购买用于AI的GPU，我想就此发表一下我的想法。我认为英伟达制造了非常优秀的AI GPU，当你回去时，请告诉大家：我们在这方面做得很好；第二，我对此很感兴趣。

如果有人想买一些GPU，我愿意做生意。请传播这个消息：英伟达愿意做生意，我认为AI确实是巨大的机会。

当我去印度时，通常有机会见到莫迪总理。这确实是件非常非凡的事情，他曾对我说，Jensen，印度不应该出口面粉进口面包。

这很有道理。为什么要出口原材料、进口其附加值？为什么要出口印度数据，以便你可以进口AI？我们应该在印度找到它，为它增值，这是第一点。

第二点，印度拥有世界上最多的IT专业人员，他们正在重新培训以适应AI。当我与印度领导人会面时，他们非常清楚，这是他们重新培训自己的最大机会之一。他们将不再只是为公司后台服务的IT，而是成为在公司前台创造价值的IT。

AI被用于工程、营销、销售、财务、业务运营、营销策略等。所有这些都属于前台工作，而不是后台。印度正寻求进入IT的前台，那里拥有最大的市场机会。

Q：我们都知道台积电很关键，尤其是CoWos的产能，大家都希望有更高产能，有消息说今需求增加了3倍，你怎么看3倍这个数字？

黄仁勋：你想要具体的数字？这很有趣。2024年，我们对CoWos需求非常大，这是你们想要的答案吗？

我们正处于向AI过渡的开始阶段，正处于向AI与加速计算的平台转变的开始阶段。我们只进入了几千亿美元的旅程，这个世界有1万亿美元的计算机。我们处在这段旅程的开始部分，还有很长的路要走。

我非常有信心台积电会不断增长。他们做了一些艰苦工作，理应得到现在位置。他们的技术很棒，人们工作非常努力，他们为通往AI的旅程，做好完美准备，他们的定位非常好。

Q：三星或SK海力士，除了HBM业务，其他方面怎么样?

黄仁勋：除了HBM业务，三星、SK海力士怎么样，这个问题就好像在问，除了家人之外，台积电怎么样？或者说，你们还想与英伟达合作除了GPU以外的业务吗？

实际上，HBM内存非常复杂，有很高附加值，我们在这个业务上投入很多资金。

三星表现非常出色，韩国制造了世界大多数先进产品，但是HBM内存非常复杂，不要将它等同DDR5，这完全不是一回事，它更像逻辑芯片一样。我们与三星关系非常好，也希望能够更加紧密合作。SK海力士非常出色，这就是为什么他们在各自领域成为世界领先的原因。

李飞飞对话英伟达首席科学家Bill Dally：AI就像电力，给它设置单独监管机构没意义

时间：2024年3月20日

来源：腾讯科技

字数：10,734

这次对谈中，李飞飞讲了个故事。当她完成自己的书初版时，好朋友、哲学家、斯坦福以人为本AI研究院联合主任约翰·埃奇门迪看了初稿后建议她重写。他说很多人都在写关于AI的书，李飞飞有一段独特的历程，能代表很多觉得自己在AI领域没有发言权或找不到认同感的人。这些人包括移民、年轻女性、各行各业的人，他们不一定是典型的硅谷AI人士。如果李飞飞能给他们一个声音，这将更有力量。

李飞飞，一面是斯坦福大学教授，美国工程学院院士，AI视觉领域顶尖专家，业内称为AI教母；另一面是出生在北京，长于四川，12岁随双亲前往美国，因生活拮据不得不去餐馆打工，这就是艾奇门迪提到的李飞飞的独特的经历。

整场对谈，李飞飞用一种很不同的思考AI视角，来给这个AI时代失语的普通人一个声音。是一种更有人文情怀，更具社会责任，也更女性细腻的视角。

这次访谈中，李飞飞直接回答关于AI的技术发展路径与未来应用等具体行业问题，只占全部讨论不到1/4。

这并不是对谈者，英伟达首席科学家Bill Dally没问这些问题，他问了Sora发展会如何影响影视行业，李飞飞回答是宫崎骏动画的无可替代，以此证明只有人能利用AI创作能触动他人、启发他人或服务他人的内容，AI做不到。

Bill Dally问了AI科学未来的影响，李飞飞答案是AI在医疗领域的应用可能是最深远的。答案很中规中矩，她的理由是在这个领域工作的女性与有色人种，可以借由AI摆脱艰苦、被忽视的照护工作，老年人可以通过技术获得更有尊严的暮年。

哪怕是在关于技术路径的问题中，她的回答也朝向人的细腻与独特。像辛顿、杨立昆一样，李飞飞不相信单纯依靠缩放定律，就能高效解决一切问题，她认为我们需要结构化的模型引导AI。

与其他人都不同，她最终理想模型是感知的、超越语言互动的模型，只有能掌握人类在5.4亿年时间里形成的细微的、比文字更人性的感知，AI才算有了基础模型。

其他时间里，李飞飞都在聊公共部门在AI发展中面对的困境，聊AI监管模式，这些看似离人们非常远的话题，李飞飞还是站在每个人的角度思考着。

公共部门意味着公共利益，意味着与每个人相关。只有公共部门得到足够支持，才能推动科学发现创新、为公众提供客观解释、培养负责任的人才，让AI的繁荣落在每一个人头上。

在李飞飞那里，所有AI的发展都是关于人，具体的人。

整场对谈最后一分钟半，Bill Dally问题已问完，请李飞飞讲她想传递给所有人的话。李飞飞先讲自己故事，一个住在美国乡镇里爱跳舞的女孩故事，她不是计算机科学家，不是理科毕业的，甚至家里连电脑都没有，她还是与AI产生如此多的联系，在AI发展中扮演了一个角色。

我们不要被时髦的术语吓到，不要迷茫于AI时代自己角色。只要把AI当成工具，人类不仅是工具创造者，我们也是如何使用工具的决策者。去拥抱它，去做决策者，做让它被正确使用，变得更好的人。我们在AI时代的未来一定会像马丁路德想的那样，让人类文明的弧线朝着正义、希望、仁爱方向发展。

这就是我们每个人，每个普通人，非硅谷精英应该在这个AI时代里的角色。

这也是李飞飞对每个人的恳求：在AI发展中有一个角色。

我不是盲目乐观，我相信AI会带来好的未来

Bill Dally：感谢来到GTC。李飞飞是斯坦福以人为本AI研究院HAI Stanford的联合创始人。到目前为止，你认为AI对人类影响最大的领域是什么?你认为未来AI将在哪些领域产生最大影响?

李飞飞：这是非常宏大的问题。AI目前对人类影响是什么？我认为AI可能是21世纪最深刻的技术，它正在改变我们生活、工作与未来，AI是一种智能技术。

在这之前，人类技术发明，大多停留在不涉及智能层面，无论是发明工具让我们走得更快、飞得更高，还是发明工具让我们能看到人眼看不到的东西，这些都还是机械性。

AI的发明，如理解语言、翻译语言、做决策、发现模式等，这些都是人类基本能力，现在都受到这项深刻技术的挑战。

在我看来，AI的影响是对人类本质、能力与定义的深刻影响。

Bill Dally：你认为在人类某些特定领域，如医疗、教育或交通等，AI会产生比其他领域更大的影响吗?

李飞飞：我认为AI的应用，非常广泛。我担任谷歌云首席科学家时，我看到商业分析是AI一大应用领域。我完全同意你的看法，医疗、交通、教育、软件工程等领域，AI影响将是无边无际。

Bill Dally：一些业界名人如马斯克与Sam Altman，认为AI可能对人类构成生存威胁。你怎么看？AI可能带来的最大风险是什么？是换脸技术，还是失业？AI的不利影响有哪些？

李飞飞：我认为这是合理的问题，作为大学里的人，尤其是在大学校园工作，我们应该被允许提出各种问题，包括AI是否对人类构成生存威胁。

智力角度说，这是一个重要的关于未来的问题。作为一个物种，人类应该认识到，我们发明的一切，不仅是AI，还包括我们正在改变地球的方式，改变我们与环境关系的方式，都需要我们审慎对待。

就AI而言，我更关注更直接与紧迫的灾难性风险。你提到的一些风险，是深层次的社会问题。

例如，AI可能错误信息而影响民主，可能取代工作或改变劳动力市场格局，可能影响我们与数据的关系、隐私与公平性。如果我们不能很好管理这项技术的应用，这些都可能带来灾难性的社会风险。

Bill Dally：你最近写了一本关于AI的科学回忆录，我这里有一本。大家现在应该都从亚马逊上订购这本书。你能告诉我们一些关于这本书的情况吗？你为什么要写这本书？

李飞飞：这本书是一本科学回忆录。就像你说的，我把科学这个词放在第一位。这本书有一个双螺旋结构，通过我作为一名计算机视觉科学家的视角，讲述了AI发展历程。我看到，智能在自然界的进化，始于对世界感知。

过去十几年里，AI的进化，特别是深度学习的历史，与计算机视觉这个领域的进化，紧密交织在一起。这是AI在过去10年左右的发展历程，也与一个年轻科学家的个人成长历程交织在一起。

我之所以觉得有必要写这本书，是当我被要求写一本关于AI的科普书时，我确实花了1年时间在疫情大流行期间写了一本只关于AI的书。

我们好朋友，哲学家、斯坦福以人为本AI研究院联合主任约翰·埃奇门迪看了我初稿，基本上说我应该重写，我当时非常沮丧。

他说，很多人都在写关于AI的书，但你有一段独特的历程。你代表了很多觉得自己在AI领域没有发言权或找不到认同感的人，这些人包括移民、年轻女性、各行各业的人，他们不一定是典型的硅谷AI人士。如果你能给他们一个声音，这将更有力量。我把这本书的结构，改成了双螺旋结构。

Bill Dally：非常有趣。AI的发展历程，与你作为一名科学家的成长历程，交织在一起。

假设AI在10年后变得成熟，如果你要为这本书写个续集，你认为它会是什么样？

李飞飞：我不认为我想写续集。如果这么做的话，这肯定是一项充满爱的工作。如果我要为这本书写续集，我想写一个人类胜利的故事。

我要讲述我们如何利用这项技术，让生活与工作变得更好。我这么说，并不是出于盲目乐观，我知道世界非常复杂。

对年轻人来说，这个世界有时甚至感觉有点反乌托邦。但如果你看人类文明发展历程，它是很长的。

正如马丁·路德·金所说，如果我们能以正确方式使用技术，人类文明的弧线是朝着正义、希望、仁爱的方向发展的。

就像在这次GTC大会上，我们只是看到技术改变生活的冰山一角。我们看到如何利用这项技术改变医疗，从药物发现、到个性化治疗、再到医疗服务。

我们才刚开始思考，教育如何从根本上被改变，突然之间我们有了一个教学助手，可以进行深度个性化学习与教学。

我们看到，科学发现，可以在强大的机器与认知助手的帮助下加速，这些助手可以真正加速人类已进行了数百年的科学发现过程。

所有这些，都给了我们希望之光，希望我们在5~10年内能利用AI寻找气候解决方案，普及医疗服务，照顾好地球与我们自己。

如果我要写续集，我想写的就是这些。

Bill Dally：我希望这就是我们要写的未来，这是一个非常乐观与积极的世界观。

李飞飞：我之所以乐观，是我们正在一起努力。我不是坐在这里空谈，而是真的相信，如果我们相信，我们就去做。

Bill Dally：没错，我们一起努力创造我们想要的未来。

李飞飞：是的。

公共部门没有GPU，基础创新就不会再发生

Bill Dally：你一直呼吁为学术界提供资源，以推进AI研究。迄今为止，真正掌握训练模型所需GPU与数据的，还是资金雄厚的大公司。你认为未来这种情况，会如何发展？国家AI研究资源NAIRR能否实现并民主化AI，让学术界与小公司也能接触到？还是人才将继续从学术界流向大公司？

李飞飞：我认为我们俩现在都在白宫的各种顾问职位，你是总统科技顾问委员会PCAST成员，我是拜登总统NAIRR特别工作组成员。对不知道NAIRR是什么的人，NAIRR是国家AI研究资源试点项目。

几年前，斯坦福HAI倡导联邦政府考虑增加对公共部门AI的资源投入，尤其是计算资源与数据资源。这转化为一项目前仍在国会讨论的法案，名为创建AI法案CREATE AI BILL。如果这项法案获得通过与拨款，它将创建联邦基金，用以建立一个国家AI云、以及供公共部门使用的数据存储库。

斯坦福HAI一直在引领这场运动。我之所以在华盛顿特区花这么多时间，是我相信公共部门AI与私营部门AI同样重要。

就像Bill说的，现在的平衡如此失衡。这个国家，现在没有一所大学能训练出GPT聊天模型。我们没有成千上万GPU，更不用说A100、H100或B200。

有些人可能会问，这有什么问题？反正我们有伟大的公司，伟大的大型科技公司在创造伟大的技术。我认为这是事实，私营部门在蓬勃发展。

我想让大家认识到，公共部门创造公共利益。什么是公共利益？公共利益有几个维度，对我们当下与未来都很重要。

首先，公共利益包括好奇心驱动与知识驱动的发现与创新，这太重要了。你们现在所知道关于AI的一切，最初都始于学术界无人知晓的好奇心驱动的研究课题。从感知机、到反向传播算法、再到ImageNet，这些都来自公共部门。这种天马行空式、好奇心驱动的研究，至关重要。它是一种公共利益，对我们社会的持续创新很重要。

公共利益第二部分，是作为公众值得信赖的合作伙伴去解释、教育与评估技术。

私营部门有自己的目标，谁来作为值得信赖的合作伙伴，让我们了解这项技术有多安全？透明度指数是多少？数据是否有偏差？我们如何以公平、值得信赖的方式，使用这个推论？这些都是公共部门正在做，而且可以帮助公众的重要话题。

最后，同样重要的是，公共利益一种形式是最重要的，那就是人才，这是为了明天的人才。我们肩负很大责任，教育出不仅能发展未来科技的劳动力，而且是能对世界负责任的劳动力。这些劳动力不仅要学习如何编写AI代码，还要学习AI的道德框架，AI的社会影响。这些都是公共利益，支持公共部门AI很重要。

Bill Dally：在人才话题下继续，如果我们要发展公共部门AI，意味着我们需要把AI专家吸引到公共部门。鉴于目前AI人才市场的情况，正在上演激烈竞价战，开出的薪酬是联邦政府工资等级所能支付的好几倍。你设想如何吸引真正优秀的AI人才，进入公共部门？

李飞飞：这是很好的问题。我记得10年前，你还是系主任，想把人才吸引到学术界。

首先，在这个国家，进入私营部门的学生总是会更多，我们不是要实现50/50平衡。对那些一心想留在公共部门或去学术界的人，我真的希望给他们提供资源非常重要。他们不是在寻求英伟达级别的薪酬，他们想要获得的是计算资源。

就我个人而言，我与学生们希望有这样的计算资源，这样我们就可以与斯坦福医院合作，从事可能需要几百个GPU的项目，他们想要一个不会不断流失人才的社区。

他们同学、同事以及公共部门与私营部门的合作伙伴关系，在为他们提供资源方面可以发挥很大作用。

我也想呼吁公共部门本身的创新。我们公共部门，我们机构，这个国家已有几百年历史，那里的结构需要创新，这是为了应对当今快速变化的行业格局与人才格局。我们自己应该做一些工作，我希望双方都能努力，让情况变得更好。

Bill Dally：在公私合作标题下，你对NAIRR试点项目，有何看法?

我们非常勤奋的国会公共代表，正在推动法案，以授权与拨款NAIRR。与此同时，一个试点项目已启动，主要是捐赠资源，英伟达提供了3,000万美元，微软提供相当数量GPU。这会产生影响吗？你认为这将如何运作？

李飞飞：很好的问题。对那些不知道的人，NAIRR试点项目，就像Bill说的，是总统2023年11月AI行政命令拨款的一小部分计算资源，这是行政命令的一部分。

我积极的看到私营公司走到一起，试图支持这项工作。作为一名学者，我太忙于支持NAIRR，错过申请这些算力的截止日期。这一轮我不会受益，我确实看到全国各地申请这个项目的同事有可能受益。

我直言不讳地说，这个项目太小了，我不知道算不算杯水车薪。我不是想否定它，这是很好的第一步，我希望没有人对此感到满足。

我希望白宫、国会、行业领袖们，都不要满足于此，它实在是太小了。考虑到当前大模型规模、数据的规模，以及公共部门可以用这些计算资源做事情的潜力，这真的只是沧海一粟，我们还有很多工作要做。

AI就像电力，给它设置单独监管机构没意义

Bill Dally：你一直在把公共部门与私立大学混为一谈。如果把它们分开，问一下你认为政府实际上会如何使用AI？它会更好为人民服务吗？它会简化各种政府服务的途径吗？真正的公共部门应用有哪些？

李飞飞：即使是私立大学，也是非营利组织，我说的公共部门，更多的是非营利组织。

你提出一个很好的问题，关于政府使用AI这件事，就AI而言，政府既是服务提供者，也是监管者，我认为政府扮演着这两个角色。

在斯坦福HAI，我们有顶尖的学者与美国政府合作，无论是国税局、环保局还是其他机构，我们都在利用AI实现政府服务现代化，我们在座的人都会受此影响。

我们可能觉得许多政府部门的服务缺乏现代化，我认为AI真的可以像帮助企业一样，无论是呼叫中心还是个性化帮助，AI都可以大有作为。

在金融部门或者公共部门的金融领域，AI可以进行欺诈检测，可以帮助确定案件的优先级。上周我在华盛顿特区与退伍军人事务部部长交谈，讨论我们如何利用AI更好服务退伍军人。政府确实有很多应用，只是为了实现服务现代化，让服务更有效率、更有成效。

Bill Dally：你提到的政府，在AI方面的另一个角色是监管，欧盟最近通过一项AI监管法案。在美国，当然也有一些参议员与国会议员，在谈论做类似事情，许多情况下，他们觉得自己在社交媒体上错过机会，他们不想在AI上落后。你认为AI监管，将走向何方？它会带来好处，还是坏处？

李飞飞：这是非常深刻的问题。就安全至上的监管而言，欧盟往往在时间上领先于美国。美国作为一个社会，引以为豪的是我们创新环境。我绝对是中间派，这让我很无聊。

Bill Dally：你绝不无聊。

李飞飞：我绝对相信监管有它的作用。就像如果你有一个房子，如果你家里有孩子，就会有一些准则。对每一项创新，你都要设计对应安全带，想想安全带拯救了多少生命。临床监管努力使我们药品更安全，尽管还不完美。

AI是一项如此深远的技术，我们不能不监管它，但如何进行有效监管，非常关键。

你也在PCAST任职，政府角度看，我们有两种方向的力量：一种是让社会创新，利用这项技术，提升每个人与社会繁荣；另一种是确保它安全、可信、公平、透明；我认为这就是监管与激励之间的张力，我们必须深思熟虑去做。

举个例子，我个人确实相信垂直领域，尤其是医疗、金融、交通等这些我们已有监管框架的垂直领域，是时候更新它了。有许多迫切的用例，现在是时候让他们审视AI的影响。

例如，医疗器械。我们有很多医疗器械，它们受到很宽松的FDA检查或许可。我们应该真正关注这些垂直领域，看看我们如何在产品与服务中保证AI安全，让其在这些领域发挥作用。

更深层次的监管措施，比如它如何影响我们民主，社交媒体。我不得不承认，这是公民社会、学术界、政府等许多部门，正在进行的一场复杂斗争。

我认为在过去20年，或者至少15年里，我们做得并不好。我同意你的看法，希望我们不要继续犯错，至少我们需要从中吸取教训。

Bill Dally：我同意关注垂直领域是正确做法，每个垂直领域，无论是监管汽车AI的NHTSA，还是监管医药AI的FDA等。

我认为你可以将其应用于社交媒体，它对应的监管机构是FCC。FCC监管通信，无论是广播还是互联网。

有人建议，我们实际上需要一个新的机构来监管AI，独立于应用领域，这对我来说没有任何意义。你怎么看？

李飞飞：我认为AI在某种程度上，类似电力或计算机，我认为我们不能为电力或计算机设立一个机构。我很难想象一个独立的AI机构，AI是如此横向。

AI在医学中应用，可能是最深远、最广泛的

Bill Dally：从蛋白质折叠到天气模拟，AI正在迅速加速科学发展。过去一个博士生折叠一个蛋白质，AlphaFold一夜之间完成大约20万个。你认为AI在科学领域最大应用是什么？你认为这将如何改变科学事业？

李飞飞：我认为这是最令人兴奋的。我已提到，如果你看人类文明历史，最终还是这些科学发现与创新产生深远影响。AI作为一种辅助科学发现的新工具，是我们这个世纪的机遇。

我很荣幸坐在斯坦福校园里，与来自神经科学、材料科学、纳米科学、航空航天、肿瘤学、化学等领域朋友与同事交谈。

不管我把目光投向哪里，我都能看到他们对AI所产生数据的兴奋，对它们形成新假设的兴奋，以及AI如何成为加速他们发现过程的超级力量讨论。

我认为，回到公共部门，特别是大学的作用这个问题上，我认为加倍、三倍投入科学发现，正是大学应该做的，这就是机会所在。

Bill Dally：你个人非常投入，将AI应用于医学的许多努力。这个领域，你认为目前最令人兴奋的事情是什么？你认为这个领域10年后会是什么样？

李飞飞：说到写这本书续集，如果我要写续集，我希望一半的内容是关于医疗保健与医学，我认为AI在医学中的应用可能是最深远、最广泛的。我个人并没有从事上游药物发现、生物化学、基因组学等工作，但在那里，AI与生物技术结合正在迅速加速。

过去10多年里，我恰好从事医疗保健最下游的工作，也就是医疗服务提供。这是护士、医生、家庭护理工作者照顾病人、老人与慢性病患者的地方。这里安全是一个问题、也存在劳动力短缺。即使有护理人员，这也是非常不平衡的市场，往往主要是女性与有色人种在这个领域工作，他们甚至没有被计入GDP。医疗服务提供中存在很多不平衡、低效率与人类苦难。

我看到的机会是，AI真的可以成为守护天使或辅助守护天使。

例如，我与斯坦福医院合作，在病房中安装被动传感器，非侵入性、保护隐私的被动传感器，帮助医院监测重要的临床相关事件：比如病人即将跌倒的危险，病人病情突然恶化的征兆，临床医生不当的手部卫生习惯等。

这些都是当前医疗保健中，尚处于黑暗空间的临床相关工作，作为一种智能传感器的AI，真的可以帮助照亮黑暗空间，未来它甚至可以进入家庭。

如果我们相信技术将带来繁荣，将转变工作，我们需要相信人类生活需要继续以更有尊严、更独立、更自尊的方式生活。

随着社会老龄化，我们希望老年人拥有尊严、独立、良好的生活环境。AI可以帮助确保这一点：即使你独自生活，即使你患有慢性病，AI传感器与AI技术也可以在不侵犯你空间的情况下关注你，与你的护理人员或家人保持关于你健康状况的沟通。

这就是我工作的医疗服务提供领域，我对此充满热情。

除了缩放定律，AI另一个方向是建立感知的基础模型

Bill Dally：这是非常令人兴奋的未来。我们已看到模型从早期ImageNet时代的ContralNets，到用于语言的RNN，再到Transformer，它发展得非常快。接下来会是什么？这些新的状态空间模型是否有前景？或者你认为未来我们主导网络模型会是什么？

李飞飞：目前最新的是扩散模型，但我还没有一个名字给你。如果我有，我现在就会去注册。

我认为，首先，我继续相信数据的缩放定律，我认为我们还没有看到这方面的终点。关于我们是否已看到语言数据的极限，有很多猜测，我不知道答案，我不从事语言领域工作。

但就世界数据、多模态数据而言，还有很多数据可用，人类与自然正在生产并利用这些数据，继续看好使用支持这些数据的模型架构。

Bill Dally：如果你把这种chinchilla缩放定律应用于LLMs，应用于多模态数据，意味着随着我们获得越来越多的世界数据进行训练，我们需要越来越大的模型，你认为事情正朝着这个方向发展吗？

李飞飞：我认为这是一个方向，我相信的另一个方向是世界结构。我有点嫉妒那些搞NLP的同事，根本上说，语言是一个一维结构。我从事视觉工作，它从根本上是三维的。如果加上时间，就是四维的。三维结构要丰富得多，但也复杂得多。

当我们用大数据进行扩展时，如果是完全盲目扩展，我想英伟达会很高兴，你们会卖出更多芯片。我想看到的是结构化建模，或着说偏向三维感知与结构的模型与大数据相结合。我认为，要真正创造出空间智能，创造出我们今天仍然缺乏的世界模型。

Bill Dally：你是在暗示，类似许多类型科学模拟中使用的物理信息神经网络。你会扩展到利用人类对世界的先验知识，用它来使这些世界模型更有效？

李飞飞：是的，物理学就是对动力学与结构的信息输入及推导。

Bill Dally：你认为基础模型是会出现在世界层面上？也就是说我们可以问它任何关于世界的问题，它会以多模态四维格式回答我们？

李飞飞：我确实认为基础模型，会出现在世界层面。我认为你不需要只是问它问题，这是一种以语言为中心的交互方式，我认为实际上你应该可以与它互动。

看看人类，或者生物体，作为一个计算机视觉人，我想提醒大家一件事，自然花了5.4亿年时间来创造感知大脑，创造语言大脑只花了几十万年，感知是非常非常深刻的。

AI替代不了人性的部分，这就是未来的工作

Bill Dally：这是个很好的观点，感知领先语言几百万年。或者说感知更难，需要更长时间。人们对AI的一个担忧，是它会扰乱就业市场。你可以说它会创造就业机会，也可能使其他工作变得不重要。你认为什么样的人类工作，是AI或机器人永远无法取代的？

李飞飞：这是一个很棒的问题。你应该提前告诉我，你要问这个。这些问题，我几天前都给你发过了。这是一个危险的问题。

自人类文明伊始，我们祖先想象过的每一种工作，基本上都是由机器协作完成的。移动、飞行、计算等。我觉得工作的定义是什么？如果工作是一项任务，比如抓起某样东西或做一个煎蛋，我想它会被机器完成。

如果工作是人性的一部分，是定义我们创造力的一部分，定义我们独特性，定义我们意图、我们同情心、我们与他人独特的情感联系，以及我们每个人对他人或对社会可能产生的独特贡献，我认为这些永远不会被完全取代。

我们会利用机器，来帮助我们更好完成这类工作，但我没有看到一个根本性的取代。

让我们再次回到医疗保健领域，我花了几10年时间，在医院里照顾我年迈的外籍父母。每次我带着父母走进病房，我都会看着人类照顾人类，或者人类需要人类来照顾人类。在这种关系与互动中，有一些非常深刻的东西，是任何机器人、AI、电脑、AR/VR，或者你认为的任何下一代技术都无法完全取代的。

老师与孩子、父母与孩子也是如此，我们真正珍视的服务，我们所做的旅行。人性方面，在人与人的互动方面，有太多超越计算、机械的东西，我认为这些将是会保留下来，并不断演变的工作。这样我们将越来越多被机器赋予超能力，作为人类的核心，不会被取代。

Bill Dally：很明显，观众被你深深打动了。你以一种人性关怀的方式，与他们建立了联系。你是在暗示同理心、情感联系与关怀，还有创造力。创造力是人类的核心特质，如果我们选择训练AI模型具有这些特征，我们能做到吗？我们可以建立有同情心的AI模型，让它能在情感上与人联系吗？

李飞飞：某种程度上可以。我再次强调一下，我从事计算机视觉工作。现在已有了深度创造性的文本、到图像，以及文本到视频的生成模型。

我也认为，就像这里没有人能预测下一个爱因斯坦会是谁一样，这种创造力，创造力的不确定性，将永远存在我们人类社会中。

无论你如何训练机器，都无法训练出人类智能或人类创造力。这不仅是爱因斯坦，还有贝多芬、莎士比亚、梵高，还有太多太多，而且不一定非要是聪明的人。

我自己的孩子，我不认为任何机器都能创造出一个甜美、聪明、幽默的小家伙。

Bill Dally：这是独一无二的人性，机器无法取代。说到创造力，生成式AI正在做一些了不起的事情。

OpenAI最近推出Sora，你可以输入提示，就能得到看起来很棒的视频。我们最终，也许当你在10年后写续集时，是否会发展到如果你想看一部电影，只需写几行提示，它就会为你生成一部两小时的电影？

李飞飞：我不认为这需要10年。多生产一些B200，它很快就会出现。技术而言，我认为这即将到来，创建更长时间的生成性世界、生成性故事情节、生成性角色互动的能力，指日可待。

Bill Dally：这样一个世界里，我们有AI程序生成大部分内容，那些在好莱坞或游戏工作室等地方的人类内容创作者的角色是什么？

李飞飞：这又回到人类独特性，我不知道你们中有多少人是宫崎骏、吉卜力工作室粉丝。

是的，它是最棒的，我喜欢一遍又一遍看他们电影。从计算机图形学角度看，它相当初级，他们不做皮克斯与梦工厂那样复杂图形。

那些独特的故事，比如《龙猫》故事多简单，电影中人性表达单纯，除了宫崎骏，没有人，没有人能创造出那样的东西，我认为这仍然是人性。

AI会创作电影，会创作娱乐人们的内容，只有人能利用AI创作能触动他人、启发他人或服务他人的内容，AI做不到。我确实看到了这种共生的可能性。

不管那些技术词汇多陌生，我希望你在AI时代中有一个角色

Bill Dally：你是在暗示AI基本上会接管这些创意事物的制作部分，制作真正引人注目的视频，让图像看起来很棒。最终在情感层面上与人联系，去讲述一个能让人流泪的故事，这将是人类应该努力的部分。

李飞飞：没错。我一直强调的一点，就是在这个机器时代，不要忘记我们人性，不要忘记我们尊严，不要忘记彼此尊严与人性。这是我们的核心，这是我们的独特之处。这也是我们构建机器应用、使用机器的开端。

Bill Dally：我们还剩1分32秒。你还有什么想传达给观众的吗？也许能再次让他们给予掌声？

李飞飞：让观众鼓掌，这是一个很高的标准。

我想说的一点是，GTC是一个特别的会议。你们来到这里，是你们都以某种方式参与AI。当我写出这本书，并与全球各地观众，特别是年轻观众交谈时，我经常被问到一个问题。每次有人问这个问题，我仍然会被触动，我在这个AI时代的角色是什么？我不是计算机科学家，也不是斯坦福大学理科专业；我不做软件工程，我不是在有电脑的家庭长大。我热爱跳舞，我也会为我一个类似农村的社区服务。

所有这些来自各行各业的人都在问我，他们会在AI时代扮演什么角色。AI看起来如此复杂，它有7,000亿个参数，你怎么用自己的大脑来理解这么庞大的东西？然后是所有这些花哨的词，transformer、生成式、扩散式，它们似乎离每个人都很遥远。

我真的想把它归结为：这是一个工具，它是一个需要一些数学与计算来实现的工具。归根结底，人类不仅是工具创造者，我们也是如何使用工具的决策者；我们是工具应用的创造者，我们也是工具的用户；我们是决定如何管理工具，以及管理想要使用工具人的选民。在参与AI方面，有很多公民的可能性。

我特别希望年轻人，热爱艺术、热爱社区、热爱法律、热爱医学、热爱化学的人，无论你的兴趣是什么，都能以负责任的态度拥抱这项技术，你们实际上可以为让它变得更好、更好使用它，而有所作为。

这真的是我对每个人的恳求：你们在AI发展中，有一个角色，请加入我们，让它变得更好。

Bill Dally：谢谢你，飞飞。我想你激励了每个人，也给了我们很多思考的内容。非常感谢你抽出时间。

免责声明：上述内容仅代表发帖人个人观点，不构成本平台的任何投资建议。

推荐
最新

暂无评论

【智能前线】第3期：黄仁勋GTC媒体交流纪要，李飞飞对话英伟达首席科学家Bill Dally

评论

热议股票