英伟达发布新版开源AI模型,宣称“更快、更便宜、更智能”

老虎资讯综合12-15

12月15日,英伟达盘前小幅拉升!市场消息:该公司推出NEMOTRON 3系列开源模型;Nemotron 3 Nano吞吐量将较Nemotron 2 Nano提升4倍;NEMOTRON 3超级版(SUPER)和至尊版(ULTRA)预计将于2026年上半年推出。

NVIDIA 今日宣布推出 NVIDIA Nemotron™ 3 系列开放模型、数据和库,旨在为各行业的透明、高效和专业化的智能体 AI 开发提供支持。

Nemotron 3 型号(有 Nano、Super 和 Ultra 三种尺寸)引入了一种突破性的混合潜在专家混合 (MoE)架构,可帮助开发人员大规模构建和部署可靠的多智能体系统。

随着企业从单一模型聊天机器人转向协作式多智能体人工智能系统,开发者面临着日益严峻的挑战,包括通信开销、上下文漂移和高昂的推理成本。此外,开发者需要透明度来信任那些将自动化其复杂工作流程的模型。Nemotron 3 直接应对这些挑战,提供客户构建专业化、智能体人工智能所需的性能和开放性。

英伟达创始人兼首席执行官黄仁勋表示:“开放式创新是人工智能进步的基石。通过Nemotron,我们正在将先进的人工智能转变为一个开放平台,为开发者提供构建大规模智能体系统所需的透明度和效率。”

NVIDIA Nemotron 支持 NVIDIA 更广泛的自主 AI 工作,从欧洲到韩国的组织都采用了开放、透明和高效的模型,使他们能够构建符合自身数据、法规和价值观的 AI 系统。

包括埃森哲、Cadence、CrowdStrike、Cursor、德勤、安永、Oracle 云基础设施、Palantir、Perplexity、ServiceNow、西门子、Synopsys 和 Zoom 在内的早期采用者,正在整合 Nemotron 系列模型,以支持制造业、网络安全、软件开发、媒体、通信和其他行业的 AI 工作流程。

ServiceNow董事长兼首席执行官比尔·麦克德莫特表示:“NVIDIA和ServiceNow多年来一直在塑造人工智能的未来,而最好的还在后头。今天,我们迈出了重要一步,助力各行各业的领导者加速推进其智能AI战略。ServiceNow的智能工作流自动化与NVIDIA Nemotron 3的结合,将继续以无与伦比的效率、速度和准确性树立行业标杆。”

随着多智能体人工智能系统的扩展,开发者越来越依赖专有模型来实现最先进的推理,同时利用更高效、更可定制的开放模型来降低成本。在单一工作流程中,将任务在先进模型和Nemotron之间路由,既能赋予智能体最大的智能,又能优化代币经济学。

“Perplexity 的理念是,将精准的人工智能技术融入卓越的工具(例如人工智能助手)中,能够极大地激发人类的好奇心,”Perplexity 首席执行官 Aravind Srinivas 表示。“借助我们的代理路由系统,我们可以将工作负载定向到经过最佳微调的开放模型(例如 Nemotron 3 Ultra),或者在任务需要时利用领先的专有模型,从而确保我们的人工智能助手能够以卓越的速度、效率和规模运行。”

开放的 Nemotron 3 模型使初创公司能够更快地构建和迭代 AI 代理,并加速从原型到企业部署的创新进程。General Catalyst 和 Mayfield 的投资组合公司正在探索使用 Nemotron 3 来构建支持人机协作的 AI 伙伴。

Mayfield 管理合伙人 Navin Chaddha 表示:“NVIDIA 的开放模型堆栈和 NVIDIA Inception 项目为早期公司提供了模型、工具和经济高效的基础设施,帮助他们进行实验、实现差异化并快速扩展。Nemotron 3 让创始人能够快速构建智能 AI 应用和 AI 团队成员,并帮助他们利用 NVIDIA 庞大的用户群。”

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法