西湖娱乐 xihuyule 分类>>
黄仁勋:7nm芯片已经足够好了充足的能源是中国的优势西湖娱乐城- 西湖娱乐城官网- APP
西湖娱乐城,西湖娱乐城官方网站,西湖娱乐城APP,西湖娱乐城网址,西湖娱乐城注册
不对。完全不对。你可以把它们组合起来,就像我们把它们和NVL72组合起来一样。他们已经展示了硅光子学技术,可以将所有这些计算能力连接起来,形成一台巨型超级计算机。你的前提完全错误。
事实上,他们的AI研发进展顺利。世界上最顶尖的AI研究人员,由于计算能力有限,反而创造出了极其智能的算法。别忘了,我刚才说过摩尔定律每年大约推进25%。然而,凭借卓越的计算机科学,我们仍然可以将算法性能提升10倍。我的意思是,卓越的计算机科学才是关键所在。
毫无疑问,MoE 是一项伟大的发明。毫无疑问,所有令人惊叹的注意力机制都减少了计算量。我们必须承认,人工智能的大部分进步都源于算法的进步,而不仅仅是硬件的改进。既然大部分进步都来自算法、计算机科学和编程,那么他们庞大的人工智能研究人员队伍难道不是他们最根本的优势吗?我们都看到了这一点。DeepSeek 绝非无关紧要的进步。如果 DeepSeek 先在华为平台上发布,那对我们国家来说将是灾难性的。
Q:为什么会这样?因为目前像 DeepSeek 这样的模型,只要是开源的,就可以在任何加速器上运行。为什么将来情况会改变呢?
黄仁勋:假设并非如此。假设它是针对华为优化的,假设它是针对他们的架构优化的。那将使我们处于劣势。你描述的情况在我看来是好消息。一家公司开发了一款软件,开发了一个人工智能模型,而它在美式技术栈上运行效果最佳。我认为这是好消息。但你却把它设定为坏消息。现在我要告诉你坏消息:世界各地的人工智能模型都是在非美国硬件上开发的,而它们在非美国硬件上运行效果最佳。这对我们来说是坏消息。
Q:我感觉并没有证据表明存在如此巨大的差异,足以阻止你更换加速器。美国实验室正在所有云平台、所有不同的加速器上运行他们的模型。
黄仁勋:我就是证据。你拿一个针对英伟达显卡优化的模型,然后试图在其他显卡上运行它,这是行不通的。
黄仁勋:它们的运行效果并没有更好。英伟达的成功就是最好的证明。人工智能模型是在我们的技术栈上创建的,在我们的技术栈上运行效果也最好,这难道不合逻辑吗?
黄仁勋:要改变现状,需要付出很多努力。但看看全球南方国家,看看中东地区。如果所有人工智能模型在别人的技术栈上运行效果最佳,那么你现在提出的“这对美国来说是件好事”的说法就太荒谬了。
Q:但我不太明白这个论点。假设中国公司率先开发出下一代Mythos系统。他们率先发现了美国软件的所有安全漏洞,但他们可以在英伟达硬件上运行,然后把产品运往全球南方国家。他们用英伟达硬件开发,这有什么好处呢?好吧,它的确能在英伟达硬件上运行——
Q:你为什么认为它(指代英伟达GPU)是完全可替代的,即使你不向他们供货,华为也能完全替代?他们落后了,对吧?他们的芯片比你的差。
Q:你只要对比H200和华为910C的浮点运算能力、带宽或内存容量就知道了,它们的性能大概只有前者的一半到三分之一。
Q:我相信最终他们肯定能在生产能力上胜过所有人。但现在还有这关键的几年。
黄仁勋:你所说的关键年份是指哪一年?如果未来几年至关重要,那么我们必须确保在这关键的几年里,全世界所有的人工智能模型都建立在美国的技术栈之上。
人工智能产业有五个层面,每个层面都必须成功。而最需要成功的层面实际上是人工智能应用。你为什么如此执着于那个人工智能模型?那家公司?究竟是出于什么原因?
Q:如果美国的计算能力存在瓶颈,那么向中国出口芯片又如何能使美国保持领先地位呢?
黄仁勋:我认为美国理应领先。美国的计算能力是世界其他任何地方的100倍。美国理应领先。好吧。美国确实领先。
英伟达致力于研发最先进的技术。我们确保美国实验室能够第一时间获悉这些技术,并拥有优先购买权。如果他们资金不足,我们甚至会投资扶持他们。美国理应领先。我们希望竭尽所能确保美国保持领先地位。这一点您同意吗?我们正在为此竭尽全力。
你认为英伟达是一家美国公司?好的。首先,为什么我们不制定一个更平衡的监管政策,让英伟达能够在全球范围内取得成功,而不是让美国放弃全球市场?你为什么要让美国放弃全球市场?
芯片产业是美国生态系统的一部分,是美国技术领先地位的一部分,也是人工智能生态系统的一部分,更是人工智能领先地位的一部分。为什么你们的政策和理念会导致美国放弃世界市场的大部分份额?
Q:所以关键在于,现在卖芯片对我们长远发展有何帮助?特斯拉长期以来一直向中国销售性能卓越的电动汽车。iPhone在中国也畅销,而且质量极佳。特斯拉并没有造成中国市场的垄断。中国仍然会生产自己的电动汽车,并且占据主导地位。他们的智能手机也占据主导地位。
黄仁勋:今天我们开始对话时,您也承认英伟达的处境非常特殊。您用了“护城河”这样的词。对我们公司而言,最重要的就是我们生态系统的丰富性,而这离不开开发者。全球50%的人工智能开发者都在中国。美国不应该放弃这块宝地。
Q:但是我们在美国有很多英伟达的开发者,但这并不妨碍美国实验室未来使用其他加速器。事实上,他们现在就在使用其他加速器,这很好,也很棒。如果你向中国销售英伟达芯片,我不明白为什么在中国就不能这样做,就像谷歌可以使用TPU和英伟达芯片一样。
黄仁勋:我们必须不断创新,而且正如你可能知道的,我们的市场份额正在增长,而不是下降。那种认为即使我们在中国竞争,最终也会失去那个市场的想法……你不是在跟一个醒来就觉得自己是个失败者的人说话。那种失败者的态度,那种失败者的假设,在我看来毫无道理。
我们不是汽车。我们不是汽车。我可以今天买这个牌子的车,明天再买另一个牌子的车,这很容易。但计算机领域并非如此。x86 架构的存在是有原因的。ARM架构如此根深蒂固也是有原因的。这些生态系统难以替代。这需要耗费大量的时间和精力,而且大多数人都不愿意这样做。因此,我们的职责是继续培育这个生态系统,不断推进技术发展,从而在市场竞争中保持优势。
如果按照你描述的那种前提来划分市场,我根本无法接受。这完全说不通。因为我不认为美国是失败者,我们的行业也不是失败者。这种失败论调,这种失败心态,在我看来毫无道理。
Q:但他们之所以从你这里购买是有原因的。我们有来自中国公司创始人的引述,他们表示公司在计算能力方面遇到了瓶颈。
黄仁勋:因为我们的芯片更好。总的来说,我们的芯片更好。这一点毋庸置疑。如果没有我们的芯片……您能承认华为今年的业绩创下纪录吗?您能承认一大批芯片公司都上市了吗?您能承认吗?
您是否也承认,我们过去在该市场占据了很大的份额,而现在份额已经大幅下降?我们也可以承认,中国占据了全球科技产业约40%的份额。为了美国科技产业的利益而放弃这个市场,是对我们国家的损害,是对我们国家安全的损害,也是对我们科技领导地位的损害。这一切仅仅是为了一家公司的利益。这在我看来毫无道理。
Q:我有点糊涂了。感觉你好像在说两件事。一是如果我们能参与竞争,我们的芯片性能会远胜华为,所以我们肯定能赢下这场与华为的竞争。二是就算没有我们,他们也会做同样的事情。这两件事怎么可能同时成立呢?
黄仁勋:这显然是事实。如果没有更好的选择,你只能选择唯一的选择。这怎么会不合逻辑呢?这明明很合乎逻辑。
Q:更好的模型需要更多的计算资源。更多的计算资源意味着你可以训练出更好的模型。
黄仁勋:不,它就是更好。它更好,因为它更容易编程。我们拥有更好的生态系统。但无论“更好”指的是什么,无论“更好”指的是什么……当然,我们会把计算资源输送给他们。那又怎样?事实是我们能从中受益。别忘了,我们能享受到美国技术领先地位带来的好处。我们能享受到开发者们在美国技术栈上工作的益处。随着这些人工智能模型扩散到世界各地,我们也能享受到美国技术栈因此成为最佳选择带来的好处。我们可以继续推进和推广美国技术。我认为这是一件好事。这是美国技术领先地位中非常重要的一部分。
现在,你所倡导的政策导致美国电信行业基本上被排挤出了世界市场,以至于我们甚至无法掌控自己的电信业务。我认为这并不明智。这种做法有些目光短浅,而且导致了一些意想不到的后果,我现在正在向你描述这些后果,但你似乎很难理解。
Q:好的,我们先退一步。问题的关键似乎在于,这里既有潜在的收益,也有潜在的成本。我们正在努力弄清楚的是,收益是否值得付出成本?我想让你们意识到潜在的成本。计算是训练强大模型的输入。强大的模型确实拥有强大的攻击能力,例如网络攻击。美国公司率先达到 Mythos 级别的能力是一件好事,现在他们决定暂缓发布这些能力,以便美国公司和美国政府能够在正式发布该级别能力之前,更好地保护他们的软件。
如果中国拥有更强大的计算能力或更多的众包计算资源,如果他们能够更早地开发出类似 Mythos 那样的计算模型并进行广泛部署,那将会非常糟糕。这种情况没有发生的原因之一是,由于像英伟达这样的美国公司,我们拥有了更强大的计算能力。这是将计算资源转移到中国所要付出的代价。所以,我们暂且不谈好处。您是否意识到这是一种潜在的代价?
黄仁勋:我还要告诉你,潜在的代价是,我们允许人工智能技术栈中最重要的一层——芯片层——拱手让出整个市场——全球第二大市场——让他们得以发展规模,建立自己的生态系统,从而使未来的人工智能模型以与美国技术栈截然不同的方式进行优化。随着人工智能在全球扩散,他们的标准和技术栈将会超越我们,因为他们的模型是开放的。
Q:我想我只是对英伟达的内核工程师和CUDA工程师有足够的信心,相信他们能够进行优化——
中国是全球最大的开源软件贡献国。这是事实。中国也是全球最大的开放模型贡献国。这是事实。如今,它建立在美国的技术栈之上,也就是英伟达的技术栈。这是事实。
人工智能技术栈的五个层面都至关重要。美国应该力争拿下所有五个层面。它们都不可或缺。当然,最重要的层面是人工智能应用层。这一层会渗透到社会各个角落,被应用最为广泛,也将从这场工业革命中获益最多。但我的观点是,每一层都必须成功。
如果我们吓唬全国人民,让他们觉得人工智能就像核弹一样,让每个人都憎恨人工智能、害怕人工智能,我不知道这对美国有什么好处。这只会害了美国。如果我们吓得所有人都不敢从事软件工程工作,因为人工智能会扼杀所有软件工程岗位——结果导致我们一个软件工程师都没有——那我们也是在害美国。
如果我们因为计算机视觉完全免费,人工智能的工作能力不会比放射科医生差,就吓跑所有人,让大家都不想当放射科医生,那我们就误解了工作和任务之间的区别。放射科医生的工作是照护病人,而任务是解读扫描结果。如果我们对这一点理解如此深刻,吓跑所有人去读放射科,那么我们将面临放射科医生短缺和医疗资源匮乏的问题。
所以我的意思是,当你设定一个如此极端的前提,一切都从零到无穷大,最终只会吓到人们,而这根本不是事实。生活并非如此。我们希望美国领先吗?当然希望。我们需要在各个层面都保持领先地位吗?当然需要。当然需要。今天你谈到Mythos,是因为Mythos很重要。没错。太好了。
但几年后,我预言,当我们想要推广美国技术体系,当我们希望美国技术走向世界——走向印度、走向中东、走向非洲、走向东南亚——当我们的国家想要出口,因为我们想要出口我们的技术,我们想要出口我们的标准时,我希望你我再次进行同样的对话。我会详细地告诉你今天的对话,告诉你你的政策和你的设想是如何导致美国毫无理由地拱手让出世界第二大市场。
我们不应该放弃。如果输了,那就输了。但我们为什么要放弃呢?现在没人主张非此即彼。没人主张非此即彼,也就是说我们应该一直把所有东西都运到中国去。没人主张那样。我们应该始终拥有最先进的技术。我们应该始终拥有最多的技术,并且是第一。但我们也应该努力在全球范围内竞争并取得胜利。这两件事可以同时进行。这需要一些细致入微的思考,一些成熟的态度,而不是绝对的。世界本来就不是绝对的。
Q:因为受到各种限制(例如拿不到EUV光刻机),中国的芯片真的能出口到世界各地,从而确立行业标准吗?
黄仁勋:那我们直接看事实吧?Blackwell的光刻技术线倍吗?线倍吗?差远了。我一直在重复这句话:摩尔定律已经失效了。从晶体管本身的性能来看,Hopper和Blackwell之间的差距大概是75%。两者相隔三年,差距高达75%。Blackwell尔的性能是Hopper的50倍。
我的观点是,架构至关重要。计算机科学至关重要。半导体物理固然重要,但计算机科学才是重中之重。人工智能的影响很大程度上源于计算栈,这也是CUDA如此高效、如此受人喜爱的原因。它是一个生态系统,一种计算架构,它提供了极大的灵活性,以至于如果你想彻底改变架构——比如创建类似MoE的架构、类似扩散的架构、或者创建解耦架构——你都能做到。这很容易。
所以事实是,人工智能不仅关乎底层架构,也关乎上层技术栈。如果我们拥有针对自身技术栈和生态系统进行优化的架构和软件栈,那当然是好事,因为我们今天一开始就讨论了英伟达生态系统的丰富性。为什么人们总是喜欢先写CUDA?确实如此。中国的研究人员也是如此。
但如果我们被迫离开中国,首先,这是一个政策错误。显然,这会引发强烈反弹。这对美国来说后果很严重。它促进了中国的芯片产业发展,加速了其人工智能生态系统的转型升级,迫使其人工智能生态系统专注于内部架构。现在亡羊补牢,为时未晚,但事已至此。
未来你会看到,他们显然不会止步于于此。他们的制造工艺很出色,他们会继续在现有及更先进的工艺基础上发展。先进工艺的差距有10倍吗?答案是否定的。架构很重要,网络也很重要。这就是英伟达收购Mellanox的原因。网络很重要,能源也很重要。所有这些都很重要。事情并不像你试图简化的那样简单。为什么英伟达不生产多种不同的芯片架构?
所以,如果我们身处这样一个世界:你已经占据了N3的大部分份额——而且在某个时候你会进入N2时代,并占据N2的大部分份额——你是否认为你可以回到N7时代,也就是利用旧工艺节点的剩余产能,然后说:“嘿,人工智能的需求如此巨大,而我们扩展前沿技术的能力却无法满足,所以我们要制造一个Hopper或Ampere架构的处理器,但要运用我们目前掌握的所有数值计算知识以及你提到的所有其他改进”?你认为这种情况会在2030年之前发生吗?
黄仁勋:没必要。原因在于,每一代产品的架构都不仅仅局限于晶体管的尺寸。它还涉及到大量的工程设计、封装、堆叠、数值计算和系统架构。
当产能耗尽时,想要轻易地回到之前的制程节点……那需要投入大量的研发资源,谁也负担不起。我们有能力向前发展,但我认为我们负担不起回头路。现在,假设有一天,我们突然意识到:“我们再也无法拥有更多的产能了。”我会选择回到7nm制程吗?当然会毫不犹豫地选择它。
Q:我之前和人讨论时,有人问过我一个问题:为什么英伟达不同时开展多个架构完全不同的芯片项目?比如,可以开发类似Cerebras的晶圆级芯片,也可以开发类似Dojo 的大型封装芯片,还可以开发不使用 CUDA 的芯片。英伟达拥有足够的资源和工程人才来并行开发所有这些芯片。考虑到人工智能和架构的未来发展方向难以预测,为什么要把所有鸡蛋都放在一个篮子里呢?
黄仁勋:哦,我们当然可以。只是我们没有更好的办法。我们能做所有这些事情,但效果并不理想。我们在模拟器里模拟了所有情况,结果证明更糟。所以我们不会这么做。我们现在做的正是我们想做的项目。如果工作负载发生巨大变化——我指的不是算法,而是工作负载本身,而这取决于市场格局——我们可能会考虑增加其他加速器。
例如,我们最近新增了Groq ,并且计划将其整合到我们的 CUDA 生态系统中。我们现在这样做是因为token价值飙升,可以采用不同的定价策略。就在几年前token要么是免费的,要么价格非常低廉。但现在,我们的客户群体各不相同,他们需要不同的解决方案。因为客户收入很高——例如我们的软件工程师——如果我能为他们提供响应速度更快的代币,从而让他们比现在更高效,我愿意为此付费。
但这个市场是最近才出现的。所以我认为我们现在有能力基于响应时间,将同一个模型划分成不同的细分市场。这就是我们决定扩展帕累托前沿,并创建一个响应时间更快、但吞吐量更低的推理细分市场的原因。在此之前,更高的吞吐量总是更好的。我们认为,未来可能会出现平均售价(ASP)非常高的代币,即使工厂的吞吐量较低,ASP 也能弥补这一点。
这就是我们这么做的原因。但除此之外,从架构角度来看,如果我有更多资金,我会加大对英伟达架构的投入。
黄仁勋:加速计算,这和我们一直以来所做的一模一样。我们公司的理念是摩尔定律将会……通用计算在很多方面都很出色,但对于很多计算任务来说,它并非理想之选。
因此,我们将一种名为GPU(CUDA)的架构与CPU结合起来,从而加速CPU的工作负载。不同的代码内核或算法可以卸载到GPU上执行。这样一来,应用程序的运行速度就能提升100倍、200倍。这项技术有哪些应用呢?显然,它适用于工程、科学、物理、数据处理、计算机图形学、图像生成等各个领域。即使人工智能今天尚未出现,英伟达的规模也会非常庞大。
原因相当根本,那就是通用计算的扩展能力已基本达到极限。而唯一的方法……或者说,实现这一目标的方法之一,就是通过领域特定加速。我们最初关注的领域之一是计算机图形学,但还有许多其他领域。种类繁多,包括粒子物理和流体动力学、结构化数据处理,以及各种各样能够从 CUDA 中受益的算法。
我们的使命是真正将加速计算带给全世界,推进通用计算无法胜任的应用,并扩展到足以帮助某些科学领域取得突破的水平。早期的一些应用包括分子动力学、用于能源勘探的地震数据处理、图像处理等等,所有这些领域通用计算的效率都太低,无法胜任。
如果没有人工智能,我会非常难过。但正因为我们在计算机领域取得了进步,深度学习才得以普及。我们让任何研究人员、任何科学家、任何学生,无论身处何地,都能使用个人电脑或GeForce显卡,开展令人惊叹的科学研究。这一根本承诺从未改变,丝毫未变。
如果你看过GTC,就会发现它最初的部分完全与人工智能无关。无论是计算光刻、量子化学,还是数据处理等等,都与人工智能无关。而且这些内容仍然非常重要。我知道人工智能非常有趣,也很令人兴奋,但还有很多人在做着与人工智能无关的重要工作,张量也不是唯一的计算方法。我们希望能够帮助到所有人。
沪ICP备10213822号-2互联网新闻信息服务许可证: 网登网视备(沪)-1号 互联网宗教信息服务许可证:沪(2024)0000009 广播电视节目制作经营许可证:(沪)字第03952号
增值电信业务经营许可证:沪B2-20210968 违法及不良信息举报电话
2026-04-18 08:10:04
浏览次数: 次
返回列表
友情链接:





