阀块

阀块

华茂网 人工智能的前景与 Nvidia 的未来系于芯片集成竞赛

作者:阀块 日期:2024-12-29 21:56:48

  华茂网 人工智能的前景与 Nvidia 的未来系于芯片集成竞赛【微信/公众号/视频号/抖首/随信/小红书/快手/哔哩哔哩/微博/知乎/今日头条 同步报道】

  科技巨头们找到了一种新的竞争方式来决定谁能在AI领域占据主导地位:看哪家公司能在一个地点集中部署最多的 Nvidia 芯片。

  过去两年里,那些运营大型数据中心的企业一直在争相采购英伟达的人工智能处理器。而今,一些最具野心的公司正在逐步扩大这种趋势,它们建立了所谓的超级计算机服务器集群,这些集群耗费数十亿美元,包含了前所未有的大量英伟达最先进的芯片。 例如,埃隆·马斯克的 xAI 在短短几个月内在孟菲斯建成了名为 Colossus 的超级计算机,该计算机装备了10万个 Nvidia 的 Hopper AI 芯片。而 Meta 的 CEO 马克·扎克伯格上个月提到,他们已用一组芯片训练了公司的最新AI模型,这组芯片的规模是他见过的最大的。

  大约一年前,拥有数万个芯片的集群被认为是巨大的。根据瑞银分析师的估算,OpenAI 在2022年底推出 ChatGPT 版本时使用的大约是1万个 Nvidia 芯片。

  向更大规模的超级集群发展,有助于 Nvidia 维持其增长轨迹,其季度收入从两年前的大约70亿美元攀升至现在的超过350亿美元。这种增长使 Nvidia 成为了全球市值最高的上市公司,市值超过了3.5万亿美元。

  通过在同一地点安装多块芯片并使用超高速网络电缆连接起来,现在已能更快地生成更大规模的人工智能模型。然而,也有人怀疑,超级集群规模的不断增大能否持续提升聊天机器人的智能水平或图像生成工具的效果。 Nvidia 能否在 AI 领域持续繁荣,很大程度上取决于最大芯片集群的发展状况。这一趋势不仅预示着芯片购买热潮的到来,也将促进 Nvidia 的网络设备需求,这项业务正迅速成长为每年产生数十亿美元收入的关键部分。

  Nvidia 的 CEO 黄仁勋在最近一次财报电话会议中提到,随着计算装置规模的逐步扩大,人工智能的基础模型还有很大的进步空间。他预期,随公司向新一代的 Blackwell 芯片过渡,将持续投入资源。Blackwell 芯片的性能比现有产品高出数倍。

  黄仁勋还指出,尽管当前最大的用于训练大型 AI 模型的集群大约包含10万个 Nvidia 芯片,“下一代集群的起点将是大约10万个 Blackwell 芯片”。这句话揭示了行业发展的方向。

  对于像 xAI 和 Meta 这样的公司而言,它们在计算能力的竞争中承担着巨大的风险,同时也押注拥有更多的 Nvidia 芯片(即 GPU)将带来更加优秀的 AI 模型。 研究公司 SemiAnalysis 的首席分析师 Dylan Patel 表示:“虽然没明确的证据说明这种扩展能够达到百万级别的芯片和价值1000亿美元的系统,但是观察到的现象表明,从几十个芯片扩展到十万级别的芯片,系统的可扩展性表现得非常好。”

  除了 xAI 和 Meta,OpenAI 和微软也在积极建设重要的新计算设施以支持其人工智能的发展。谷歌同样在扩建大型数据中心,以容纳驱动其人工智能战略所需的芯片。

  黄仁勋此前在一个播客中对马斯克快速建立 Colossus 集群的能力表示惊讶,并确认更多更大规模的集群正在建设之中。他还提到,马斯克正在尝试跨多个数据中心训练模型。

  “我们是否认为需要数百万个 GPU?答案是肯定的,”黄仁勋说道。“这慢慢的变成了了一个确定的事实。问题就在于我们如何从数据中心的角度来实现这一点。”

  随着对 Blackwell 芯片的准备,前所未有的超级集群成为了关注的焦点。据估计,单个芯片的成本约为3万美元,这在某种程度上预示着一个包含10万个芯片的集群将花费30亿美元,这还没有算上电力基础设施和IT设备的成本。

  业界的人说,考虑到这些成本,构建拥有更多芯片的超级集群其实就是一种赌博,因为目前尚不清楚这些投入是否能带来与之匹配的人工智能模型的改进。

  更大的集群往往伴随着新的工程难题。Meta 的研究人员在今年7月发表的一篇论文中提到,在54天内训练其 Llama 模型的高级版过程中,由超过16,000个 Nvidia GPU 构成的集群频繁遇到芯片及其他组件的意外故障。

  随着高能耗芯片集群越来越密集地聚集在一起,确保 Nvidia 芯片的冷却成为一大挑战,这也推动了向液冷技术的转变——将冷却剂直接引导至芯片以避免过热。

  此外,超级集群的规模巨大,当芯片出现故障时,管理和维护这些芯片变得更困难。Penguin Solutions 的 CEO Mark Adams 指出,随着芯片集群规模的扩大,操作的复杂性不可避免地增加,这带来了更多的问题。

  “当你考虑到也许会出现的所有问题时,实际上可能因为这一些问题而消耗掉一半的资本支出。”他说。

  (于网络)新华社快讯:韩联社29日报道,韩国务安机场飞机发生坠落,机上载有175名乘客,6名乘务人员,事故现场至少23人死伤。另据央视新闻客户端消息,当地时间12月29日9时7分左右,一架正在着陆的飞机在全罗南道的务安国际机场偏离跑道,撞上了围栏外墙,随后客机起火。

  中央广播电视总台《2025年春节联欢晚会》正在紧锣密鼓筹备中。经上级部门批准,12月29日,春晚主创团队官宣:总导演于蕾,副总导演赵大治、杨觐梦,及刘惠子、张异凡、宋飞、邓赟、毕波、张骥、顾志刚、张敏、郝婧、刘欣等共同组成主创团队,全力推进2025年春晚创作。

  秦皇岛市中级法院近期认定,其受贿、贪污、挪用公款折合共计人民币1.09亿元,另有7430.48万元巨额财产不能说明合法来源,非法持有4支,还构成故意伤害和故意毁坏财物罪,七罪并罚判处死缓。

  “最晚12点还在发作业”,家长在群里质疑布置作业太晚,被班主任踢出群!本人要求公开道歉,当地教育局回应

  12月27日,甘肃省武威市一位小学家长发视频反映,因自己在家长群里质疑三年级英语老师布置作业过晚,问题没解决,自己倒被班主任踢出群。12月28日,记者从武威市教育局证实,凉州区教育局已转给学校核查处理。

  076两栖攻击舰正式下水和被广泛猜测为“第六代战机”的隐形战机出现在成都上空,组成了一个“新高潮”,国人为之鼓舞,也震动了西方。中国海空军尖端装备继续向世界顶级水平迈进,亚太的海洋和天空在变化。

  成都武侯区法院解读“女子遭家暴16次”案:为何没定性为故意杀人,为何不能判死刑

  (原题为《关于被告人贺某阳故意伤害、虐待刑事附带民事诉讼案的说明》)来源:武侯法院微信公众号(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)

  中东焦灼的事态持续升级,美国萨德反导系统已经正式参战。紧要关头,伊朗外长开启访华之行,在北京主动对外强调了最大的目的。叙利亚局势的变化也导致中东地区的焦灼的事态进一步升级。在12月27号,以色列媒体公布消息称,当前美军部署在以色列境内的“萨德”反导系统首次参与了拦截弹道导弹的行动。