全球 GPU 需求激增:人工智能探索时代

探索全球 GPU 需求激增,并发现 Aethir 的去中心化 GPU 云如何支持 AI 演进。

Featured | 
Community
  |  
June 9, 2025

全球 GPU 需求的激增正在引发技术格局的重大变革,开启一个由人工智能驱动的新时代。随着人工智能基础设施、应用程序和平台日益复杂,并引入前所未有的功能,对高性能 GPU 计算的需求持续呈指数级增长。在这个变革性的人工智能时代,核心在于需要充足的 GPU 资源来支持从生成式人工智能模型到沉浸式游戏体验等各种应用。NVIDIA GB200 芯片等行业巨头的最新创新,以及全球对高级人工智能计算的大量 GPU 需求,表明人工智能行业正在通过创新的现实应用改变众多行业。

在快速发展的市场格局下,GPU 正日益成为稀缺资源,中心化云服务可能难以以可扩展且经济高效的方式为 AI 和 Web3 初创公司提供充足的计算资源。Aethir 的去中心化 GPU 云通过一种替代性的 GPU 即服务模式,满足了全球日益增长的 GPU 需求,该模式为 AI 和游戏初创公司提供极具竞争力的价格,同时保持卓越的计算质量。

人工智能新时代与全球 GPU 需求

创新型人工智能工具、生产力平台、人工智能代理、聊天机器人、大型语言模型 (LLM) 训练以及生成式人工智能解决方案都需要强大的 GPU 计算能力才能运行。这是因为人工智能基础设施依赖于复杂的人工智能推理计算,而这只有高性能 GPU 才能实现。随着数亿人每天使用各种形式的人工智能工具,对这种强大 GPU 的需求正在飙升,超出了 NVIDIA GPU 生产工厂的产能。Nvidia 首席执行官黄仁勋最近直言:到 2028 年,人工智能基础设施支出将增长两倍,达到 1 万亿美元。预计计算需求将增长 100 倍。

企业正在部署更强大的模型,这些模型需要大规模并行计算能力,超出了传统数据中心的供应能力。这种需求不仅限于AI实验室,还延伸到金融、医疗、物流和游戏等行业,所有这些行业都依赖于有限的全球GPU计算资源。

OpenAI 等 AI 领军企业公开宣布,用户对 ChatGPT 全新图像生成服务等功能的海量需求正在“耗尽他们的 GPU 资源”,这指的是用户需求的激增。行业领导者比以往任何时候都更需要 GPU 计算能力,并且正在大量部署最新的 NVIDIA 芯片。然而,这很容易给 AI 初创公司(尤其是在 Web3 领域)造成 GPU 计算瓶颈,阻碍它们获取推出创新解决方案所需的急需计算资源。 

人工智能企业需要易于访问、灵活的 GPU 计算服务,而这些服务只能通过分散式 GPU 云来提供,例如 Aethir 的分布式 GPU 即服务模型。

NVIDIA 的 Blackwell 架构如何重塑 AI 基础设施

得益于NVIDIA的创新技术解决方案,全球GPU需求正飙升至前所未有的高位,这向AI企业表明,GPU行业拥有支持AI进一步演进的必要工具。AI基础设施依赖于高性能计算。  

NVIDIA 在今年的 GTC 大会上推出了多项改变游戏规则的 GPU 创新,其中包括 GB200 NVL72 系统,该系统提供了全新维度的 AI 推理功能。借助 GB200 NVL72 系统,AI 企业可以闪电般的速度训练万亿参数的 AI 模型。GB200 NVL72 将 72 个 Blackwell GPU 和 36 个 Grace CPU 连接到一个机架级系统中,能够提供远超其前代产品的性能水平。与 Hopper 一代的 H100 和 H200 相比,它为大规模 LLM 提供了 30 倍更快的 AI 推理速度和 25 倍更好的能效。Aethir 的去中心化 GPU 云是市场上首批搭载 GB200和 B200 加速器的GPU 即服务提供商之一,以去中心化、经济高效的方式为 AI 企业带来最新的 GPU 创新。

NVIDIA 的 Blackwell 架构正在为 AI 推理时代铺平道路,使开发者能够探索 AI 发展的新领域。它专为数据密集型 AI 工作负载而设计,支持对万亿参数模型进行实时训练和推理。Blackwell 在能效、计算密度和带宽方面树立了新的标杆,彰显了 NVIDIA 在 AI 硬件领域的持续领先地位。 

此类先进 AI GPU 芯片的推出,源于 AI 应用对优质计算资源的无尽渴求。然而,像 GB200 这样的芯片对于普通的 Web3 AI 初创公司来说可能遥不可及,从而导致资源集中在大型科技 AI 公司手中。 

全球GPU市场动态

美国政府近期宣布新一轮关税,导致股票和数字货币价值大幅下跌。关税对 GPU 行业的长期影响尚待观察。此外,美国更严格的出口法规使全球 GPU 供应链变得更加复杂。这些限制迫使跨国公司探索替代来源和架构,进一步限制了全球企业对 GPU 的可用性。 

与此同时,中国蓬勃发展的人工智能行业正需要新的高性能GPU来支持其人工智能基础设施。然而,由于美国的出口限制,NVIDIA的H20系列芯片是中国企业能够订购的最先进的人工智能芯片组。这些芯片特意在2023年推出,以遵守美国对华GPU出口的限制。但这似乎并没有阻止中国人工智能企业的发展。据报道,包括字节跳动、腾讯和阿里巴巴在内的中国科技巨头已向NVIDIA的H20芯片下达了超过160亿美元的订单。这表明,尽管面临地缘政治障碍,中国仍决心在人工智能领域保持竞争力。

在计算供应方面,CoreWeave作为中心化 GPU 云领域的重要参与者,备受瞩目。CoreWeave的 IPO取得了巨大成功,表明 AI 企业需要可靠、安全且可扩展的 GPU 计算提供商。AI 企业无需购买和维护数千个昂贵的高性能 GPU,而是可以从 GPU 即服务的 AI 基础设施提供商处租用优质 GPU。 

然而,像 CoreWeave 这样的中心化提供商主要专注于服务大型 AI 公司。规模较小的初创公司和富有远见的 AI 开发团队需要更灵活、更经济的 AI 基础设施,而像 Aethir 这样的去中心化运营模式则提供了可行的解决方案。

传统集中式GPU云服务面临的挑战

尽管NVIDIA的GPU生产率不断提升,GB200等更先进芯片组的推出也提升了AI推理能力的标准,但GPU供应仍面临严峻挑战。中国最大的服务器制造商之一新华三集团(H3C)最近对全球GPU需求激增导致NVIDIA AI芯片短缺表示担忧。尽管投入巨资,但供应仍无法跟上需求。顶级GPU的交付周期仍然很长,迫使初创企业和企业寻求替代的计算资源。Aethir的去中心化GPU云计算服务正是可以弥补这一缺口,为企业提供可扩展且经济高效的GPU即服务产品。

此外,新出现的地缘政治紧张局势和潜在的半导体关税(尤其是在美国)可能会进一步扰乱供应链并推高 GPU 成本,从而给本已动荡的市场增添不确定性。

资源利用不足会导致 AI 基础设施瓶颈,因为现有的高性能 GPU 通常位于利用率低于 30% 的大型数据中心。而 Aethir 的去中心化 GPU 云的平均 GPU 利用率高达 70%,并且与中心化 GPU 云相比,其计算价格极具竞争力。大型企业通常会过度配置 GPU 资源,以确保项目拥有充足的资源。然而,这会导致 GPU 闲置,加剧 GPU 资源的稀缺性。 

Aethir 的去中心化 GPU 云:经济高效的替代方案

成本效率是 AI 基础设施的决定性指标,通常标志着 AI 商业模式的可持续性和不可持续性之间的差异。中心化 GPU 计算提供商收取高昂的服务费,使得 AI 和 Web3 初创公司难以负担高性能 GPU。新兴的 AI 工作负载需要可预测、灵活且成本与其所支持的产品相匹配的计算能力。 

与中心化服务提供商不同,Aethir 的去中心化 GPU 云基础设施以低廉的价格提供拥有 425,000 多个优质 GPU 容器的最先进的计算服务。 

但是 Aethir 是如何做到这一点的呢?

Aethir 的 GPU 即服务 (GPU-as-a-service) 并非像中心化服务提供商那样将海量计算资源集中在少数几个区域数据中心,而是采用全球分布式网络架构。我们的 GPU 遍布全球 95 个国家/地区,包含数千个用于 AI 推理的最先进的 GPU,包括 H200、GB200和 B200 加速器,可大规模支持复杂的 AI 工作负载。

Aethir 的去中心化 GPU 云池将我们庞大的云主机网络提供的不同 GPU 资源的计算能力汇集在一起​​。通过将云主机的处理能力直接分配给企业客户,Aethir 可以随时调整 GPU 的分配,使客户能够动态扩展其运营,而无需担心计算瓶颈。 

分布式 GPU 网络对 AI 企业的关键优势

  1. 成本效益:与经常标记 GPU 访问权的集中式提供商不同,Aethir 的市场方法通过利用未充分利用的硬件来降低成本。
  2. 可扩展性和灵活性:企业可以动态扩展工作负载,而不受严格的集中式 AI 基础设施合同的限制。
  3. 边缘接近度:Aethir 的分散式架构允许将计算资源部署得更靠近最终用户,从而最大限度地减少实时 AI 推理和云游戏应用的延迟。

利用去中心化 GPU 云计算满足激增的计算需求

随着人工智能重新定义技术边界,获取强大的 GPU 已成为关键制约因素。领先的人工智能公司通过推出新产品以及利用先进生成式人工智能、人工智能代理和其他先进功能的功能,正在快速增加全球 GPU 需求。规模较小的公司和初创公司正在开发众多人工智能创新,但在获取优质 GPU 计算资源方面却面临更大的困难。

当像 NVIDIA 这样的中心化巨头不断通过 GB200 等创新突破界限时,Aethir 正在为 AI 云计算开创一种全新的去中心化平台。Aethir 提供了一种经济高效、可扩展且民主化的计算能力获取模式。 

分散式 GPU 云计算通过分配资源和集中处理能力以最大限度地提高 GPU 利用率,解决了成本效率和可访问性等关键的 AI 计算挑战。 

在人工智能探索时代,解决 GPU 瓶颈可能取决于世界接受这种新的去中心化范式的速度。

有关 Aethir 最新创新的更多详细信息,请查看我们的官方博客部分

要了解我们的 GPU 产品,请查看我们的企业 AI部分。

Resources

Keep Reading