跳至主要內容
星帆 — Vela
科技前線生醫突破政策解讀成長思維焦點追蹤
設定興趣偏好EN
科技前線

四千億美元投入後的殘酷現實:企業 AI GPU 利用率僅 5%

Jason
Jason
· 2 分鐘閱讀
更新於 2026年5月9日
A modern, massive data center with rows of glowing servers, in the foreground a single 5% progress b

算力狂熱的代價

過去兩年,矽谷與全球企業陷入了一場瘋狂的「GPU 搶奪戰」。算力被譽為「新石油」,企業為了避免在 AI 浪潮中被邊緣化,不惜代價大量預購 H100 等高階晶片,甚至導致這些硬體在黑市交易如非法走私貨般。然而,隨著這筆高達 4,010 億美元的基礎設施支出帳單到期,財務長們開始要求看到實質回報,現實卻殘酷得多:企業內部的平均 GPU 利用率竟停滯在僅 5% 的水準。

利用率低迷的根源

為什麼投入了天文數字的資本,AI 設施的利用率卻如此低迷?分析指出,企業在「過度配置」(Over-provisioning)算力時,忽略了軟體層面的協調瓶頸。多數企業雖然購買了硬體,卻缺乏開發能同時調度數千顆 GPU 的複雜軟體架構,導致大量算力處於空轉狀態,成為昂貴的「數位閒置資產」。

泡沫的徵兆?

這種 5% 的利用率數據引起了市場對 AI 經濟泡沫的廣泛擔憂。若企業不能將這些高昂的基礎設施成本轉化為實際的生產力提升,這場投資狂熱可能會變成下一場網路泡沫危機。企業需要從「單純購買硬體」轉向「投資 AI 營運工程」(LLMOps),以優化模型運作效率。

未來觀測:企業該如何解套?

為了扭轉此一困境,專家建議企業採取以下步驟:

  1. 聚焦單位經濟效益:重新評估每項 AI 專案對 GPU 的真實消耗,並建立精細化的成本歸因模型。
  2. 導入動態資源配置:透過 Kubernetes 等容器化技術,將算力資源在不同業務單元間彈性調度。
  3. 重視軟體堆疊優化:減少對單一硬體的依賴,轉而優化模型訓練過程中的演算法效率。

結語

4,010 億美元的支出證明了企業對 AI 未來的野心,但 5% 的利用率則是一個巨大的警訊。AI 轉型不僅是硬體競賽,更是企業對軟體調度、營運治理能力的全面考驗。接下來的一年,我們將觀察有多少企業能在這場低利用率的危機中,轉型為真正的 AI 高效能運作組織。

常見問題

為什麼 GPU 利用率只有 5%?

企業多數投資於硬體採購,卻缺乏能有效調度與分配這些算力的複雜軟體架構,導致資源閒置。

這對 AI 產業有什麼影響?

若無法提升利用率,企業恐難獲得預期的生產力回報,這將威脅到目前 AI 高投資額的可持續性。

企業可以怎麼改善?

導入彈性調度軟體,並建立精細的算力成本監控機制,減少不必要的過度配置。