Perplexity AI 發表邊緣雲端混合推論系統，開拓硬體整合新局

邊緣運算與雲端的新連結

在 Computex 2026 大會上，AI 搜尋與知識平台 Perplexity AI 展示了一項名為「混合推論系統」（Hybrid Inference System）的開創性技術。這項系統旨在解決當前大型語言模型在回應延遲與成本負擔上的兩大痛點，透過自動化決策機制，在用戶設備與雲端算力之間進行聰明的切換。

自動化工作負載調度

這套系統的核心在於其能即時評估當前任務的複雜度。對於簡單的指令（例如基礎的查詢或文件摘要），系統會優先調用用戶設備上的離線模型進行處理，從而實現零延遲體驗。而當系統偵測到更複雜的分析或多模態輸入需求時，則會無縫導引至雲端 Frontier 模型執行。這種動態調度能力，有效降低了雲端基礎設施的負載成本。

對產業的深遠影響

這項技術演示引起了硬體夥伴的強烈興趣。透過在設備端執行部分 AI 工作負載，Perplexity 的方案大幅提升了筆電、平板等邊緣設備的 AI 處理效能。這預示了未來 AI 應用將不限於雲端，而是更廣泛地整合進邊緣設備硬體中，開創了 AI 原生硬體的新時代。

未來展望與觀察

Perplexity 的此項佈局顯示，AI 競爭已從單純的模型參數量級，轉向對運行效率與用戶體驗的爭奪。隨著邊緣運算硬體的性能不斷提升，我們將持續關注該混合系統在實際部署中的穩定性，以及開發者如何利用此框架來構建更高效的 AI 應用。

❓ 常見問題

Perplexity 的混合推論系統如何提升效率？

它能根據查詢的複雜度自動判斷，簡單問題在邊緣設備執行以減少延遲，複雜任務則導向雲端進行處理。

這項技術的主要優勢是什麼？

除了減少延遲外，還能降低雲端伺服器負載，並優化運行成本，讓 AI 服務更具擴展性。

哪些裝置可以受益於這項技術？

該技術能提升筆電、平板等邊緣設備的 AI 處理能力，促進 AI 應用更廣泛的硬體整合。