改變人機對話的邏輯
自從大型語言模型(LLM)問世以來,我們與 AI 的互動始終遵循著一種「回合制」的模式:人類輸入指令,模型處理後輸出,再等待人類的進一步反饋。這種延遲感限制了 AI 在即時性工作中的表現。然而,前 OpenAI 技術長 Mira Murati 所領導的新創公司 Thinking Machines,正試圖打破這一界限。
根據最新發布的技術預覽,Thinking Machines 正在開發名為「交互模型」(Interaction Models)的技術。不同於傳統模型,這些新模型能夠在接收輸入的同時生成反應,將對話過程從「文字鏈模式」轉換為如同真人打電話一般的「持續流動模式」。
技術細節與突破
這種近實時(Near-Realtime)的交互體驗,核心在於模型架構的革新。傳統 AI 必須等待用戶語句結束才能開始思考,而 Thinking Machines 的模型能夠並行處理輸入並生成輸出。這意味著當你說話時,AI 已經在聽,並根據你談話的節奏與語意即時調整它的「回應內容」。
專家指出,這種技術突破的核心不在於模型的單點算力,而在於對資訊處理流的重組。這種交互模型旨在實現「協作」,而非單純的「問答」。在未來,當你與 AI 共同作業時,它將不再是一個等待確認的工具,而是一個能與你同時溝通的夥伴。
產業分析:從「工具」到「夥伴」
這項變革對企業級應用影響深遠。目前,許多 AI 代理仍停留在實驗階段,原因之一就是因為「互動的僵硬感」。如果 AI 能夠像真人一樣聽取語音、觀看影片流並即時做出反饋,那麼在製造業的遠程檢查、醫療領域的即時病歷記錄,甚至複雜的工程協作中,AI 將能夠扮演更活躍的角色。
儘管該技術目前尚未在主流市場全面鋪開,但行業預測,這類交互模型將成為 2026 下半年的關鍵競爭點。隨著 Mira Murati 在業界的影響力,Thinking Machines 預計將在接下來的幾個月內吸引大量企業夥伴投入試點。
監管與未來觀察
然而,隨著技術變得越來越自然,人類對於 AI 的信任感也將面臨新的挑戰。如何確保 AI 在近實時互動中保持倫理界限?如何防止 AI 在無意識中引導用戶?這些都將是該公司必須解決的問題。
未來幾個月內,觀察重點在於該技術如何與現有的硬體基礎設施(如低延遲網路)進行整合。Thinking Machines 的下一步計畫將決定 AI 是否能真正進入「無延遲互動」的黃金時代。
