跳至主要內容
科技前線生醫突破政策解讀成長思維焦點追蹤
設定興趣偏好EN
科技前線

微軟自研 AI 模型出擊,三大基座模型正面挑戰 OpenAI 與 Google

微軟推出自研 AI 模型 MAI-Transcribe-1、MAI-Voice-1 和 MAI-Image-2,直接挑戰 OpenAI 與 Google 的市場地位。

Jason
Jason
· 2 分鐘閱讀
更新於 2026年4月4日
Abstract digital concept art showing three pillars of AI technology (speech, voice, image) convergin

⚡ TL;DR

微軟推出三款內部研發的基座模型,旨在與 OpenAI 和 Google 的生成式 AI 產品直接競爭。

微軟推出三大 AI 基座模型:深化垂直整合

科技巨頭微軟(Microsoft)本週四正式發表了三款完全由公司內部研發的基礎 AI 模型,這標誌著這家市值三兆美元的軟體巨頭,不僅滿足於透過通路分發他人模型,更將直接進入模型研發的最前線。這三大模型分別為語音轉錄系統 MAI-Transcribe-1、語音生成引擎 MAI-Voice-1,以及升級版影像生成器 MAI-Image-2,旨在與 OpenAI 及 Google 的現有產品展開直接對決。

挑戰 OpenAI 與 Google 的生態霸權

微軟長期以來透過與 OpenAI 的緊密合作佔據 AI 領域的主導地位,但這次發布顯示微軟正採取「分散風險與深化掌控」的雙軌策略。透過在自家平台上提供這些模型,微軟能更好地優化軟體與硬體的整合,並減少對外部夥伴的過度依賴。根據 VentureBeat 的分析,這三大模型已經在微軟生態中開放給開發者使用,意味著微軟已準備好在生成式 AI 的基礎模型層面直接競爭。

模型實力與技術特點

這三款模型各有側重:

  • MAI-Transcribe-1:主打高精確度的語音識別,適用於會議記錄與多語言場景。
  • MAI-Voice-1:專注於自然且富有情緒表現的語音合成,在生成式內容中提供更擬真的體驗。
  • MAI-Image-2:透過升級的生成演算法,大幅提升了影像生成的連貫性與細節呈現。

市場意義:微軟的戰略新部署

這項進展不僅是對技術實力的展示,更是對市場份額的爭奪。透過提供與 OpenAI 或 Google 產品功能相似甚至更好的自研替代品,微軟不僅能降低授權成本,還能吸引更多不希望與 OpenAI 深度綁定的企業用戶。未來幾個月,這些模型在生產環境中的表現,將決定這場 AI 底層競賽的初期勝負。

常見問題

微軟推出了哪些新模型?

包括語音轉錄 MAI-Transcribe-1、語音生成 MAI-Voice-1 以及影像生成 MAI-Image-2。

為什麼微軟要開發自研模型?

為了降低對外部合作夥伴(如 OpenAI)的依賴,並針對自身平台進行垂直整合與效能優化。

這對 OpenAI 有威脅嗎?

微軟的自研模型提供企業用戶更多選擇,可能會在特定企業應用市場與 OpenAI 形成直接競爭。