Transcribe 的準確度如何？

Transcribe 的字詞錯誤率（WER）為 5.4%，Cohere 表示該效能足以媲美甚至超越目前市場上的主流封閉 API。

為什麼說開源權重對企業很重要？

開源權重讓企業能將 AI 模型部署在自己的伺服器上，無需將敏感錄音資料傳輸至第三方，符合嚴格的資料隱私與合規需求。

主要優勢在於部署的靈活性與數據主權，企業可擁有對模型與資料流的完全控制，而無需依賴外部封閉 API。

在人工智慧語音識別領域，企業長期以來面臨著一種艱難的選擇：要么使用封閉的雲端 API，雖準確但存在數據外洩風險；要么選用準確度較低的開源模型。Cohere 於今日發布了全新的開源權重自動語音識別（ASR）模型——Transcribe，試圖從準確度、延遲性、控制權與成本四個維度重新定義市場標準。

根據 VentureBeat 的報導，Transcribe 模型展現了極高的識別精度，其字詞錯誤率（Word Error Rate, WER）僅為 5.4%。Cohere 指出，這一性能表現已經足以取代多數工業級的封閉語音 API，成為生產環境中的主流選擇。

Transcribe 的最大優勢在於其「開源權重」的設計。這意味著企業可以在自有的基礎設施上部署該模型，無需將原始語音資料發送至外部雲端。這對於金融、醫療等對數據隱私有極高要求的產業而言，是一個巨大的吸引力。

此舉將對現有的語音識別市場造成震盪。長期以來，OpenAI 等公司的封閉語音模型在性能上具有顯著優勢，但企業對其黑盒子的運作方式與數據流向充滿疑慮。Cohere 透過 Transcribe，明確瞄準了那些希望擁有 AI 技術控制權、同時又不願犧牲精確度的中大型企業。

產業分析認為，隨著企業對數據主權的要求日益嚴格，能夠在地化部署的高準確度模型將成為未來 AI 軟體堆疊（stack）的標準組件。Transcribe 的推出，將進一步推動 ASR 技術從雲端依賴走向在地化/私有雲運算。

隨著 Transcribe 的發布，未來數月內市場將會關注：

Cohere 此次不僅是發布了一個模型，更是在證明「開源權重」模型足以與「封閉 API」抗衡，這可能是未來 AI 產業從通用服務向深度垂直解決方案轉型的關鍵一步。