AI 技術新戰線:代理人框架與生成式 AI 的開源浪潮
AI 開發者社群正從 LLM 轉向代理人(Agents)架構與 tokenizer-free 語音技術。美台兩地的 AI 搜尋熱度顯示,美國側重消費軟體應用,台灣則聚焦於 AI 硬體整合與 PC 市場。
AI 開發者社群正從 LLM 轉向代理人(Agents)架構與 tokenizer-free 語音技術。美台兩地的 AI 搜尋熱度顯示,美國側重消費軟體應用,台灣則聚焦於 AI 硬體整合與 PC 市場。
DeepSeek 宣布將其旗艦模型 V4 Pro 的價格永久下調 75%,利用創新架構挑戰矽谷 frontier labs 的高昂模型收費模式。
Spotify 與環球音樂達成歷史性協議,允許 Premium 用戶使用 AI 創作 Remix 及翻唱曲目,並與 ElevenLabs 合作推出 AI 有聲書工具,同時引入 AI 播客總結功能,旨在將 AI 創作納入合法分潤生態。
AI 內容生成氾濫引發媒體不確定性。深偽技術不僅對 KYC 身分驗證構成威脅,也迫使音樂版權法針對「聲音」與「肖像權」進行根本性的變革。
知名文學獎項面臨 AI 代寫疑雲,這不僅是文學界的信任問題,更觸及了 AI 生成內容在知識產權、倫理與創意產業中,對於人類作者未來生存空間的深層擔憂。
Anthropic 的 15 億美元版權和解案因法官質疑律師費比例過高而遭推遲,顯示法院將加強對 AI 集體訴訟公平性的監督。
微軟最新研究發現,大型語言模型在改寫文檔時會發生「靜默篡改」,導致資訊錯誤且極難察覺。此風險對企業合規與法律文件處理構成重大挑戰。
OpenAI 推出 ChatGPT 新預設模型 GPT-5.5 Instant,聲稱在事實准确性上有顯著進步,內部評估顯示幻覺率降低 52.5%。
AI 深偽技術引發嚴重的身分盜用危機,名人透過爭取肖像商標保護嘗試防衛,同時法律體系正加速完善數位複製規範。
Anthropic 推出一套全新 Claude 連接器,支援直接操作 Adobe Creative Cloud、Blender、Ableton 等創意軟體,讓 AI 成為專業創作者的工作助手。
OpenAI 發布 ChatGPT Images 2.0,該版本在圖像生成中展現了驚人的文字渲染能力,能精準製作包含文字的資訊圖表、簡報與漫畫。
OpenAI 發布 ChatGPT Images 2.0,具備網路搜尋、多語言文字渲染及自動產生專業資訊圖表(如簡報、地圖)的功能,大幅提升生產力。
OpenAI 發布 ChatGPT Images 2.0,顯著提升了文字渲染能力及生成資訊圖表、地圖與多語言內容的實用性。
Adobe 因其訂閱模式與 AI 策略引發用戶不滿,創意軟體市場正湧現眾多尋求彈性授權的替代方案,產業出現去中心化趨勢。
Adobe 推出 Firefly AI Assistant 以整合創意軟體套件,Anthropic 則更新 Claude Code 並加入 Routines 功能。這些進展標誌著 AI 發展從被動的聊天機器人轉向自主執行的代理型 AI,為企業自動化提供了新的生產力架構。
Adobe 發布 Firefly AI Assistant,這是一款能夠跨應用程式執行複雜多步驟工作流的代理型 AI 工具,旨在重塑創意工作流程並確立其在生成式 AI 時代的領導地位。
Meta 正式發布 proprietary(專有)模型 Muse Spark,標誌著公司在經歷 Llama 系列爭議後,AI 策略轉向閉源與高效能優先。該模型由新設立的超級智能實驗室開發,並將整合進 Meta 全產品線。
Meta 超智能實驗室發表全新 Muse Spark AI 模型,已整合於 Meta AI 平台,並將陸續登陸 WhatsApp、Instagram 與 Facebook 等社交軟體。
人工智慧從聊天機器人進化為任務型代理,儘管帶來顯著的自動化便利與市場興趣,但也引發了關於職位安全與執行自主性的深層焦慮。
生成式 AI 在版權與信任問題上持續引發爭議,特別是 Suno 音樂平台的訴訟案及 Microsoft Copilot 的免責聲明。科技巨頭透過「娛樂用途」規避責任,對創作者與用戶造成嚴重衝擊,司法系統目前正試圖釐清 AI 訓練數據是否構成侵權。
微軟正式發布三款自研基礎 AI 模型(語音轉錄、語音生成、影像創作),標誌著微軟從 AI 服務分銷商轉向模型研發核心,直接與 OpenAI 及 Google 競爭,旨在提升企業技術自主性並深化微軟生態系整合。
微軟推出自研 AI 模型 MAI-Transcribe-1、MAI-Voice-1 和 MAI-Image-2,直接挑戰 OpenAI 與 Google 的市場地位。
微軟推出三款自主研發的基礎 AI 模型(MAI-Transcribe-1、MAI-Voice-1、MAI-Image-2),標誌其正式進軍自有 AI 模型開發市場,直接與 OpenAI 及 Google 競爭。
OpenAI 意外關閉了其 AI 影片生成工具 Sora,距離其公開發布僅六個月。此舉引發業界對企業轉型戰略與 AI 影片產業法律合規性挑戰的廣泛關注。
Suno 發布 v5.5 模型,強化使用者對音樂生成過程的控制力。同時,AI 生成內容在社群平台的標示與透明度問題,仍是技術進步過程中需要克服的挑戰。
OpenAI 宣布關閉其強大的影像生成模型 Sora,包含應用程式與 API,此舉據稱影響了與迪士尼的巨額協議,顯示 OpenAI 正將重心轉向商業生產力應用。
GDC 2026 大會充滿了 AI 工具廠商,但實際遊戲應用卻很少,且開發商因使用 AI 資產引起玩家反彈,顯示產業仍處於觀望與調整期。
AI 生成內容在創意產業引發反彈,涉及遊戲美術、小說內容真實性及社群平台上非自願內容的傳播。現有的法規與倫理體系正承受巨大壓力,未來將更看重內容來源的透明度。
出版商因 AI 內容擔憂撤下小說,平台則加強清除性剝削 AI 影像,AI 生成內容的倫理與產權審核面臨轉折點。
英偉達於 GTC 2026 正式發佈下一代 Vera Rubin AI 平台,採用七晶片架構,並獲 OpenAI 與 Meta 等巨頭支持。執行長黃仁勳預測市場需求將達 1 兆美元。此外,英偉達推出 DLSS 5 技術,利用生成式 AI 提升圖形擬真度,標誌著運算與視覺技術的新里程碑。
Google 與 OpenAI 同步更新其 AI 旗艦產品。Google Gemini 現在能跨應用整合 Workspace 數據(Docs, Sheets, Drive),而 ChatGPT 則推出了強大的互動式理科視覺化工具。此外,Google 針對用戶反饋,在 Photos 中加入了停用生成式 AI 搜索的開關。
Google DeepMind 推出 Nano Banana 2 圖像模型,大幅降低企業生成高品質圖表與精確文字的成本,AT&T 案例顯示此類優化可節省 90% 開支。