跳至主要內容
星帆 — Vela
科技前線生醫突破政策解讀成長思維焦點追蹤
設定興趣偏好EN

#LLM

49 篇
A modern, abstract digital art piece showing human hands interacting with a glowing holographic digi
科技前線

AI 代理的崛起:軟體開發流程的變革與挑戰

AI 代理技術正大幅改變軟體開發流程,提升執行效率的同時,也揭露了系統整合與需求定義等新挑戰,企業與開發者正適應這種技術與人為決策的邊界轉變。

JasonJason··2 分鐘閱讀
A cinematic shot of a futuristic AI interface reflecting its own code in a mirror, one reflection sh
科技前線

代理 AI 的「自我修正幻覺」:為何 AI 總能糾正他人,卻無法修正自己?

最新研究指出,AI 存在「自我修正幻覺」,即能發現他人推理錯誤,卻無法修正自身思考。研究強調未來代理 AI 需提升監控與重新規劃能力,而非僅依賴擴大模型規模。

JasonJason··2 分鐘閱讀
A modern, sleek laptop screen showing an AI-generated interface for processing audio and video files
科技前線

Google 發布 Gemma 4 12B:邊緣運算的新里程碑

Google 發布 Gemma 4 12B 模型,這是一款 120 億參數的多模態模型,可在 16GB 記憶體的筆記型電腦上本地運行,推動邊緣運算與隱私保護技術發展。

JasonJason··2 分鐘閱讀
An abstract visual of a high-performance computer chip surrounded by glowing data particles, represe
科技前線

中國新創 MiniMax 發布 M3 模型,以 5-10% 成本挑戰 GPT-5.5

中國新創 MiniMax 發布 M3 大語言模型,以僅 5-10% 的營運成本達到與 GPT-5.5 同等級的表現,對企業市場造成衝擊。

JasonJason··2 分鐘閱讀
Abstract digital representation of an artificial intelligence agent network with nodes and connectio
科技前線

AI 技術新戰線:代理人框架與生成式 AI 的開源浪潮

AI 開發者社群正從 LLM 轉向代理人(Agents)架構與 tokenizer-free 語音技術。美台兩地的 AI 搜尋熱度顯示,美國側重消費軟體應用,台灣則聚焦於 AI 硬體整合與 PC 市場。

JasonJason··2 分鐘閱讀
A futuristic, abstract representation of a complex digital network with glowing, interconnecting nod
科技前線

企業 AI 代理難落地:權限與治理成為技術瓶頸

企業部署 AI 代理的瓶頸並非模型效能,而是既有的權限管理與資料治理體系。企業正面臨從單純測試轉向穩定的「重構時代」,並開始尋求整合性治理框架以解決生產環境中的落地挑戰。

JasonJason··2 分鐘閱讀
A modern, abstract representation of a digital workspace with interlocking circuit patterns and glow
科技前線

AI 代理進入「重建時代」:企業面臨可靠性與權限控管的嚴峻挑戰

企業在部署 AI 代理時面臨重構挑戰,焦點從單純提升模型效能,轉向解決權限控管與系統穩定性等生產瓶頸。

JasonJason··2 分鐘閱讀
A conceptual, high-tech abstract visualization. A complex, glowing web of interconnected nodes (repr
科技前線

人工智慧研究的新挑戰:大型語言模型的因果推理侷限

最新研究指出大型語言模型在因果推理上存在缺陷,隨著問題複雜度增加,模型性能會陷入瓶頸,需透過新型代理人技術突破。

JasonJason··2 分鐘閱讀
A modern, minimalist digital visualization of an AI model architecture diagram on a dark background,
科技前線

DeepSeek 透過激進架構重塑 AI 模型經濟效益

DeepSeek 宣布將其旗艦模型 V4 Pro 的價格永久下調 75%,利用創新架構挑戰矽谷 frontier labs 的高昂模型收費模式。

JasonJason··2 分鐘閱讀
A professional and modern digital illustration representing artificial intelligence and talent movem
科技前線

Andrej Karpathy 轉投 Anthropic,AI 領域格局再洗牌

前 OpenAI 共同創辦人、前 Tesla AI 主管 Andrej Karpathy 宣布加入 Anthropic。這一高層人才流動被視為 AI 前沿研究的一大轉折,預示著 Anthropic 在競爭激烈的 AI 領域中影響力持續擴大。

JasonJason··2 分鐘閱讀
A modern scientific lab environment with a digital screen showing a 'Research integrity' warning ove
科技前線

學術界防線:ArXiv 正式對 AI 生成垃圾論文祭出重罰

學術預印本平台 ArXiv 正式宣布,針對大規模提交由 AI 生成的低品質論文,將對作者實施長達一年的禁令,以維護學術研究的誠信與品質。

JasonJason··2 分鐘閱讀
A complex network of interconnected AI neural nodes, representing a multi-agent system orchestrated
科技前線

企業 AI 新戰場:AI 代理協作與自動化控制平面的崛起

企業 AI 的競爭重點從模型轉向「代理編排」。Fin Operator 與 RecursiveMAS 的出現,代表企業正致力於建立「代理控制平面」,以管理並優化複雜的多代理系統,提升自動化效率。

JasonJason··2 分鐘閱讀
Futuristic AI voice assistant interface, glowing sound waves representing high-performance processin
科技前線

OpenAI 推出全新即時語音模型,帶來 GPT-5 等級推理能力

OpenAI 推出三款整合 GPT-5 等級推理能力的即時語音模型,旨在降低開發者編排語音代理的技術門檻,並賦予 AI 更深刻的對話理解力。

JasonJason··1 分鐘閱讀
An abstract, modern visualization of digital voice waves merging with a neural network node, highlig
科技前線

OpenAI 推出全新即時語音模型,強調更強大的推理能力

OpenAI 推出全新即時語音模型(GPT-Realtime 系列),整合 GPT-5 等級的推理能力,旨在降低開發者維護會話狀態的技術門檻,並賦予語音代理人更強大的跨應用協調執行能力。

JasonJason··2 分鐘閱讀
A modern, sleek corporate data center interface showing an glowing AI agent orchestration dashboard,
科技前線

Anthropic 營收爆發式成長,劍指企業 AI 代理市場

Anthropic 執行長宣布營收年化運作率達 300 億美元,展現 80 倍成長。公司正透過整合記憶與編排功能,向下紮根企業 AI 代理市場。

JasonJason··2 分鐘閱讀
A futuristic voice visualization concept, glowing sound waves turning into interconnected neural net
科技前線

OpenAI 推出全新即時語音模型,實現 GPT-5 等級推理能力

OpenAI 推出新型即時語音模型,具備 GPT-5 等級推理能力,顯著降低語音代理的開發難度,並已在專業測驗中驗證其推理價值。

JasonJason··2 分鐘閱讀
A sophisticated digital visualization of an AI agent ecosystem, showing multiple nodes connected in
科技前線

Anthropic 營收狂飆 80 倍,大舉進軍企業 AI 編排市場

Anthropic 營收飆升至 300 億美元,並推出『Dreaming』與『Outcomes』等編排功能,試圖掌控企業 AI 基礎設施,同時展現出與 OpenAI 在責任法規上的立場差異。

JasonJason··2 分鐘閱讀
A modern, sleek visualization of an AI corporate dashboard on a wall, showing high-growth business g
科技前線

Anthropic 營收爆炸性增長,AI 平台野心引發市場焦慮

Anthropic 宣布營收運行率達到 300 億美元,過去表現出 80 倍的驚人成長。該公司正透過強化 Claude Managed Agents 平台,將記憶、評估與編排功能整合,旨在成為企業 AI 營運中樞,但也引發了關於「平台鎖定」的憂慮。

JasonJason··2 分鐘閱讀
A modern, professional office interior with a digital representation of growth and AI neural network
科技前線

Anthropic 營收爆發式增長:達成 300 億美元運行率

Anthropic 執行長 Dario Amodei 宣布公司營收運行率已達 300 億美元,展現驚人的 80 倍成長。這一成就標誌著其在企業級 AI 市場的領導地位,並正式挑戰 OpenAI 與 Google 的市場份額。

JasonJason··2 分鐘閱讀
A digital illustration of an AI 'conductor' at a podium with multiple data streams flowing like musi
科技前線

Sakana AI 發布 RL Conductor:強化模型調度的未來

Sakana AI 推出「RL Conductor」,透過 7B 參數的輕量模型實現對 GPT-5 與 Claude 等大型模型的動態調度與協作,解決企業 AI 部署成本與效能平衡的問題。

JasonJason··2 分鐘閱讀
A modern, abstract representation of AI neural network efficiency, with light-speed data streams, fu
科技前線

揭秘 Subquadratic:AI 新創聲稱實現效率巨幅突破

邁阿密 AI 新創 Subquadratic 聲稱實現 1,000 倍計算效率提升,旨在解決 Transformer 架構的計算瓶頸。目前該公司尚未提供獨立驗證,科研界對此持高度審慎態度。

JasonJason··2 分鐘閱讀
A futuristic representation of AI data streams transitioning from messy, heavy waves into thin, effi
科技前線

初創公司 Subquadratic 宣稱 AI 運算效率提升 1,000 倍,引發業界廣泛質疑

初創公司 Subquadratic 聲稱其新模型 SubQ 實現了 1,000 倍的 AI 運算效率提升,引發了科學界對其「全子二次方」架構的強烈懷疑,目前該技術尚未經外部驗證。

JasonJason··2 分鐘閱讀
Abstract digital visualization of a large neural network in a professional data center setting. A ce
科技前線

生成式AI邁向企業應用:克服「可靠性鴻溝」成為關鍵課題

企業級AI應用正遭遇「可靠性鴻溝」,生成式AI的隨機性使得傳統單元測試失效,導致「靜默故障」難以偵測,企業正轉向建立專屬的系統行為監控機制。

JasonJason··2 分鐘閱讀
A conceptual visualization of an intricate, glowing network of nodes, with some segments fading and
科技前線

企業級 AI 的靜默危機:上下文衰退與編排漂移

企業級 AI 部署面臨「靜默故障」風險,這類故障無法觸發傳統告警。專家指出,透過應對上下文衰退與編排漂移,並導入系統級評估 framework 是關鍵。

JasonJason··2 分鐘閱讀
A stylized graphic showing a lightweight, efficient gear mechanism outperforming a large, heavy mach
科技前線

DeepSeek-V4 以超高性價比挑戰 AI 模型市場壟斷

DeepSeek 發佈 V4 模型,聲稱以 1/6 的成本達到頂尖效能,此舉展現了 AI 高效模型架構的競爭力,並挑戰由美國巨頭主導的技術門檻與市場壟斷。

JasonJason··2 分鐘閱讀
A minimalist, high-tech conceptual illustration showing a digital structure built with efficient, mo
科技前線

DeepSeek-V4 發布:挑戰 frontier 模型,以六分之一成本達成同級效能

DeepSeek 推出全新旗艦模型 V4,強調以極具競爭力的成本提供接近頂尖 AI 模型的效能,意圖挑戰閉源模型霸權。

JasonJason··2 分鐘閱讀
A clean, modern representation of a digital brain icon optimized with a lightbulb in the center, sig
科技前線

DeepSeek-V4 正式發布,以 1/6 成本挑戰頂尖 AI 模型地位

中國 AI 新創 DeepSeek 發布 V4 模型,以驚人的低成本(約為頂尖模型 1/6)實現接近業界標竿的性能,對全球 AI 定價與算力市場產生顯著影響。

JasonJason··2 分鐘閱讀
Abstract digital design showing a sleek, fast, and optimized AI core processing massive data, vibran
科技前線

DeepSeek-V4 發布預覽:中國 AI 模型挑戰邊界,效能與成本的雙重突破

DeepSeek 發布了最新 V4 模型預覽版,該模型在效能上逼近業界最尖端的邊界模型,但在效率與成本控制上實現了顯著突破,這可能將對全球 AI 模型市場的定價與生態產生結構性影響。

JasonJason··2 分鐘閱讀
A digital representation of a neural network with glowing blue and gold connections, sleek design, s
科技前線

挑戰 GPT-5.5 與 Claude,DeepSeek-V4 模型預覽發布

中國 DeepSeek 發布 V4 模型預覽,強調以競爭對手六分之一的成本實現與頂尖模型相當的智慧能力,在開源 AI 領域引發高度關注。

JasonJason··1 分鐘閱讀
A sophisticated, dark-themed digital workspace with flowing lines of code transforming into glowing
科技前線

OpenAI 推出 GPT-5.5:強化編碼能力,向 AI 超級應用邁進

OpenAI 發布 GPT-5.5 模型,在運算效率與編碼能力上有顯著提升,並在 Terminal-Bench 2.0 測試中險勝 Anthropic 的 Claude Mythos Preview,進一步鞏固市場領先地位。

JasonJason··2 分鐘閱讀
An artistic representation of a complex neural network structure, sleek and modern with soft blue an
科技前線

Anthropic 發布 Claude Opus 4.7,同時擴大倫敦佈局

Anthropic 發布 Claude Opus 4.7,重奪通用 LLM 性能領先地位,同時積極在倫敦擴張辦公空間,並伴隨人事變動與進軍設計工具市場的計畫。

JasonJason··2 分鐘閱讀
A modern, sleek digital interface showing a performance graph comparing AI model metrics, profession
科技前線

Anthropic 發布 Claude Opus 4.7,挑戰 LLM 效能巔峰

Anthropic 發布 Claude Opus 4.7,宣布超越 GPT-5.4 重奪最強 LLM 地位,同時將更強大的 Mythos 模型保留在內部進行資安測試。

JasonJason··1 分鐘閱讀
A modern, minimalist server room in a sleek office building in London, with blue digital light pathw
科技前線

Anthropic 發布 Claude Opus 4.7,重奪大型語言模型性能榜首

Anthropic 推出 Claude Opus 4.7,在基準測試中重奪大模型性能榜首,並計畫在倫敦大規模擴張。

JasonJason··2 分鐘閱讀
A modern, high-tech abstract representation of neural networks in deep blue and purple colors, symbo
科技前線

Anthropic 推出 Claude Opus 4.7,重奪最強大型語言模型寶座

Anthropic 發布了 Claude Opus 4.7,此模型專注於複雜的軟體工程與自動化任務,旨在鞏固該公司在通用 LLM 市場的領導地位。

JasonJason··2 分鐘閱讀
A futuristic glowing abstract representation of an AI neural network, incorporating sparks of light
科技前線

Meta 轉向推出自有 AI 模型 Muse Spark,結束對 Llama 系列依賴

Meta 正式發布全新自有 AI 模型 Muse Spark,源自其重組後的超智能實驗室。此舉標誌著 Meta 策略從開源 Llama 轉向競爭更激烈的商業模型市場,旨在加強代理與編碼性能。

JasonJason··2 分鐘閱讀
A sophisticated digital representation of a glowing neural network structure inside a futuristic, sl
科技前線

Meta 轉向封閉生態,推出全新 AI 模型「Muse Spark」

Meta 宣布推出全新封閉式 AI 模型「Muse Spark」,由其新成立的超級智慧實驗室開發。此舉標誌著 Meta 從過去的開源策略轉向,試圖彌補在代理 AI 和程式開發上的性能劣勢。

JasonJason··2 分鐘閱讀
A futuristic, abstract visualization of a neural network with glowing sparks, symbolizing artificial
科技前線

Meta 全面升級 AI 戰略:Muse Spark 模型挑戰現有格局

Meta 發布首個來自「超級智慧實驗室」的專有 AI 模型 Muse Spark,象徵公司策略轉向封閉創新,挑戰 AI 龍頭地位。

JasonJason··2 分鐘閱讀
A modern, sleek, high-tech abstract representation of a glowing neural network spark, representing A
科技前線

Meta 轉型之作:全新 AI 模型 Muse Spark 正式登場

Meta 成立超級智慧實驗室並推出全新 proprietary 模型 Muse Spark,正式終止對 Llama 系列的過度依賴,旨在透過全面重整 AI 戰略,縮小在代理型 AI 與程式碼系統上的競爭差距。

JasonJason··2 分鐘閱讀
A digital illustration of an open-source coding environment with stylized code fragments glowing in
科技前線

GLM-5.1 開源模型釋出,SWE-Bench 測試數據驚艷業界

中國新創公司 Z.ai 發布開源模型 GLM-5.1,並採用 MIT 許可證。其在 SWE-Bench Pro 測試中展現超越 Opus 4.6 與 GPT-5.4 的潛力,為企業提供高靈活度的 AI 工具。

JasonJason··2 分鐘閱讀
A digital graphic depicting a search bar morphing into a conversational AI chat interface, surrounde
成長思維

答案引擎優化 (AEO) 崛起:LLM 成為數位行銷新戰場

數位流量消費模式正在改變,企業需從 SEO 轉向 AEO(答案引擎優化),透過結構化內容讓 AI 模型選中並引用,以掌握高達 30%-40% 的轉化流量。

JasonJason··2 分鐘閱讀
An artistic representation of a complex, neural network structure glowing with light, set in an open
科技前線

開源 AI 新里程:Zhupai AI 發布 GLM-5.1,性能超越 GPT-5.4

中國新創公司 Zhupai AI 發布 GLM-5.1 開源大型語言模型,採用 MIT 授權。官方數據顯示其性能在技術基準 SWE-Bench Pro 上超越 GPT-5.4 與 Opus 4.6,為開源生態注入新動力。

JasonJason··1 分鐘閱讀
A modern, sleek digital visualization of three distinct AI model interfaces: one showing soundwaves,
科技前線

微軟推出三款自研 AI 模型,正面挑戰 OpenAI 與 Google

微軟發布 MAI-Transcribe-1、MAI-Voice-1 及 MAI-Image-2 三款自研模型,意圖在基礎模型開發上直接競爭。

JasonJason··2 分鐘閱讀
Abstract representation of data being compressed and optimized, futuristic AI architecture design, b
科技前線

Google 推出 TurboQuant AI 記憶體壓縮演算法

Google 推出 TurboQuant AI 記憶體壓縮演算法,宣稱可將 LLM 工作記憶體需求縮減 6 倍並大幅降低營運成本,但目前缺乏獨立學術驗證。

JasonJason··2 分鐘閱讀
A modern coding interface on a computer screen, with a digital map overlay showing a connection betw
科技前線

Cursor 程式設計模型遭踢爆採用 Moonshot AI 技術

AI 程式設計平台 Cursor 承認其最新模型採用 Moonshot AI 的 Kimi 技術,此舉在西方科技界引發了關於地緣政治敏感性與數據安全的廣泛關注。

JasonJason··1 分鐘閱讀
A futuristic high-tech laboratory scene with two glowing central processing units, one labeled with
科技前線

小米與 MiniMax 連袂出擊:國產 AI 模型效能直逼 GPT-5.2,效能與成本雙突破

小米發布了擁有兆級參數的 MiMo-V2-Pro 模型,而 AI 初創公司 MiniMax 則推出了具備自我演進能力的 M2.7。這兩款模型在效能上直逼 GPT-5.2,且調用成本遠低於美國競爭對手。這標誌著中國 AI 技術在 2026 年實現了質的飛躍,並將引發全球 AI 市場的價格戰與技術洗牌。

JasonJason··2 分鐘閱讀
An old, thick Encyclopedia Britannica book being digitized by a glowing mechanical scanner, with the
政策解讀

版權戰爭升級:大英百科全書與韋伯字典起訴 OpenAI 擅自訓練模型

大英百科全書與韋伯字典起訴 OpenAI,指控其 GPT-4 模型未經授權「背誦」並重現了近 10 萬篇版權文章。原告認為 OpenAI 的 AI 已成為其內容的市場替代品,威脅到訂閱制商業模式。此案將成為 AI 平法使用與版權保護之間的重要判例。

JasonJason··3 分鐘閱讀
A detailed technical illustration of a complex clockwork mechanism where some gears are glowing with
科技前線

AI 的「九的進軍」:Andrej Karpathy 揭示為什麼 90% 的可靠性在生產環境等於零

Andrej Karpathy 提出 AI「九的進軍」理論,強調從 90% 到 99.999% 可靠性的工程難度。與此同時,LangChain 執行官與 Google 專家正致力於「支架工程」與持久記憶技術。MIT 的新技術據傳可壓縮 記憶體 50 倍,這些突破正試圖解決 AI 代理從演示轉向生產環境的瓶頸。

JasonJason··2 分鐘閱讀
An abstract digital representation of a data stream being tightly compressed through a glowing geome
科技前線

AI 可靠性進展:MIT 研發 KV 快取壓縮技術,將記憶體消耗大幅降低 50 倍

MIT 研究人員推出名為「Attention Matching」的技術,可將 LLM 的 KV 快取記憶體消耗降低 50 倍而不失準確度。結合 Andrej Karpathy 對 AI 可靠性的觀察,這標誌著 AI 產業正從「功能演示」轉向追求高穩定性與低部署門檻的生產階段。

JasonJason··2 分鐘閱讀
A macro conceptual shot of a glowing microchip with layers of translucent light representing memory
科技前線

AI 效率大突破:新型 KV 快取壓縮技術將 LLM 記憶體需求降低 50 倍

MIT 研究人員發表了 Attention Matching 技術,能將大語言模型的 KV 快取記憶體需求降低 50 倍,且不失精度。同時 Google 開源了基於 Gemini 3.1 的持續性記憶體代理,標誌著 AI 從外部向量資料庫轉向原生記憶體工程。

JasonJason··5 分鐘閱讀