生醫突破從語義流暢到可驗證行動:2026年代理人與醫療AI的現實檢閱今日分析154篇論文發現AI正從對話轉向「可驗證代理人」。OpenEarthAgent與KLong展示了地理空間工具調用與長程任務處理的突破。然而醫療AI領域出現「現實檢閱」:雖然專用模型精準度高,但通用MLLM在MediConfusion基準測試與Cobb角計算中表現極差,顯示視覺可靠性仍是瓶頸。此外,AutoNumerics實現了PDE求解器的自主透明設計。Jason·2026年2月20日