#Berkeley

1 篇

GPT-5.5 在柏克萊分校開發的全新「代理人最終考驗」（ALE）基準測試中意外奪冠。此基準測試旨在衡量 AI 模型在真實專業任務中的執行能力，標誌著 AI 產業競爭重心由語言模型轉向代理執行力。

#Berkeley | Vela