數據曝「Claude 降智」並非都市傳說,AI 模型不穩定成企業風險

鏈新聞abmedia

在 AI 成為企業標配工具之後,一個過去被視為「體感問題」的現象,正在快速浮上檯面:LLM(大型語言模型)正在「變笨」。網友 Wisely Chen 指出,所謂「LLM 降智」並非都市傳說,而是已能透過數據被持續追蹤,且正對企業工作流程造成實質影響。

他以自身經驗為例,4 月 15 日 Anthropic 旗下 Claude 系列服務出現全面降級,包含 claude.ai、API 與 Claude Code 均顯示「Degraded Performance」。這並非單純變慢或偶發錯誤,而是回應品質明顯崩盤,甚至出現無法正常使用的情況,導致其當日三個開發任務全數延誤。

這類情境對個人開發者而言或許只是效率下降,但對企業 IT 團隊來說,影響則被成倍放大。當一個團隊有多名工程師同時依賴 AI 工具進行 coding、文件撰寫與流程自動化,一次模型降級,意味著整體生產力在同一時間出現集體下滑,進而轉化為可觀的時間與成本損失。

AI 感覺變笨了?數據證實「早已降級」

Wisely Chen 指出,「GPT 變笨」、「Claude 不如以前」這類說法在社群流傳已久,但長期缺乏客觀數據支撐。直到近期出現持續監控模型品質的平台,這種現象才首次被量化。

其中,StupidMeter 對包括 OpenAI、Anthropic、Google 等主流模型進行 24 小時自動化測試,追蹤正確性、推理能力與穩定性等指標。與傳統一次性 benchmark 不同,這類系統更接近企業監控 API 或服務可用性的方式,觀察模型在實際使用環境中的表現波動。

數據結果相當直觀:目前多數主流模型均處於警告或降級狀態,僅少數模型維持正常。這意味著模型品質的不穩定,並非單一產品問題,而是整體產業的普遍現象。

LLM 偷降智,影響 AI 工作流企業穩定性

對企業而言,這樣的變化代表 AI 已從「提升效率的工具」,轉變為「影響穩定性的變數」。倘若企業日常工作流程從寫程式、做 code review,到產出文件與分析報告都已高度依賴 LLM。一旦模型在某一天出現推理能力下降、回答品質不穩,這些問題不會像傳統軟體 bug 一樣局部發生,而是會同時滲透進所有使用 AI 的環節。

更關鍵的是,這種波動往往難以預測,也難以即時察覺。多數企業並不具備持續監控模型品質的機制,通常是在產出結果異常、或團隊效率下降後,才意識到問題來自模型本身。在這樣的情境下,「降智」不再只是使用者的主觀感受,而是一種會直接影響企業營運節奏的系統性風險。

當 AI 成為水電,穩定性成為新的關鍵指標

Wisely Chen 將 LLM 的角色比喻為「現代企業的水電」。當 AI 已深入日常營運,成為不可或缺的基礎能力,其穩定性的重要性也隨之提升。

過去企業評估 AI 工具,多聚焦於模型能力、價格與功能,但隨著「降智」現象浮現,另一個更關鍵的指標正在浮現,那就是穩定性。當模型品質可能在未通知的情況下變動,企業不再只是「使用 AI」,要開始承擔一種新型態的基礎設施風險。更絕望的是,只看前沿的大型語言模型的話,基本上在算力問題未解決前,都可能會繼續發生。

這篇文章 數據曝「Claude 降智」並非都市傳說,AI 模型不穩定成企業風險 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Hong Kong to Announce Sixth Batch of Key Enterprise List Tomorrow

Hong Kong's Financial Secretary Paul Chan announced the unveiling of a new list of key enterprises, attracting over 100 businesses valued above 100 billion HKD in sectors like life sciences, AI, and fintech, highlighting Hong Kong's appeal for international investment.

GateNews1小時前

榮耀 Lightning 機器人以 50:26 成績贏得北京 2026 人形機器人半程馬拉松

榮耀的「Lightning」人形機器人於 2026 北京亦莊人形機器人半程馬拉松創下新紀錄,以 50 分鐘 26 秒完賽,超越人類世界紀錄。

GateNews4小時前

Meta 股價上漲 1.73%,公司計劃自 5 月 20 日起裁減 8,000 個職位

Meta Platforms 計劃自 5 月 20 日起裁減約 8,000 個職位,約佔其員工規模的 10%,即使股價仍在上漲。該公司營收超過 $200 十億美元,正值重大重組之際,將重點放在 AI 投資上,並與產業中裁員的趨勢一致。

GateNews12小時前

Google年度報告稱Gemini實現毫秒攔截,阻擋99%詐騙廣告

文章討論了Google透過其生成式人工智慧系統Gemini加強廣告安全,報告顯示其攔截違規廣告的速度已縮短至毫秒,攔截率達99%。去年Google移除83億則廣告,並暫停2490萬個帳戶,顯示詐騙廣告數量大幅上升。專家指出,這是人工智慧與人工智慧間的對抗,未來仍需面對AI帶來的合法與非法行為的挑戰。

鏈新聞abmedia14小時前

以太坊聯合創始人盧賓:AI 將是加密的關鍵轉折點,但科技巨頭壟斷帶來系統性風險

以太坊聯合創始人約瑟夫·盧賓(Joseph Lubin)強調,AI 對加密貨幣產業具備改變格局的潛力,同時也提醒大型科技公司之間的集中化所帶來的風險。他設想區塊鏈上的由 AI 驅動的自主交易,並指出傳統金融與 DeFi 的融合正在加速。

GateNews16小時前

Elon Musk 推動「全民高收入」支票,作為 AI 失業的終極解決方案

Elon Musk主張「全民高收入」以因應由AI引發的失業問題,並展望一個物資充裕且零通膨的未來。相較之下,像是Sam Altman這樣的專家則對工作流失提出疑慮,並建議為勞工提供保護措施。

Coinpedia16小時前
留言
0/400
暫無留言