为什么语言模型无法理解现实:从柏拉图的洞穴到全球模型的路径

语言模型通过流利的表达和自信的判断给人留下了深刻印象。但流利地说话并不意味着理解,表达得令人信服也不代表感知到现实。为了理解现代人工智能的根本限制,借鉴一千多年前的哲学思想是非常有益的。柏拉图在其学说中描述了人们被束缚在地下洞穴中,只能看到墙上的影子。这一形象完美反映了大型语言模型的现状。

语言模型的限制:文本代替真实体验

语言模型无法直接感知世界。它们听不到声音、感受不到质地,也无法与对象互动。它们所有的知识都建立在文本数据之上:书籍、文章、帖子、评论、语音转录——这是人类在历史和互联网中自我表达的庞大档案。文本是它们获取信息的唯一渠道。

那么,语言模型对世界了解多少?仅仅是通过人类语言过滤后得到的信息。而人类语言本身并不完美:它反映的不是现实本身,而是对现实的认知——常常是不完整的、偏见的、扭曲的。人们通过自己的信念、无知、文化盲点甚至明显的谎言来描述世界。互联网充满了精彩的思想,也充斥着阴谋论、宣传和虚构。

当我们用文本训练语言模型时,实际上并没有让它们接触到真实世界。我们只提供了它们的映像——柏拉图壁上的影子。这不仅是一个可以修正的缺陷,而是根本的架构缺陷。

为什么扩大规模不能解决根本问题

长期以来,人工智能的发展策略都相信:规模越大,一切问题都能解决。更多数据、更强的模型、更多参数、更密集的计算。但大量的影子并不能转化为对现实的理解。语言模型的训练目标是预测下一个最可能的词。它们能生成看似合理的文本,但无法可靠地识别因果关系或预测行动的实际后果。

因此,幻觉(hallucinations)不是可以通过更新修正的错误,而是基于纯粹语言系统的结构性特性。正如扬·勒坤多次强调的,仅有文本基础不足以创造真正的智能。

向世界模型的转变:未来的架构

研究人员和工程师的关注点正逐渐转向所谓的“世界模型”——那些建立对环境机制内部表征、通过交互学习、能够在行动前模拟结果的系统。世界模型不局限于文本。

它们整合时间序列数据、传感器流、反馈循环、ERP系统信息、表格和模拟结果。它们不再问“下一个词最可能是什么?”,而是解决更强大的问题:“如果我们做这个,会发生什么?”——从统计预测文本转向因果关系建模,这一转变极大地拓展了系统的能力。

现实商业场景中已有的世界模型应用

对企业领导和分析师而言,这不仅是理论争论。世界模型已在一些单纯文本分析难以胜任的领域出现。

物流与供应链管理。 语言模型可以生成故障报告或描述问题,但世界模型可以预测港口关闭、燃料价格上涨或供应商中断对整个供应网络的影响。它们可以在企业投入巨资之前测试不同的方案。

保险与风险管理。 语言模型能帮助解释保险条款,但世界模型能分析风险随时间的发展,模拟极端情况,评估不同场景下的链式损失——这是纯文本系统无法胜任的。

制造与运营。 数字孪生工厂是世界模型的早期体现。它们不仅描述流程,还模拟机器、材料和时间参数的交互,帮助企业预警设备故障、优化产能、虚拟测试变更,而无需实际操作设备。

企业如何准备迈向世界模型的时代

从文本系统向世界模型的转变,提出了一个实际问题:企业如何从现在开始准备?

目前,世界模型仍在实验室和特定应用中发展,理解其原理需要不断试验现有系统。不能在不了解现状的情况下构建未来。

尝试不同的AI方法——从语言模型到更复杂的架构。利用现有工具验证假设。不要拘泥于单一信息源,要保持灵活、勇于探索。这将帮助企业理解变革的机制,迎接已经开始的变革。

从语言模型到未来的混合架构

这并不是呼吁放弃语言模型,而是重新思考它们在整体系统中的角色。

在未来的AI发展中,架构将是:

语言模型成为界面——帮助人与系统沟通的中介。世界模型提供“扎根”——理解世界的真实机制、预测和规划的能力。语言将建立在这些系统之上,而这些系统则以现实为基础进行学习,而非仅仅依赖描述。

正如柏拉图的寓言中,囚徒们不是通过更仔细地观察影子而获得解放,而是当他们转身看到影子的源头,最终走出洞穴,进入真实世界。

AI也正朝着类似的方向迈进。早期意识到这一点的企业,将不再将“令人信服的言辞”误认为是真正的理解。它们会投入资源,构建模拟自身现实的系统——世界模型。这些公司不会只创造会说话的AI,而是真正理解世界运作的AI。

你的企业准备好迎接这一转变了吗?它能构建出自己现实的世界模型吗?

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论