跳到主要内容

第34章:未来方向

我们已经走过了 LLM 的技术全景——从 Transformer 的注意力机制,到预训练与微调,从推理优化到 Agent 系统。现在站在旅程的终点,也是下一段旅程的起点,有必要诚实地面对一个问题:这条路,通向哪里?

本章不会给出预言,而是梳理当下最真实的争议、最活跃的研究方向,以及还没有答案的根本问题。技术预测的墓地里埋满了聪明人的自信断言——我们选择谦逊。


34.1 Scaling Law 的边界与争议

过去五年:一条令人震惊的直线

2020 年,OpenAI 发表的 Scaling Laws 论文(Kaplan et al.)揭示了一个近乎魔法的规律:模型的损失值(loss)随着参数量 NN、数据量 DD、计算量 CC 的增大,以幂律(power law)形式下降:

L(N)(NcN)αNL(N) \approx \left(\frac{N_c}{N}\right)^{\alpha_N}

这意味着在对数坐标下,能力提升是一条直线。顺着这条线走下去——更大的模型、更多的数据、更多的算力——涌现出了 GPT-3、GPT-4、Claude 3、Gemini Ultra。这条直线跨越了多个数量级,依然成立。

2022 年的 Chinchilla 论文(Hoffmann et al.)进一步精确化了这个关系:在给定计算预算 CC 下,模型参数量 NN 和训练数据量 DD 应等比增长才最优:

NoptC0.5,DoptC0.5N_{\text{opt}} \propto C^{0.5}, \quad D_{\text{opt}} \propto C^{0.5}

这意味着早期的 GPT-3 其实是"过大而训练不足"的——应该用更少的参数训练更多的数据。

2024 年开始的疑问

这条线还能走多远?2024 年前后,一个令人不安的问题开始被公开讨论:互联网上的高质量文本数据可能正在耗尽。

估计值因来源而异,但数量级大致是:人类书写的高质量文本(书籍、论文、代码、网页正文)总量约在 101310^{13}101410^{14} token 之间。而 GPT-4 级别的模型已经消耗了约 101310^{13} token 级别的数据。如果 Chinchilla 最优比例成立,下一代更大的模型需要更多数据,但数据池正在见底。

:::warning 这是真实的瓶颈吗? "数据耗尽"的说法需要谨慎对待。它依赖于"高质量数据"的定义,而这个定义本身就是模糊的。此外,同样的数据经过不同的处理方式(去重、过滤、配比),其有效信息量差异很大。 :::

反驳:新的数据来源

反对"数据即将耗尽"的论点同样有力:

合成数据(Synthetic Data):用强模型生成数据来训练弱模型(或下一代更强的模型)。DeepMind 的 AlphaCode 2、Meta 的 Code Llama 系列都大量使用了合成代码数据。但合成数据有一个深层问题:如果模型学习自己生成的数据,会不会陷入"模型坍缩"(model collapse),即逐渐失去多样性?这是尚未完全解决的开放问题。

多模态数据:图像、视频、音频的信息密度远高于纯文本。人类学习不只靠阅读——一段视频包含的物理世界信息,远超同等时长内人类能写出的文字。这个数据维度几乎是无穷的。

推理数据(Reasoning Data):正确的推理轨迹(chain-of-thought traces)是高价值数据。OpenAI 的 o1、DeepSeek-R1 等模型的成功表明,包含"思考过程"的数据比最终答案更有训练价值。

Test-Time Compute:新的 Scaling 维度

2024 年最重要的范式转变之一,是将"算力"从训练时延伸到了推理时(test time)

核心思想很直觉:如果一个问题很难,为什么不让模型想更久?

:::info Test-Time Compute Scaling o1/o3 类模型的关键洞察:通过在推理时进行更多的"思考步骤"(搜索、验证、回溯),模型的能力可以随着推理时间的增加而持续提升——这是一个全新的 Scaling 维度,不依赖于更大的参数量。 :::

这意味着 Scaling 的维度从二维(参数 × 数据)扩展到了三维(参数 × 数据 × 推理时算力)。从竞技编程、数学奥林匹克的评测结果来看,这条曲线同样是幂律的。

当前共识

Scaling 仍然有效,但边际收益的不确定性在增加。这是一个更诚实的表述,而不是"Scaling 已死"或"Scaling 无限有效"。

维度当前状态不确定性
预训练参数量仍有提升空间边际收益是否放缓?
预训练数据量接近天然数据上限合成数据能否填补?
训练计算量受制于芯片供给和能耗硬件创新速度?
推理时计算量快速增长中所有任务都适合慢思考吗?

34.2 长期记忆与持续学习

当前 LLM 的记忆困境

每一次与 LLM 的对话,都像是与一个患有特定记忆障碍的人交谈:他知道所有他学过的事情,但不记得五分钟前你说了什么——一旦会话结束。

更精确地说,LLM 的"记忆"分为两类:

  • 参数记忆(Parametric Memory):编码在模型权重 θ\theta 中,训练结束后固定不变。
  • 上下文记忆(In-Context Memory):存在于当前的 KV cache 中,会话结束即消失。

这带来了一个根本性的限制:模型无法从与用户的交互中持续学习。你告诉 GPT-4 你的名字,下次对话它仍然不认识你。

持续学习的挑战:灾难性遗忘

朴素的解决方案是:每次对话后,用新数据对模型进行微调,不就可以"记住"新内容了?

问题在于一个被称为**灾难性遗忘(Catastrophic Forgetting)**的现象:神经网络在学习新任务时,会剧烈地改变权重,从而覆盖掉旧任务的知识。

形式化地说,假设模型先学任务 T1\mathcal{T}_1,权重为 θ1\theta^*_1,再学任务 T2\mathcal{T}_2,权重变为 θ2\theta^*_2。梯度下降优化 L2(θ)\mathcal{L}_2(\theta) 时,并不知道哪些权重对 T1\mathcal{T}_1 至关重要,因此可能随意改变它们。

持续学习领域有一些缓解方案,如 Elastic Weight Consolidation(EWC),它在损失函数中加入一个正则项,保护重要权重:

L(θ)=L2(θ)+λ2iFi(θiθ1,i)2\mathcal{L}(\theta) = \mathcal{L}_2(\theta) + \frac{\lambda}{2} \sum_i F_i (\theta_i - \theta^*_{1,i})^2

其中 FiF_i 是 Fisher 信息矩阵的对角元素,衡量第 ii 个权重对旧任务的重要程度。但这些方法在 LLM 规模下的有效性仍然有限。

向量数据库作为外部记忆:有用但有局限

目前工程上最实用的解决方案是使用向量数据库(Vector Database)作为外部长期记忆:将历史对话、用户偏好、知识文档嵌入为向量,检索时通过相似度搜索找到相关片段,再放入上下文窗口。

这实际上是一种 RAG(Retrieval-Augmented Generation)的扩展。它有效,但有几个根本局限:

  1. 检索是离散的:只有被检索到的内容才能被使用,而模型权重中的知识是连续、隐式的。
  2. 无法学到新的技能:可以记住"用户喜欢简短回答"这样的事实,但无法学习新的推理模式。
  3. 规模挑战:当记忆条目达到数百万条时,检索延迟和精度都会下降。

研究前沿:在权重中写入动态记忆

更激进的研究方向包括:

  • 记忆层(Memory Layers):在 Transformer 中插入专门的记忆层,其中的键值对可以在推理时动态更新(如 MemGPT、Titans 等工作)。
  • 参数高效的在线学习:只更新极少数参数(如 LoRA adapter),使得在线学习的代价可接受。
  • 神经图灵机的后继:将外部可寻址存储器与神经网络结合,使模型能显式地"写入"和"读出"记忆。

这是 2025-2026 年最活跃的研究领域之一,但距离生产级的可靠解决方案仍有相当距离。


34.3 AI 安全与对齐前沿

为什么对齐问题在能力增强时变得更难?

RLHF(Reinforcement Learning from Human Feedback)在让模型"有用、无害、诚实"方面取得了显著进展。但随着模型能力的提升,一个令人不安的问题浮现:如果模型比标注人员更聪明,人类还能可靠地评判模型的输出是否"对齐"吗?

OpenAI 在 2023 年提出了**超级对齐(Superalignment)**问题:我们需要在构建超级智能之前,解决如何对齐超级智能的方法论问题——但超级智能还不存在,我们只能用现有工具探索。

他们提出的一个思路是:用强模型来辅助对齐弱模型,再用弱模型的对齐经验推广到更强的模型——即可扩展监督(Scalable Oversight)。但这是否真的有效,目前没有确定答案。

可解释性:打开黑箱

另一条研究路线是机制可解释性(Mechanistic Interpretability):不是问"模型应该做什么",而是问"模型实际上在做什么"。

Anthropic 的研究团队(以及学术界的类似工作)发现,Transformer 的残差流(residual stream)中存在可以解读为具体概念的方向向量。例如,"国王 - 男性 + 女性 ≈ 女王"这类词向量关系,在更深层的模型中也有类似的对应物。

:::tip 电路(Circuits)方法 可解释性研究者尝试找到模型中实现特定行为的"电路"——一个由少数注意力头和 MLP 层组成的子图,专门负责某一推理步骤(如间接宾语识别、模糊引用消解等)。这是一种自下而上理解神经网络的尝试。 :::

但这条路极其艰难:GPT-4 级别的模型有数千亿参数,理解其全部机制在技术上几乎不可能。目前的可解释性研究更像是"理解冰山一角"。

红队测试与安全评估

**红队测试(Red Teaming)**已经从非正式的安全研究演变为系统化的工程实践:专门的团队(或自动化系统)尝试找到模型的有害输出,以便在部署前修复。

自动化红队(使用另一个 LLM 生成攻击性 prompt)大大提高了覆盖广度,但也带来了一个哲学问题:如果攻击模型和防御模型是同一个架构,它能找到它自己找不到的漏洞吗?

治理与监管

2024 年,欧盟 AI Act 正式生效,美国发布了 AI 行政令,中国出台了多项生成式 AI 管理规定。各国正在摸索如何在"不扼杀创新"与"防范风险"之间取得平衡。

技术与法规的协同演化是一个长期过程。对于工程师而言,理解合规要求已经成为 AI 开发的必要技能,而不是可选的附加知识。


34.4 AGI 路线之争

什么是 AGI?这个定义本身就有争议

"人工通用智能"(Artificial General Intelligence,AGI)是 AI 领域最被滥用的词汇之一。不同机构有截然不同的定义:

机构AGI 的定义(简化)
OpenAI在大多数经济上有价值的任务上超过大多数人类
DeepMind能够在新环境中高效学习并完成广泛任务的系统
Anthropic通常不定义 AGI,而聚焦于"可信赖的 AI"
学术界能够像人类一样跨域泛化推理的系统

定义的差异不是学术游戏——它直接影响我们评估"离 AGI 还有多远"的答案。

Scaling 派:继续扩大规模,涌现自然到来

这一派的核心论点是:智能是复杂性的涌现属性。足够大的模型、足够多的数据、足够多的计算,会自然涌现出人类级别的通用推理能力。

支持这一观点的证据:GPT-4 在律师资格考试、医生执照考试、数学奥林匹克等人类智力挑战中已经表现出惊人的竞争力。这些能力并非显式编程,而是从语言预测中涌现出来的。

质疑这一观点的声音:语言能力不等于真正的理解。模型在分布内数据上表现优异,但在真正新颖的问题上常常以意外方式失败("外星数学"问题)。

架构创新派:需要结合符号推理与神经网络

这一派认为,纯粹的神经网络——无论多大——在某些推理类型上有根本性局限,特别是:

  • 系统性泛化:能举一反三,将学到的规则应用到从未见过的组合上
  • 因果推理:区分相关性与因果性
  • 精确计算:不依赖近似记忆,而是执行精确的算法步骤

**神经符号(Neuro-Symbolic)**方法尝试将神经网络的感知能力与符号 AI 的逻辑推理能力结合起来。但这两种范式的融合在技术上极具挑战性——它们的表示方式根本不同。

具身智能派:智能必须与物理世界交互

这一派(在机器人学和认知科学领域有深厚根基)认为,语言是人类智能的表层,真正的智能扎根于与物理世界的感知-行动循环中。

一个孩子学会"苹果是圆的",不只是通过阅读文字,而是通过触摸、抛接、吃苹果。语言是从感知世界中提炼出来的压缩表示,但 LLM 只有压缩,没有原始的感知基础(groundedness)。

这一观点的技术路径是具身 AI(Embodied AI):将 LLM 作为大脑,与物理机器人或仿真环境中的感知-行动系统结合。Google 的 RT-2、Figure 01、Tesla Optimus 等都是这个方向的工程探索。

本书作者的判断

预测未来是傲慢的,但完全回避判断是懦弱的。在诚实地权衡各方证据后,我们的判断是:

LLM 是通向某种更通用智能的重要基础设施,但很可能不是终点。

具体而言:

  1. LLM 的能力边界是真实的:在需要精确算法、因果推理、持续学习的任务上,当前架构有结构性局限,不是靠更大规模就能解决的。

  2. Scaling 还没有结束:Test-time compute、多模态、合成数据等新维度意味着这条曲线还有相当的延伸空间,未来3-5年仍会有令人惊讶的能力涌现。

  3. 架构演化不可避免:最终的通用智能系统可能保留 Transformer 的某些元素,但也会融入记忆、搜索、工具使用、具身感知等模块。

  4. 时间线是未知的:我们拒绝给出"AGI 将在 X 年到来"的预言——这类预言在过去几乎全部失败。智能的演化路径充满非线性的突破和意想不到的障碍。

:::tip 给读者的建议 理解 LLM 的读者,恰恰是最适合在这场技术演变中做出贡献的人。不是因为你能预测未来,而是因为你理解当前技术的边界——而所有创新都从边界开始。 :::


本章小结

主题当前状态核心不确定性
Scaling Law仍然有效,新维度(推理时算力)正在开拓合成数据的上限;边际收益的放缓速度
长期记忆外部向量存储可用,权重级持续学习尚未成熟灾难性遗忘是否有根本性解法?
AI 安全与对齐RLHF 有效,超级对齐是未解问题可扩展监督是否可行?
AGI 路线三大流派并存,无定论架构是否需要根本性革新?

全书的最后一句话

你读完了这本书。此刻你所掌握的,不是关于 AI 的所有知识——那样的书不存在,那样的人也不存在。你掌握的是一张地图:知道什么是已知的,知道什么是争议的,知道什么是还没有答案的。

这已经足够。地图不是领土,但没有地图,你无法探索领土。

去探索吧。