权力归于人民:大语言模型如何改写技术扩散的剧本

变革性技术通常遵循一种自上而下的扩散路径:起源于政府或军方语境,经由公司企业,最终抵达个人——想想电力、密码学、计算机、飞行、互联网或 GPS。这一进程看起来顺理成章:在早期阶段,新而强大的技术通常稀缺、资本密集,且使用它们需要专业的技术专长。
因此,LLM 呈现出对这一模式的戏剧性反转,这在我看来颇为独特而引人注目——它们为普通人带来了不成比例的巨大收益,而在公司和政府中的影响则明显更弱、更滞后。ChatGPT 是历史上增长最快的消费级应用,拥有每周 4 亿活跃用户,他们用它来写作、编程、翻译、辅导、总结、深度研究、头脑风暴等。这不是对既有工具的小幅升级,而是对个体在广泛能力维度上的强力倍增器。而且使用门槛极低——模型便宜(甚至免费)、快速,任何人都可以随时在一个 URL 背后(甚至在本地机器上)按需使用,并且它能用任何人的母语进行交流,包括语气、俚语或表情符号。太疯狂了。据我所知,普通人从未以如此戏剧性的幅度、如此之快地经历过一次技术层面的解锁。
那么,为什么在公司和政府领域里收益要温和得多呢?我认为第一个原因是,LLM 的能力画像非常独特——它们在极其广泛的领域里提供“准专家级”的知识/表现,但同时又浅且易错。换句话说,它们既多才多艺,又浅薄且易犯错。与此同时,组织的独特“超能力”在于把多样化的专业知识集中于一个实体之中:雇用工程师、研究员、分析师、律师、市场等。LLM 当然可以让这些专家个体更高效(例如起草初版法律条款、生成样板代码等),但对组织的改进更多体现为:把原本就会的事情做得更好一些。相较之下,个体通常至多只会在一件事情上是专家,因此 LLM 所提供的广泛“准专业性”从根本上让他们能做以前做不到的事。人们现在可以“vibe code”应用。他们能处理法律文书。他们能吃透晦涩的研究论文。他们能做数据分析。他们能为品牌与市场生成多模态内容。并且他们能以足够的水平完成这一切,而无需再额外拉上一位专家。

其次,组织要处理的,是复杂度和必要协作都高得多的问题,比如:各种系统集成、遗留系统、企业品牌或风格指南、严格的安全协议、隐私考量、国际化、监管合规与法律风险。变量更多、约束更多、考量更多,容错空间更小。把这一切都塞进一个上下文窗口并不容易。你不能就这么“凭感觉”把东西写出来。一次灾难性的幻觉就可能让你丢掉工作。第三,还有大型组织广为人知的惯性:文化、历史先例、在剧烈变革期加剧的政治地盘之争、沟通开销、分布式员工再培训的挑战,以及传统的官僚流程。面对一件崭新、但“多才而浅且易错”的工具时,这些都构成快速采纳的强逆风。我并非有意淡化 LLM 在公司或政府中的影响,但至少就目前、就整个社会的总体而言,它们对个体的改变显著更大于对组织的改变。受益最多的是 Mary、Jim 和 Joe,而不是 Google 或美国政府。
展望未来,LLM 的持续扩散当然取决于性能的持续提升及其能力画像。总体的“收益分布”尤为值得描绘,它在很大程度上取决于性能随资本投入变化的“动态范围”。今天,前沿级 LLM 的性能非常易得且便宜。超过这个点,你不能再通过多花一美元就获得更好的性能、可靠性或自主性。金钱买不到更好的 ChatGPT。Bill Gates 和你一样在和 GPT 4o 对话。但这种状态会一直持续吗?训练时扩展(增加参数、数据)、测试时扩展(增加时间)以及模型集成(增大批量)都是拉大动态范围的力量。另一方面,模型蒸馏(通过模仿大模型来训练出不成比例强的小模型)则在收窄动态范围。可以肯定的是,一旦花钱就能买到显著更强的 ChatGPT,格局就会改变。大组织就能集中庞大的资源购买“更多的智能”。而在“个体”这一类中,精英也可能再次与社会其他人拉开差距:他们的孩子由 GPT‑8‑pro‑max‑high 辅导,你的孩子由 GPT‑6 mini 辅导。
但至少在此刻,我们身处技术史上一个独特且前所未有的时点。如果你回望各种科幻作品,很少有人会预测 AI 革命会是这样的演进路径。它本该是将军们掌控的最高机密“巨脑”工程,而不是一个几乎一夜之间、而且免费的 ChatGPT,出现在每个人口袋里的设备上。还记得 William Gibson 的那句名言 "The future is already here, it's just not evenly distributed" 吗?惊喜——未来已经到来,而且它以令人震惊的方式被广泛分布了。权力归于人民。就我个人而言,我爱这一切。
这篇文章支持社区评论的版本见 X。