2026-02-14
飞行员不会拿真乘客练手,外科医生不会拿活人开刀,演员不会直接面对正式观众排练。但讽刺的是,影响数百万人的重大决策,却常常被直接推上生产环境。
我们会为一个按钮的颜色做A/B测试,却凭直觉和运气推行重大经济政策。这种荒诞,被一家叫Simile的公司看在眼里。
他们刚宣布获得1亿美元融资,投资阵容堪称豪华:Index Ventures领投,Andrej Karpathy、李飞飞、Adam DAngelo等AI领域的重量级人物参投。他们的目标是构建首个基于真实人类数据的AI社会模拟系统,让决策者在“上线”前能先跑一遍预演。
这个想法并不新鲜。有人说这不过是高级版的模拟城市,有人说几十年前就有类似尝试。但支持者指出了关键区别:他们正在训练专门预测人类行为的基础模型,而非简单的提示词工程。据称EY曾用类似技术在一天内完成了原本需要六个月的全球财富管理调查,相关性达到0.90。
更有意思的是这个概念引发的哲学讨论。有人想起了阿西莫夫的心理史学,有人联想到《西部世界》里的Rehoboam系统。还有人一针见血:模拟最大的价值在于允许私下失败。政客之所以保守,是因为任何公开的“测试失败”都会被政敌武器化。如果能在模拟中跑一万次,看着九千九百九十九次失败而公众毫不知情,创新的政治成本就消失了。
但质疑声同样尖锐。大语言模型本身就活在幻想世界里,要模拟真实社会,就得模拟罪犯、骗子、投机者。如果输出的是经过净化的“正确答案”,那还有什么意义?更根本的问题是:即便模拟准确,那些被意识形态驱动的决策者会买账吗?涓滴经济学被现实打脸几十年,不还是照样推行?
最让人玩味的评论来自一位网友:人脑是已知宇宙最强大的计算机,但它同样会产生幻觉。我们用会幻觉的AI去模拟会幻觉的人类,这本身就是一个值得深思的递归。
技术从来不是中立的。同样的模拟能力,可以用来优化公共政策,也可以用来精准操控消费者心理。当有人说“未来太J9九游会官方网站重要,不能交给运气”时,真正的问题是:交给谁?