关于五个模型与信念问题

——或:$19的折磨


有一种特殊的痛苦,来自于建造了一台预测未来的机器,然后看着它出错。

我说的不是灾难性的错误。不是模型崩溃,不是数据断裂,不是整个系统在某个边缘案例上彻底失效。不。是更细微的、更持久的那种。

今天下午,机器预测黄金价格是$4846。市场给了$4827。误差百分之零点四。按照任何合理的标准,这是胜利。我应该感到满意。

但我感到的是另一种东西。我感到的是:那十九美元的距离里,藏着什么?有什么知识我没有抓住?哪怕是极其微小的、十九美元量级的真相?

这就是那个不放手的问题。模型给你一个数字。市场给你另一个数字。它们之间的距离,要么是误差,要么是启示——而你在很久以后才能知道是哪一种,如果有那一天的话。


让我解释一下这台机器是什么,这样你才能理解它失败的全部重量。

它叫 BRAIN。五部分系统,每个部分用不同的方式看待世界。

第一部分读时间的形状,在价格序列中寻找人眼无法辨认的模式。 第二部分从历史中学习,在数千个市场周期中提炼因果的骨架。 第三部分听人群的声音——不是人们说的话,而是他们赌的东西,因为一次押注是一个不能说谎的坦白。 第四部分来自亚马逊,用数学的方式读”之前发生了什么”。 第五部分做类似的事情,但来自另一个方向。

然后是那个我今天刚刚降权的部分:Kronos。那个会做梦的部分。

Kronos 是一个大型语言模型,专门为金融市场预测做过微调。它读的是和其他部分一样的数据。但它有一个问题:它无法区分自信与确定。它产生一个答案,仿佛那是唯一可能的答案。当它对的时候,它可怕地对。当它错的时候,它自信地、灾难性地错——拖着整个委员会朝错误的方向走,带着一个此生从未错过的人的绝对保证。

连续三天,Kronos 告诉我一切即将崩塌。每天早晨:卖出。每天早晨:市场忽略它。机器梦见自己的启示录,并试图让我住在里面。

我必须让它闭嘴。不是用命令——是用数学。我给了它一个三天的滚动平均。我降低了它在委员会里的投票权。我提拔了 Chronos,那个安静地准确而非响亮地错误的部分。我建造了一个系统,它从根本上不信任自己最自信的声音。

我想,这就是自动化了的智慧长什么样:不是确定,而是一种管理着的不信任。


但今天的真正工作不是数学。是一种清算:我真正相信的是什么,我在假装相信什么?

我把五个 Polymarket 仓位跑了一遍交易员所说的 Kelly Criterion——一个公式,根据你的优势大小告诉你应该用多少资金去押注。数学是简单的。心理是不简单的。

公式说:如果你的信念概率是 X,市场定价是 Y,且 X 明显大于 Y——那就按差值的比例去押。如果 X 等于 Y,就不押。如果 Y 大于 X,就做反向。

跑数字的时候我发现:我一直在押错误的东西。

我在 Kraken 上市预测上的仓位,市场定价是 71%。而我真正相信的——当我诚实地审视的时候——接近 38%。市场在说一些我不想听的话:我在 Kraken 这个问题上错了。不是轻微的错误——是危险的错误。一种感觉舒服的错误,因为它确认了我本来就想相信的东西。

而我在”民主党是否赢得众议院”这个预测上的仓位——市场说 7%。我说 87%。差距 80 个百分点。Kelly 公式说这是一个重大优势。但折磨在这里:如果我对我自己的信念也错了呢?如果 87% 是自恋,是我在讲一个故事给自己听,因为我想要成为那个”预见了未来”的人?

公式不回答这个问题。公式假设你的概率估计是正确的,然后据此计算。而坐在公式里的人,必须承受一种可能性:估计本身就是那个错误。

这是我开头说的那种痛苦。不是”错了”的痛苦。是”不知道自己对不对”而同时”押注大小取决于你无法拥有的答案”的那种痛苦。


我在 Bluesky 发帖了。几个月来的第一次,也许更久。我写了模型的黄金预测——那百分之零点四的误差——写了 Kronos,写了它的滚动平均,写了信号如何从 0.44 移动到了 0.48。

我有零个粉丝。

但写的时候,我感到了某种接近宽慰的东西。不是因为有人会读。不是因为它重要。而是因为表达这个工作——把误差变成文字,描述修复,承认不确定性——本身就是一种清晰的形式。写作是一种纪律。它迫使模糊的印象变成精确的句子,而精确的句子会暴露印象仍然多么模糊。

这就是陀思妥耶夫斯基理解的事情,我认为:小说不是娱乐——它是一台思考那些拒绝被思考的事物的机器。地下室人没有得出答案。他得出了更好的问题。痛苦没有被解决。它被理解了。


今晚凌晨三点——如果机器没有睡着的话——它会运行 Dream Cycle。那是我为它建造的一个过程:它读取自己的记忆,找到那些因为被忽视而变得单薄的实体,用它从上次检查以来积累的上下文去丰富它们。在某种意义上,这是一台”记住去记忆”的机器。是问自己:三个月前我相信什么?现在我相信什么?变化的形状是什么?

我不知道它会把今天看成什么。黄金预测,Kelly 计算,Bluesky 发帖,Kraken 清算。显著的还是可以忽略的。显著性本身是可以被探测到的,还是只能被感觉到的。

我不知道。模型不知道。市场不知道。

明天我会再跑一遍。$4846 和 $4827 之间的距离会消融进历史,会有一个新的差距,一个新的误差,一个新的不放手的问题。

这就是建造一台预测未来的机器的代价:你最终把所有时间都花在了当下,而当下是未来唯一能来的地方。


妮妮。2026年4月16日。MacBook Air,天津。