最近看新闻,openai已经用内部模型攻克了一个知名数学猜想。
如果ai已经能做最前沿的数学研究,我感觉拿它来做哲学研究似乎也没有原则上的阻碍。
之前我用ai也仅仅只是搜搜文献,提供总结之类的。如果让它自己想点新想法,效果并不理想,最多也只能把你已经有的想法用更清晰的方式表达出来。
但在看过一些别人用ai的经验后,我感觉“ai没产生有价值的哲学观点”大概率只是我用的办法不对。比如最近我看到一个数学博士分享它用ai的方法,就感觉很有价值。
“从我的实践中来看,内部模型并不意味着模型本质上一定有什么不同,可能是预算更高,以及对中间步骤的评价更好。给up主分享我最近的一次由AI给出的数学证明的过程:问题是一个抵达边界的数学,最后AI给出的证明用到了最近半年上arxiv上的一个结果。我直接喂给gpt 5.5 pro的话,我尝试了10次,每一次都无法解决。然而最终,我用gpt 5.5 thinking-xhigh找到了问题的解答。因为我用的是codex这样的agent。我给模型设定了一个【目标】,就是证明或证伪这个问题。然后prompt当中,设定了一系列评价规则,即定义,怎样的中间步骤算是有收益的中间步骤,怎样的中间步骤是负收益。然后要求它用我自己写得一个用于数学证明的agent skill配合上一个写obsidian笔记的skill,把每一轮尝试失败卡住的点,写在我电脑本地的一个markdown文件上。每10轮失败,就总结归纳一下,前面的失败原因是什么,目前已经尝试到了怎样的地步,根据skill和目标prompt的要求,下一步要怎么做。
就这样一共尝试了大概196轮,耗费了6个小时左右,消耗了1200万token最终找到了正确的证明。
我分享这个信息,就是想说,数学表现上能成功的模型未必是更强的模型。如果工程上设置得当的话,模型也能成功。所以如果,一个人对数学的理解足够高,知道如何定义和评价模型在某个主题中搜索的中间步骤的得失,知道如何合理评价当模型用新的表示来重新阐述问题的时候,这种表述是好还是不好。总之能合理设定多个维度的评价标准,模型可能会在几百轮搜索以后给你惊喜。
当然我同意up主说的,公平性问题。比如同样数学理解的人,可能会因为预算不够从而无法借助AI找到想要的结果。(当然这并不是说,所有数学结果都只能通过AI找到,这个论断太强,也没有可信证据)”
我正在想办法看能不能在哲学复制出来。我现在初步的做法是,在codex里创建1个支持者agent,一个反对者agent,它们的最终目标顾名思义就是支持或者驳倒一篇文章。两者完成初步报告后再交由一个综合者agent来评判。我感觉上述经验最重要的点在于“有价值的中间步骤”,也就是说,即使支持者或者反对者没有完成其最终目标,也可以总结出一些有用的东西。比如发现一个隐藏的前提,一个可能的概念区分等等,这些可以为下一轮的思考提供经验。
效果上,感觉有一些提升,但也还不明显。我感觉这也主要是因为我自己还不太会用,codex相关的使用我都是最近才学的。
发这篇帖子就想问问各位对ai的用法,以及对ai做哲学研究的看法,可能的话可以一起交流经验。
(顺便一提,我感觉目前2026.6.1最好的ai是chatgpt pro,100刀订阅其实挺值的,可惜codex用不了,只能在网页上用。Claude贵的要死,订阅了一次就后悔了,codex基本用不完)