如何用AI研究哲学？

Shio · June 1, 2026, 12:52pm

最近看新闻，openai已经用内部模型攻克了一个知名数学猜想。
如果ai已经能做最前沿的数学研究，我感觉拿它来做哲学研究似乎也没有原则上的阻碍。

之前我用ai也仅仅只是搜搜文献，提供总结之类的。如果让它自己想点新想法，效果并不理想，最多也只能把你已经有的想法用更清晰的方式表达出来。

但在看过一些别人用ai的经验后，我感觉“ai没产生有价值的哲学观点”大概率只是我用的办法不对。比如最近我看到一个数学博士分享它用ai的方法，就感觉很有价值。

“从我的实践中来看，内部模型并不意味着模型本质上一定有什么不同，可能是预算更高，以及对中间步骤的评价更好。给up主分享我最近的一次由AI给出的数学证明的过程：问题是一个抵达边界的数学，最后AI给出的证明用到了最近半年上arxiv上的一个结果。我直接喂给gpt 5.5 pro的话，我尝试了10次，每一次都无法解决。然而最终，我用gpt 5.5 thinking-xhigh找到了问题的解答。因为我用的是codex这样的agent。我给模型设定了一个【目标】，就是证明或证伪这个问题。然后prompt当中，设定了一系列评价规则，即定义，怎样的中间步骤算是有收益的中间步骤，怎样的中间步骤是负收益。然后要求它用我自己写得一个用于数学证明的agent skill配合上一个写obsidian笔记的skill，把每一轮尝试失败卡住的点，写在我电脑本地的一个markdown文件上。每10轮失败，就总结归纳一下，前面的失败原因是什么，目前已经尝试到了怎样的地步，根据skill和目标prompt的要求，下一步要怎么做。
就这样一共尝试了大概196轮，耗费了6个小时左右，消耗了1200万token最终找到了正确的证明。
我分享这个信息，就是想说，数学表现上能成功的模型未必是更强的模型。如果工程上设置得当的话，模型也能成功。所以如果，一个人对数学的理解足够高，知道如何定义和评价模型在某个主题中搜索的中间步骤的得失，知道如何合理评价当模型用新的表示来重新阐述问题的时候，这种表述是好还是不好。总之能合理设定多个维度的评价标准，模型可能会在几百轮搜索以后给你惊喜。
当然我同意up主说的，公平性问题。比如同样数学理解的人，可能会因为预算不够从而无法借助AI找到想要的结果。（当然这并不是说，所有数学结果都只能通过AI找到，这个论断太强，也没有可信证据）”

我正在想办法看能不能在哲学复制出来。我现在初步的做法是，在codex里创建1个支持者agent，一个反对者agent，它们的最终目标顾名思义就是支持或者驳倒一篇文章。两者完成初步报告后再交由一个综合者agent来评判。我感觉上述经验最重要的点在于“有价值的中间步骤”，也就是说，即使支持者或者反对者没有完成其最终目标，也可以总结出一些有用的东西。比如发现一个隐藏的前提，一个可能的概念区分等等，这些可以为下一轮的思考提供经验。
效果上，感觉有一些提升，但也还不明显。我感觉这也主要是因为我自己还不太会用，codex相关的使用我都是最近才学的。

发这篇帖子就想问问各位对ai的用法，以及对ai做哲学研究的看法，可能的话可以一起交流经验。

（顺便一提，我感觉目前2026.6.1最好的ai是chatgpt pro，100刀订阅其实挺值的，可惜codex用不了，只能在网页上用。Claude贵的要死，订阅了一次就后悔了，codex基本用不完）

只是路过 · June 1, 2026, 11:00pm

令人畏惧啊，我的第一反应是把你这段话发给ai，看看它怎么回答。它发给我的回复我认为很有参考价值。确实，我自认为能够参与讨论，但对我来说讨论过程已经先从理解你说的话变成先理解ai说的对你的话的解释。我很愿意认真参与与你的讨论，但我很怀疑，我进行半小时思考，然后你对着我的想法进行思考，远不如你直接对着ai的回复进行思考的效率高，我的想法可能存在的有益之处，比起ai的思考来说才是具有不确定性的。仅以上结论，得出并不是十分困难。以及，当我觉得ai的回复对我大有裨益时，我不得不去主动避免思考那个刷新键背后的可能性。或许你已跨过这个问题？如果你觉得我的这部分想法没有必要，希望你能和我讨论。另附使用ai，为deepseek网页版专家模式深度思考。
https://chat.deepseek.com/share/kaq0eymrrz5u4mxv0e

wiil · June 2, 2026, 2:34pm

你恐怕说反了, 用哲学研究AI,做AI认知治理,才是正确的应用方向;

只是路过 · June 4, 2026, 6:50am

暂且都不能做到人类认知治理，为何要断言做ai认知治理？