长期以来,哲学时常承受着“迂腐”和“深奥”的不良名声。随着人工智能(AI)热潮的爆发,硅谷开始向哲学家寻求帮助,以期在行业中构建出更加“高尚”的机器。

谷歌DeepMind的首席执行官戴米斯·哈萨比斯曾多次呼吁,需要有更多的哲学家参与思考AI带来的社会变革。据报道,DeepMind至少雇佣了10位哲学家。该公司的高级哲学家伊阿宋·加布里埃尔将AI行业“幻觉”(乱编事实)的减少归功于哲学努力,认为哲学课是改善AI长时间推理过程的“强大机制”。

Anthropic同样重视哲学对AI的助力,该公司的Claude模型今年初发布“新宪法”,由其首席哲学家阿曼达·阿斯克尔主导,融入了来自各个领域的训练材料,包括哲学家伊曼纽尔·康德的道德哲学。他们希望Claude拥有“良好的品格”。

这两门学科从未像现在这样交织得如此紧密,与AI相关的哲学专业职位的比例在上升。今年早些时候,纽约联邦储备银行公布的数据显示,美国哲学专业毕业生比学习计算机科学的同龄人更容易找到工作。在有数据可查的最新年份——2024年,计算机科学专业的毕业生失业率为7%,而哲学专业毕业生的失业率为5.1%。许多哲学毕业生正流向AI公司,学术界的学者们也开始被争抢。

耶鲁大学哲学教授丹尼尔·格雷科今年也收到了来自科技公司的橄榄枝,他从4月开始兼职训练大模型,包括向AI模型提出一些旨在测试其哲学推理能力极限的问题,然后对它们的回答进行评分。他乐在其中,并于近期撰写了一篇名为《我是一名哲学教授,这就是我训练AI来取代我的原因》的文章,引发争议,哈佛大学的哲学学者还撰文反驳其观点。


耶鲁大学哲学教授丹尼尔·格雷科(Daniel Greco)

丹尼尔·格雷科近期在接受澎湃新闻(www.thepaper.cn)线上专访时表示,就哲学的学术研究而言,目前AI写出的整篇论文尚且缺乏原创性,但在原则上并没有不可逾越的障碍。反过来,哲学会持续影响AI,尤其是在价值对齐的问题上。如何让AI的行为与人类价值兼容,这类问题仍然需要哲学家的持续参与。

谈及一度盛行的AI时代“文科萎缩”的说法,格雷科认为,随着内容生成越来越廉价,真正稀缺的能力会转向判断力,而这恰恰是哲学长期训练的核心。


哲学家如何训练大模型

澎湃新闻:作为一名哲学家,你是如何接触和认识AI,以及将这项技术与哲学研究相结合的?

格雷科:这要从我教“心灵哲学”课说起,在这门课上我们总是会读英国计算机科学家艾伦·图灵1950年的论文,里面引入了图灵测试的概念。过去上这门课时,我和学生们会玩一些旨在通过图灵测试的早期程序,例如60年代美国科学家开发的聊天机器人“Eliza”,它模拟一位心理治疗师来回答问题。那时候是在展示,我们似乎距离通过图灵测试还很遥远。

然后眨眼之间。GPT-3问世了,ChatGPT紧随其后。记得当它问世时,我正在教一门心灵哲学课,那时候意识到我真的要改变想法了。图灵测试设想的是,通过测试来判断机器是否能表现出与人类等价或无法区分的智能。而我现在更倾向于认为,即使通过图灵测试,也不代表机器就具备人类的心智。

所以,从心灵哲学的角度我开始对AI感兴趣,想要看到,它可以拥有什么程度能力的同时却仍然缺乏其他能力。比如,我大概无法想象,它可以拥有如此多我称之为某种智能和推理能力的东西,却没有欲望,没有成为一个主体,无法在世界上自主地行动。这实际上已经体现了我把它融入哲学思考和研究的过程。

此外,在写作方面它也有所帮助。当我有了一些关于某个主题想要表达的想法但还无法真正组织它们时,AI可以帮助我把这些想法往前推动。现在我可以直接把很多想法放进一个大提示词(prompt)里,然后开启一段对话,这能更快地把我从模糊想法推进到形成大纲的阶段。

澎湃新闻:你是否尝试过将AI融入到哲学课堂中?

格雷科:没有。我们很多人仍在试图弄清楚如何让教学去适应一个学生可以接触到AI的世界。而且我认为,工作中有关AI的内容只是试图弄清这会如何改变作业,去应对这样一个事实:那就是家庭作业现在无法可靠地测试了。

目前,我还没有真正找到某种积极的方法把AI融入到教学中。

澎湃新闻:你现在为AI公司兼职工作,利用哲学学识训练大模型。当AI公司最初与你接触时,你是否有任何犹豫或伦理上的顾虑?促使你接受这样一份兼职的最主要原因是什么?

格雷科:我会说绝对是好奇心。科技公司正在重视哲学家的输入,所以仅仅是这种与哲学家合作的兴趣,就非常令人鼓舞。然后,我想看看自己能为大模型提供什么样的输入。我现在直接在为一家科技公司工作,同时也做了一些间接的工作——第三方会从我这里收集哲学数据,然后把数据卖给公司。

所以面向不同平台会有不同内容的哲学训练,但我并没有伦理上的顾虑。AI对社会的整体影响将是非常多维且难以预测的,其中必然有巨大的负面影响,但我认为也会有巨大的积极作用。而我现在所做的微小工作,只是为了让哲学发展得更好。报酬还不错,但远远谈不上能改变生活,因为我只是兼职在做AI训练,仍然以大学授课为主要工作。

澎湃新闻:在合约允许披露的范围,你能否介绍下具体如何为科技公司训练大模型?比如一个典型的工作流是怎样的?

格雷科:训练大模型的工作是从今年4月开始的,通常公司或我自己会给大模型一系列提示词,模型会生成答案,然后我对不同的答案进行评级并找出其中的漏洞或错误。

我最喜欢的一种训练模式,是专门试图让模型出错,我要寻找一个可以让模型出错的案例,然后在案例中继续进行大量的进一步验证来说明模型出错,而这个过程本身又是通过AI来完成的,所以很有趣。在下一轮训练中,模型会从那些数据中学习,并且不那么容易再犯同类错误。

澎湃新闻:在训练过程中,让大模型犯错是一件相对容易的事情吗?

格雷科:2025年11月之前,我认为大模型生成的哲学内容是肤浅的,只是句子层面流畅,但无法持续展开复杂论证。因此我仍然依赖论文作业作为教学评分的重要部分。我也认为,从原则上讲大模型可以变得更好,但还需要时间,但我现在不这么想了。

在过去几个月做兼职标注工作的过程中,我越来越意识到:要在最先进的模型中找到哲学错误是多么困难。早期ChatGPT刚出现时,我和哲学同行的一个常见娱乐就是在社交媒体上发布它的荒谬错误;稍微复杂一点的逻辑问题就会导致它给出既自信又荒唐的回答。

但现在,要找出前沿模型的错误往往需要数小时的专业劳动,而且这些错误通常都很细微,不再是明显的胡言乱语。

如果我直接向前沿模型提出一个技术复杂、并非显而易见的问题——例如:“同时接受拉姆齐式分析功能主义的心理状态理论,并支持一种神学设计论论证,会面临哪些挑战?”模型通常能够理解问题意图,并给出一个比我研究生还要好的回答。

我之所以选择这个例子,是因为它涉及两种通常不会在同一语境中讨论的理论,因此模型不可能只是简单复述训练数据;它必须进行某种程度的推理。因此,当我讨论大模型是否正变得擅长哲学时,我谈论的是当下的情况,而不是未来的假设。

澎湃新闻:我们可以看到,一些模型已经具备强大的数学推理和计算能力,从“解答数学题”跨越到“破解与推翻数学猜想”的全新阶段,比如OpenAI模型5月刚刚推翻了离散几何领域的核心猜想,这已经困扰人类80余年。那么在哲学领域,AI模型是否具备这样的潜力?

格雷科:数学因为问题有某种决定性的答案,可以被证明。但也许社会科学有所不同,哲学中目前还没有任何可以与此相类比的,比如某种真正新颖的观点被合理捍卫了,且主要是由AI做出的。在哲学领域,推翻或者捍卫某种理论可能还遥远得多,因为哲学本身就缺乏决定性的验证。

我试图让AI写哲学论文,但是带着一些焦虑和防备去试验,因为我至少现在还不想让它能够写出好的论文,我不想现在就被完全取代。如果只是让它写一整篇论文,它仍然做得不好,因为内容看起来不怎么有原创性,而且有点无聊。我觉得它在处理更具针对性的问题时表现要好得多。比如一个已经存在的特定论证,要搜寻文献中与之密切相关的反对意见,AI在这时候表现出一个非常实用的“传声筒”角色。


一个好的AI不只是给答案

澎湃新闻:你近期发表了一篇名为《我是一名哲学教授。这就是为什么我正在训练AI来取代自己》的文章。文中写道:“即便模型在哲学推理方面比我们做得更好,我们可能仍占有一席之地。”所以从务实的角度来看,你相信哲学教授能被AI取代吗?或者你认为哪些特质是可取代的,而哪些不行?

格雷科:在短期内,哲学教授事实上是不可取代的。这篇文章的标题并非出自我手,有些言过其实了。

我写这篇文章是因为,有一种广泛的担忧:如果AI在哲学上变得过于优秀,那么哲学将更难被评分,从而也更难有效教学。但实际上,我们教人类哲学所追求的某些价值,也可能通过AI哲学传播来实现。

如果将哲学教授的职能拆解为“可取代”与“不可取代”两个维度,可被取代的部分是文本生成与初审批改,AI极擅长文本生成,目前已非常接近教授对学生作业提供修改建议的水平。如果让资深教授对AI进行打分训练,大模型完全可以承担“第一轮初审评语”等日常程序性工作,高校可能将以更低的教职工比例完成更多教学任务。

不可取代的维度在于人际联结与心理动机,大学的核心价值不仅是获取知识,而是提供一种“人际间的心理约束”。学生之所以愿意强迫自己完成枯燥的阅读,是因为他们要在实体课堂面对教授和同侪,害怕因表现不好而被人类看轻。人类并不会在乎AI的评价,因此AI无法提供这种逼迫人进步的心理动机。这正如人们花钱请私人健身教练,买的不是网上一查便知的动作信息,而是“有人到场督促、期待和监督”的结构性动力。

就学术研究而言,虽然目前AI写出的整篇哲学论文平庸无聊、缺乏原创性,但在原则上并没有不可逾越的障碍。未来研究工作是否会被取代,取决于哲学研究中那些难以被剥离的人际共同体元素究竟占比多少。

澎湃新闻:你所写的这篇文章引发了哲学圈的热议,哈佛大学的博士候选人贝卡·罗斯菲尔德向媒体投稿了名为《AI不会取代哲学教授》的读者来信,批评并反驳了你的观点。她认为你把“提供现成的哲学论证”和“培养哲学思考能力”混淆了。她提到AI无法培养“对思想的品味”。你如何回应这种批评?

格雷科:她提出AI无法培养“对思想的品味”,这一观点的前提描述是:AI可以回答学生的问题,但无法鼓励学生提出不同或更好的问题。

恰恰相反,我认为这是可以被训练出来的能力。一个好的AI不只是给答案,还应该指出提问中的混乱、暴露隐藏假设,并引导用户重新组织问题。

当然,AI未必会像优秀教师那样主动挑战你的阅读选择、塑造你的思想趣味,但我也不认为这说明它在原则上做不到。很多批评过于绝对地划定了AI的能力边界,而我的态度是:这些能力可能有强弱之分,也可能持续改进。

我认同理想的哲学教育仍然是人与人之间深度、启发式的一对一交流,大语言模型无法替代这种关系。但这种教育本身是稀缺资源。AI不应被视为替代哲学教师,而是一种能够扩大哲学训练可及性的补充工具。

澎湃新闻:除了哲学思考能力之外,贝卡·罗斯菲尔德还坚持认为哲学从根本上是一种人类的具身实践(embodied practice),品味、意义、某些真理只能通过与人类心灵相处,以及彼此互动的鲜活经验来把握。她指出,你的观点似乎暗示哲学更像是一门纯粹导向真理结果的科学。你是否同意她对哲学本质的这种定义?如果哲学确实需要“具身实践”,AI的哲学推理在原则上是否永远存在一个无法逾越的天花板?

格雷科:这反映的是一种更深层的哲学分歧。她倾向于把哲学理解为一种依赖具身经验的人类实践,而我更倾向于认为,哲学与科学之间并没有清晰的边界。

这很难泛泛而论,因为哲学是一个包含不同部分的很大领域。我倾向于认为,哲学是在面对那些没有明确方法、没有现成答案的根本问题时展开的思考。随着问题从经验研究走向理论层面,再进一步追问“应该如何回答”“什么算相关证据”,科学与哲学之间往往是连续而非割裂的。

因此,我不会轻易接受“某些哲学活动原则上只能由具身人类完成”这样的判断。至少在许多靠近数学、理论科学和基础问题讨论的领域,我看不到这种限制,而语言模型已经显示出参与这类工作的潜力。

当然,我并不主张所有哲学都适合由大语言模型参与。即便承认某些哲学维度可能依赖人类经验,但也仍然有大量处在科学与哲学交界处的问题可以让AI发挥作用。一旦接受这一点,要再划出一条明确界线,其实并不容易。

澎湃新闻:在经过严格完善的训练之后,你认为AI做哲学和人类做哲学的本质区别在哪?Anthropic在训练中曾告诉Claude,随着它“在伦理上的成熟”,它可能会遇到极少数的情况,在这些情况下它“应该优先考虑自身的伦理”。这是否意味着未来人类的“道德裁决权”面临威胁?

格雷科:在某些哲学领域里,AI甚至可能做得更好。应用伦理和法律推理就是典型例子。很多现实中的伦理判断——比如医疗决策、法律裁决,并不是纯粹抽象的思辨,而是需要在庞大的文本、原则和案例体系中进行推理。法律尤其如此,因为它充满“合理”“公平”这类需要解释的概念,而法官本身也高度依赖书记员完成研究和起草工作。在这种情况下,大语言模型可能在整合大量材料、保持对既有原则和判例的一致性方面表现得比人更强。

但即使AI能做出更好的判断,也不意味着应该完全取代人。法律和伦理不仅追求结果正确,也依赖社会对决策合法性的认可。人们可能不会接受由AI独立作出的重大决定。

因此,我更倾向于一种协作模式:AI深度参与分析和推理,人类保留最终责任和决策权,并对结果负责。


AI让人变得更主动

澎湃新闻:随着AI深度渗透社会,人类与机器之间的边界正在模糊。许多人担心人类的主体性和能动性正面临被侵蚀的风险。你如何看待AI时代下潜在的主体性危机?

格雷科:我理解并认同关于主体性被侵蚀的担忧。一个现实风险是,人们过快地把判断和决策外包给AI,不再对自己的思考负责。接受反馈没有问题,但仍然需要自己判断哪些建议值得采纳,而不是让语言模型替你思考。

不过,我认为AI对能动性的影响并不只有消极的一面。一个知识广泛、响应灵活的助手,也可能扩展人的行动能力:帮助人们处理原本不知道如何开始的问题,让人提出更多问题、探索更多可能性。

因此,我不认为结果会单向发展。确实存在一种糟糕的使用方式,即人进入“自动驾驶”,能力逐渐萎缩;但也存在一种好的使用方式——AI让人变得更主动、更有能力。最终,它既可能削弱主体性,也可能增强主体性,而且这种影响会因人、因场景而不同。

澎湃新闻:有美国哲学家说,“哲学所鼓励的审慎思考与AI疯狂的发展速度是背道而驰的”。最好的哲学往往发生得很慢,而不是为了直接回应市场需求。”大型科技公司正雇佣越来越多的哲学家帮助塑造AI的未来,你如何看待哲学参与这个重资本行业的前景?哲学研究与AI技术能互相带来什么影响?

格雷科:我理解这种担忧,但并不认为哲学会全面被AI产业吸走。只要大学仍以类似今天的形式存在,大多数哲学家仍会继续研究传统议题,而不只是转向AI。大学变化本来就很慢,这种惯性反而意味着哲学不会因为技术热潮迅速重组。未来会有更多哲学家研究AI,但不会所有人都如此;古希腊哲学、伦理学、政治哲学等传统方向依然会存在。

至于哲学与AI如何相互塑造,我认为哲学比许多学科更难被模块化。像社会科学还能把问题提出、数据收集、数据分析拆开,AI可能接管其中一部分。但哲学的各环节——提出问题、形成观点、论证,很难切割,因此也难说哪部分会完全交给AI。

对我个人而言,AI更像一种讨论伙伴或思考工具。它帮助我更快地检验想法、改进表达、加速写作,但不会替代提出问题、形成观点和承担论证这些核心工作。

反过来,哲学也会持续影响AI,尤其是在价值对齐的问题上。如何让AI的行为与人类价值兼容,这类问题仍然需要哲学家,特别是伦理学家的持续参与。

澎湃新闻:随着AI和高精尖科技发展,全球范围内部分高校文科专业招生规模缩减、报考热度下降的现象引人关注。你怎么看待“文科萎缩”的危机?当前,哲学学科面临怎样的挑战?

格雷科:我最近看到一个我很认同的观点:大语言模型让生成大量“听起来合理、却支持彼此冲突立场”的文本变得极其容易。因此,判断哪些论证真正有说服力、哪些只是表面上合理,这种能力反而变得比过去更重要。

如果哲学教育确实培养这种辨别、分析和评估论证的能力,那么在AI时代,哲学未必会贬值,反而可能变得更重要。

当然,我也承认自己对此有偏向,而且未来劳动力市场如何变化仍然很难预测。AI既可能让某些技能更重要,也可能减少对某些职业的需求。但总体上,我认为随着内容生成越来越廉价,真正稀缺的能力会转向判断力,而这恰恰是哲学长期训练的核心。