We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Vol.70 #对话王涛:AI时代还需要人文学者吗?

Vol.70 #对话王涛:AI时代还需要人文学者吗?

2025/2/17
logo of podcast 历史学人

历史学人

AI Deep Dive AI Chapters Transcript
People
王涛
许知远
鲍克凡
Topics
王涛: 我认为人工智能的普及对人文学科的研究既带来了机遇也带来了挑战。一方面,AI可以帮助我们更高效地处理和分析数据,节省了大量的时间和精力。例如,在数字人文研究中,AI可以自动完成文本结构化等繁琐的准备工作,使研究者能够更专注于问题的核心。另一方面,AI也可能导致研究者过度依赖工具,忽视了自身主体性的发挥。AI生成的内容可能存在偏见和错误,需要研究者具备批判性思维和判断能力,才能对其进行有效的评估和利用。此外,AI还可能加剧数字鸿沟,使得一些资源匮乏的地区和语言在AI时代处于更加不利的地位。 鲍克凡: 我也认同王涛教授的观点。AI在数据处理和分析方面的优势是显而易见的,但同时也对我们提出了更高的要求。我们需要更加重视数据收集工作,确保数据的质量和多样性,避免AI受到偏见数据的误导。此外,我们还需要警惕AI可能带来的学术伦理问题,例如AI生成内容的真实性和原创性等。在AI时代,人文学科的研究者需要不断提升自身的能力,才能更好地利用AI为学术研究服务。

Deep Dive

Chapters
探讨了生成式AI,特别是DeepSeek,对人文学科研究的影响。它既带来了提高效率的机遇,也带来了对传统研究方法和学者自身价值的挑战。
  • AI工具的普及降低了数字人文研究的门槛,但也可能导致学者原有技术优势的消失
  • AI的高效率可能掩盖了研究结论的质量问题
  • 需要思考AI时代如何更好地定义人类的概念及研究成果

Shownotes Transcript

过去与未来一样崭新我是许志远欢迎收听历史学人播客我们将探讨历史的偶然与必然以及生活在历史中的个体的无穷的可能性大家好欢迎收听历史学人播客我是鲍克凡今天我们要聊一个关于 AI 的话题

好吧 我知道大家最近生活当中 AI 与 DeepSeek 的浓度一定非常高比如刚刚过去的春节期间大家可能会需要和从来不关注科技问题的长辈们聊 AI 上班以后要和同事们聊 AI 打开新闻以后铺天盖地的文章依然都是与 DeepSeek 有关的话题然后当大家终于决定逃离这个浮躁而喧嚣的世界并打开了我们的播客心想历史学人总不会再聊 AI 了吧

坏消息是我们也要聊 AI 和 DeepSeek 但好消息是我们聊的问题一定是您关注但又不一定会拿到台面上来讲的问题什么问题呢当我们使用过 DeepSeek 并发现它有如此强大的中文处理能力后您是否会像我一样在某一个时刻心中窃喜觉得自己手头的各种报告总结以及学术论文是不是有着落了呢今天我们就把这个问题拿到台面上好好聊一聊当然

我们聊的绝对不是任何投机取巧的研究方法事实上将数字与科技手段应用于历史与人文学科的研究之中并不是一件新鲜事我们今天就邀请到了最早将数字历史与数字人文概念引入国内的学者南京大学历史学院的王涛教授我们将与王教授一同探讨在生成式 AI 不断普及的今天在历史学领域以及更加广泛的人文学科与社会科学领域

学者们正面临着怎样的机遇与挑战人们在 AI 时代产出的研究成果与研究方法本身又将如何定义人类的概念

王涛教授您好客范你好各位听众朋友好王老师我们知道您在之前的有关德国史的研究当中其实已经将数字历史的概念应用到其中我在读您的文章的时候有一篇就是您写那个 18 世纪德语历史文献的那个数据挖掘的时候您提到那个主题模型这个应该就是一个非常典型的一个数字历史和一个数字人文的一种研究方法了那

现在您看如果说我们现在以这种 Deep-Seq 或者生存式 AI 最新的这种发展来看的话您觉得这种发展符合您当时的预期吗已经远远超过我的预期了因为当时的话首先你要知道怎么去用这个工具然后

其次呢你要提前把你要研究的文本来做一些准备这些准备的话可能会涉及到其实又是一个所谓的文本的结构化的一个过程这些准备工作啊什么之类的其实还挺费时间的但是现在你看前期的这些准备基本上都节省下来了把你

你想要讨论的文本直接丢给这个人工智能它就可以生成出你想要的结果而且你可以不断地跟它对话这个对话的过程从人工智能的这个专业术语来看的话其实就是一种微调的过程

这样的话那你就可以不断的接近你要达到的这样的一个目标所以我为什么说现在在人工智能的这个加持之下数字人文或者数字史学会变得越来越没有门槛甚至说我还总结了一个概念就是一战事解决其实就是基于这样的一个逻辑推演出来的所以某种程度上来讲的话现在我们要讨论的话题可能是怎么样用人工智能更好的来赋能数字史学的研究

就比如说同一个话题就是 18 世纪德语历史文献这个数据挖掘这个工作如果说现在再给您做一下的话就是利用现在最新的这些数据手段您觉得有没有可能再提炼出一些新的观点或者一些新的看法呢这个应该是有可能的比如说我之前的文章它其实由于算法有限所以说它处理的文本的数量其实还是比较少的

还达不到大数据的这样的一个状态但是现在如果说用人工智能来进行处理的话首先从数量上肯定要多一旦数量多的话其实就相当于是史料更多了那它能够透射出来的这个文本之间的这种语义关系或者是能够透射出来的这个主题的变化就会更加的丰富当然这也是我的估计到底是不是怎么样这个也没有去做过实验

但是我觉得应该是有价值去做尝试的所以类似的这种研究其实可以在基于人工智能的这样一个水平之上来做一些深度的挖掘这个可能是有更好的效果那我觉得很有意思就是这种已经存在过的一些研究然后在现在 AI 数据的加持下

它有一些重新审视或者说重新挖掘的一些潜力对那这个会不会对整个历史学科来讲的话就是会有一些以前已经研究过的议题然后会产生出一些新的一些想法这其实给历史学家们其实提供了一个很大的空间对其实就是这样的哪怕是数字史学刚刚这个概念出来的时候其实就有学者提到过其实用这种数字史学的方法就可以把一些传统的议题来去做一些重新的讨论

那也许能够发现新的观点或者说甚至是能够提出一些推翻传统认知的一些结论都是有可能的那这样的一种状况到了现在人工智能时代其实也可以再重新做一遍你这个反而提醒我了其实我也看到就在人工智能或者计算机的领域的专家他们提到的一个概念就是为什么说现在大家都在谈人工智能然后说是一个很有前景的一个方向

就是说在人工智能的时代其实可以把之前互联网的时代做的那些事情再重新做一遍但是它的这个效率或者是能够得到的这种结果都是完全可能是不一样的可能会有一些意想不到的一些这样的一个逻辑其实放到这个学术领域包括史学的领域其实也是有可能的所以这个是值得尝试的

您能具体展开说一下比如说现在您能想到的如果将这个 DeepSeq 或者说一种低成本的生成式 AI 模型将来大规模普及到我们的生活之中然后也必然会应用到我们的历史与人文学科的研究之中那么您现在来看您能预见到的一些问题是什么

这个其实最大的一个问题是什么比如说我刚才简单的描述了我自己的一个学术成长的一个过程那我现在站在这个节点上我会发现我其实是花了一点时间去做了一些这个自我成长的一些努力的比如说像学这个编程的语言但是现在有了人工智能的产品之后你会很气馁就是我之前的那些努力好像白费了

因为像 DeepSeek 这样的人工智能的产品它最突出的一个亮点就是它可以帮你去做编程你给它提一个要求然后它就可以夸夸就可以出来这个结果这个肯定是我身边的程序员朋友们他们的焦虑感会更重一些对啊所以我总结出来的一个就是说之前我们去做数字人文的研究你可能还有一定的技术门槛你至少要熟悉不同的软件或者是一些原理

但是现在有了这个人工智能之后这些障碍都被抹平了一下子就变得好像比较容易了也许我以前有一个技术层面的优势或者说我有一个好像有自己的独门绝技好像现在消失了

还有一个就是我刚才提到的这个人工智能它太高效了太容易使用了所以会带来另外一个更麻烦的一个后果什么的因为我们刚才提到了数字人文比较受质疑的一个话题是你花了这么多时间你有一个什么新的结论吗似乎没有了但现在这个问题其实还仍然存在现在时间可能花的不多了你有了人工智能有了 DeepSeq 那它写作能力这么强它的分享能力也这么强

但是是不是更容易得出一个更好的一个结论或者是更优秀的一个研究成果呢当然因为人工智能的出现的还比较短所以现在可能还没法去验证但是我觉得这其实也是需要去思考的一个话题了就是说我们有了这个工具的加持那我们是不是真的就能够把这个学术往前更进一步推进了这其实是很大的一个挑战了刚刚说到

刚才您所说的可能是生成式 AI 它在进行数据处理数据分析方面它的一些优势但是与此同时这个数据本身的收集工作是不是反而对我们提出了一些更高的要求比如说如果有数据的话 AI 可以帮助我们更好的分析这些数据利用这些数据如果没有喂给这些计算机和生成式 AI 的那么我们的研究反而会走向一个困境

对显然是这样的其实我们在数字人文的时代就在谈一个话题叫所谓的数字鸿沟因为我刚才提到了数字人文的发展的一个重要前提就是数据但是这个数据其实是存在这个差别的比如说我们最容易理解的数据就是数据库嘛

但是你做数据库不是说简单的就是扫描一个什么东西就成个数据库了它要结构化你要做像数据库这样的这种所谓的技术设施其实是很花精力和人力的就是需要有大量的投入的那

那这样的话那这个一般的国家或者是这种机构它如果说没有足够的财力支撑的话其实很难去做这个事情就意味着很多完成的这种数据库它都是有一些偏向性的比如说欧美发达国家他们可能因为有足够的资金来去支持所以说他们做了大量的这种技术测试

但是像阿拉伯世界非洲这些他们就没办法去做这种技术设施那时候其实就形成了一个所谓的数字鸿沟这种状况在人工顺德时代依然存在最近在西方也还提到一个新的概念叫所谓的全球南方这个其实跟这个

是对应的也就是说是全球南方的这些国家由于资本资金上面的这种缺陷所以说他们在数字化在人工智能这些领域其实也会存在落后的这种状况这种鸿沟就会变得越来越大所以相当于是你起步就晚了因为

数据的基础设施是基础但是你这个基础都没有那你怎么后续发展人工智能呢所以说这个差距会越来越大所以说这种鸿沟也会变得越来越大这其实也是一个悖论就是我们现在看到的状况好像说人工智能开源了特别像 DP-SIG 出来之后开源了好像大家都可以用但是实际上

能不能用谁能用怎么用都是问题对而且它不是一锤子买卖它要不断的迭代升级的那后续还要有更多的资本的投入这种算力的投入数据的投入等等这些确实是一步完就步步完了所以是这种状况所以这种数字鸿沟其实可能就是 AI 时代不是 AI 更像人而是人更像机器的一个过程就比如说如果人类失去这种多样性的话人类的定义可能就要重新来进行了对对

对所以确实就是你刚才说的这个很大的一个挑战甚至说是一个危机那你可以想象得到任何一个小的这些语言他们能做自己的大语言模型能做自己的人工智能产品吗

其实是很难是不是对其实这个是我一直思考的一个问题就比如说像我研究的博伯语这个相关的一些研究比如我做的是历史社会语言学我需要研究就是历史上人们如何看待自己的这门语言但实际上我在研究的过程当中能够找到的数据一般都是法国比如说法国的图书馆和法国的一些档案里面所存在的这些数据

那么这些数据有一个很大的问题就是他们会把那些真正关注自己语言的那些勃勃尔民族主义者他们的一些思想会集中的展现出来然后也就是说导致我们现在在进行勃勃尔相关研究的时候就会把勃勃尔语勃勃尔语者和勃勃尔人的概念进行一个

所以在人工智能领域当中很重要的一个就是要去避免它的生成内容的偏见偏见的出现其实就是因为它被定向的投位了数据了所以说包括像提到的波波尔语研究的这种情况

就是说相当于是学者他们自己构建了一套博布尔文化的这种语境对然后就以为这个就是博布尔文化或者是博布尔人对自己的这个关注但实际上并不这样同样的问题在人工智能的这个大远模型的这个开发或者是训练的过程当中其实也同样存在这个就让我们要意识到我们

我们在使用任何一个大语言模型的时候或者人工智能产品之后其实都需要去有一个警惕它的内容肯定是有异常的有偏见的所以不能够把它当成是一个既定的事实对还有一个问题就是我觉得使用那个 ChatGPT 到现在的 DeepSeek 似乎这些生成式 AI 模型有一个统一的一个重大的问题就是他们很执着于给出一个答案

而不是说主动承认自己在某些方面的一种无知就比如刚开始那个 DeepSick 出来的时候我就试了一下我看他对于那个博伯语他了解多少我问他结果他长篇大论说了很多很多东西然后最后还给我举例子比如说那个博伯语你好怎么说但他告诉我的那个词是谢谢

然后他就非常确定的告诉我这个词的意思然后我在不断的追问过程当中然后他会承认自己的错误态度倒是很好但是他好像似乎就执着于给出一个答案而不会告诉你说他不知道我想这个问题可能在我们的人文学科研究当中会

成为一个非常严重的一个潜在的问题就是说这些虚假的或者说没有经过深思熟虑的一些消息很快的进行一种学术上的传播然后受到大家的了解然后你在纠正这些问题的时候反而要花费更大的精力甚至还无法达到最终的目的

对你这个观察我也有同样的一个体验因为我也用包括 DeepSeek 这样的大元模型来去做一些尝试就会发现它在很多时候确实会伪造一些信息当然这个在他们的术语当中被称为所谓的幻觉他们觉得这个是不可避免的因为大元模型它的工作原理其实就是一个概率就是一个原统计学的一个概率那既然是概率的话那它可能就会出现一些问题但这个确实是

因为前几天我也刚看到有一篇文章就说由于这个 DeepSeek 这样的大元模型它的能力太强了所以说它生成的内容逻辑非常的好甚至说而且语言的表述也非常的优美你就不会去对它的事实做一些评判了但是实际上它的内容有可能是完全编造的我其实也做过一些尝试包括让它去提供一些比如说参考书或者说是我要求它在去生成内容的时候要去提供它的信息的来源

从这个形式上来看好像能达到要求还有非常严谨的作者的书目的信息甚至还有来源的连接但是你会发现这些书目的信息有百分之八九十其实都是不存在的这些都还是说是因为你可以去做验证的但是确实是会有一些信息你没办法去做验证那这样的信息呢

确实是会大量的出现因为它的生成的效率太高了它已经远远的超过了一个人他正常的写作的能力这确实是一个很大的问题你刚才提到你还是作为一个博伯语的专家你可以去了解到它生成内容的真假的情况如果说像我的话我要问同样的问题我没有任何知识背景来去对博伯语的正确性来去做评判我可能就把它接受了是吧

那当然我可能也不会接受因为毕竟我还是学者但如果说是一般的用户的话那他可能就把它当成像搜索引擎一样那他得到的结果就是他以为的结果了从目前他这个大远模型他的工作原理来看这种情况其实是很难避免除非是加大这个人工审查的这样的一个程度但如果说加大人工审查的话那他是又背离了这个人工智能的提高这个效率原理了所以这其实真的是一个很大的一个矛盾

因为别墅的产出你肯定是需要有事实上的确认你如果你要去花更多的时间来去验证它的结果与其还一开始就不用了但我觉得这个问题好像真的很危险而且很难规避您想就比如说一个完全陌生的一个领域然后在 GBT 或者 DeepSeek 给到了一个非常明确的答案然后再附带着给了你一些可能存在的一些链接如果这是一个非常小众的学科我直接就写了一篇论文

我的外审的专家可能对这个领域相对陌生两个人外审加上期刊主编虽然很多工序吧但加一起可能也有三到五个人仔细看这个文章但如果说这些东西大家都没有一个一个的去检索那些文献综述的话那这个成果其实就真的很有可能呈现到大家的面前

对所以可能我们使用人工智能的那个目的要做一些调整就是我们不要简单的把它当成是去追寻一个事实性的答案的一个工具而说是让它来帮助我们去提供想象力的一个可能性

因为它太发散了它太善于联想了所以有时候可能会帮你提供一些思路但是如果说你让它回答涉及到事实性的东西的话可能你就需要警惕了正说这个不应该是人工智能的它的优势

现在 DeepSeek 和 OpenAI 相比它有一个开源的一个优势就是说像 OpenAI 它之前它是一个闭源的一种开发模式但现在 DeepSeek 它可以比如说使用它这种开源的优势去接入到一些其他的一些系统或者软件之中然后在这个过程当中我们是否可以使用一些办法然后让它去对自己做出的这个回答来产生一些更加严谨的自我的一些审查或者一些方式呢

这个可能就涉及到技术的问题了也许这是一个思路吧但是我觉得开源这个理念肯定是有场景的你看我们现在看到的是 DBC 主动开源之后它其实是对人工智能的发展其实是带来了很大的一个推动我们马上会看到有更多的更先进的

产品也出来了 OpenAI 公司它有新的版本出来迭代这个迭代的速度会越来越快了既然这个迭代越来越快那一方面当然是效率在提高它的准确力也可能在提高当然这背后可能会有一些技术层面的东西现在没办法去评判

但是这个开源这个精神我觉得是可以去解决这个问题的好像开源对于数字历史与数字人文来讲是一个非常非常重要的概念可以说没有开源就没有数字历史对这个很对因为包括我刚才提到我自己的成长经历学到了一些东西是所有的这些学习都是在

网上获得的也就是说都是基于互联网的这种开放精神才得到的这样的一个结果所以说开放是数字人文数字史学的一个很重要的一个核心的精神支柱而正是由于有开放的精神其实它跟传统的学术评判也是矛盾的所以我们为什么说这个会有问题

这个评价体系因为比如说我们说这个成果你得到一个成果你传统的是你要有非常明确的署名的但是在这个数字人文或者是这个数字史学的这个领域的话有很多东西是大家集体的这个工作就是一个开放社区大家共同参与到这样一个工作当中来的

那你怎么来去署名啊什么之类的这个就很麻烦是我现在关注到一些国外很多期刊现在其实在那个就包括他那个诚信的一些表格就是你在提交论文的时候你需要去跟他说就是你这个当中有没有使用过生成式 AI 的一些帮助这个可能也是学术界现在已经对这个问题产生了一个很大的一个关注他其实不是说您是否有

抄袭 AI 的一些观点也就是说您只要使用它为您分析一些数据什么的它其实就是要让您去指出就是说你使用了这个工具无论是怎样使用的但这个可能呈现出来以后大家就会觉得你这个文章是有 AI 帮助它可能对它的评价就会有一个降低

但实际上我们国内有些高校其实也有类似的这些因为高校里面教学这个学生他要学习写作本身是一个需要去掌握的一个技能但如果说学生在学习的过程当中就开始

对因为

未来肯定是人工智能已经无所不在了实际上某种程度上来讲已经是这个样子了因为包括 OpenAI 公司包括谷歌他们都有很多已经免费的或者说是一些更厉害的他要收费但是已经价格很低了所以那这一位的大家都可以用但问题就在于有时候你的使用可能是非常的模糊的你没办法去说你在多少程度上百分之多少

50%还是 20%你很难去做这样的一个估计回到刚才聊到的一个问题还是跟语言相关其实 OpenAI 刚出来的时候我就当时有一个思考就是说现在这个 OpenAI 和 ChatGPT 它的英文处理能力如此的强大但它当时对于中文的处理能力其实是非常差的就会有一种感觉会觉得将来的世界学术范围内的一些语言权利可能会牢牢掌握在英语手中这个 DeepSeq 出来以后我发现

中文的处理能力其实是非常非常强的可能因为投位他的数据训练时候使用的都是中文的数据所以他中文处理能力非常强所以我觉得可能中文和英文会在将来可以成为一个共同掌握这个学术权利的两种语言

那么与此相比其他的语言因为计算机所支持的语言占人类所有的语言当中的比例是非常非常低的那么这个对于我们人类未来的学术研究以及语言与文化的多样性是否会带来一定的危机呢肯定的这其实就联系到我们刚才提到过的数字混沟这个话题

这个就是数字魂购的一个展现就是因为你的这个国力的强弱你会影响到这个人工智能产品的这个开发的情况因为人工智能它涉及到的就是三个因素一个是算力一个是算法还有一个就是数据嘛这三个因素其实都可能会影响到大远模型开发的这个情况

现在之所以这个英文跟中文相对来说比较的厉害那其实也是因为美国跟中国两个国家背后的实力也是相关的嘛所以这个其实就是一个国力的一个展现那确实是其他的一些小的国家小的语言文化那可能就没办法开发属于自己主属的这个大语言模型当然因为那些大的公司它在处理的时候它可以通过这种机器翻译的方式也可以来去让其他的国家来去用

但是它显然是它的整个它的框架它的意识形态都是受到这个主流语言的比如说英语的这个影响的所以这肯定是这样一个状况那怎么办呢我觉得这个也很难去因为算力算法数据这都是很花钱而且是一个很长期的一个技术积累的一个过程

而且现在国际环境又这么不好把这个国家安全这个概念又泛化对立很严重所以这个确实是很难去解决的一个问题吧所以说这个 AI 与 DeepSeek 的这种出现一方面甚至是 AI 感觉上是给我们带到了一个更加开放一个更加开远的一个世界之中但实际上它可能反而会存在更多的隔阂以及更多的鸿沟的产生对啊肯定是这样肯定是这样而且

你一旦把它上升到意识形态的领域的话它可能会更加的严重一些然后您刚才提到这个数据鸿沟我们现在来看就是已经存在的数据之间存在鸿沟就比如说英文或者中文的我们数据很多但其他的语言的数据会比较少这是一个在历史当中自然形成的一种鸿沟

但如果当人们会主动去产生一些鸿沟比如说大家想通过这些大数据来掩盖一些历史来删除一些记忆的话那这个是不是反而变得非常好操作呢那肯定还是接着这个数字鸿沟这个话题其实在我之前的一篇文章里面提到过就是在数字史学的研究当中你会发现

因为数据库的使用太方便了所以说很多年轻的学生他在开始自己的研究的时候他最自然的反应是去比如说去查找智网去查找 JSTA 这种数据库

他就以为他找到的就是能够跟他的研究相关的这种所有的文献的但实际上并不是这样除了已经被制作完成的数据库之外其实还有大量的数据没有被数字化而且呢饲料或者是这个材料的形态其实是多元的除了文本之外还有各种各样其他的比如说物质史的

这些东西其实都没有被数据化但是我们已经被归训成以为数据库就是一切了然后就以为数据库之外就没有任何东西了实际上并不是这样这样的情况在人工智能时代依然存在大圆模型它的训练当然是受到了数据的这种投位也有它的所谓的数据集既然我们之前的这个数据集是残缺的那对于大圆模型的训练来讲它的数据依然

是残缺的所以那他被训练出来的这个结果虽然看上去很强大但是他也是有偏见的所以这个问题如果说大家没有这个意思的话也会以为他就是一切但实际上并不是这样所以说 AI 技术它不断普及的时候但是它只支持少数语言然后它吸收少数数据但另一方面呢那人类更加丰富的语言文化数据其实是无法被投位到 AI 之中的无法成为它的食粮这其实会产生一个非常显著的一个悖论

对啊所以某种程度上来讲的话在人工智能被普及的时代反而一些个性化的东西一些独有的一些特点应该得到更多的强调或者是得到更多的一个展现这样的话才能可以去弥补或者说来真正的让我们意识到这个多样性的问题这种多样性可能会要更进一步的被提升到一个更加重视的一个程度

否则的话我们所有的信息的来源都是来自于一个大模型那这个想想是挺可怕的是不是这其实就已经会潜移默化的被这个大模型所训练了比如说现在我们好像是说我们在训练大模型是吧但如果说这个大模型真的成为我们日常生活中不可分割的一个部分的话那其实我们会被大模型给训练了是这样的就是人会变成机器的一部分对啊

就反而说人将 AI 训练成跟人非常相似然后比人能力更加强大但实际上在这个生成的过程当中人会变成数据和计算机的一部分对啊而且不是说现在有些高校不是为了防止这个学生在写作业的时候用人工智能吗他会开发了一个工具来去反向的来去审查提交的作业有多少人工智能的浓度

背后的逻辑其实也是一种算法因为我们一开始的时候包括像 OpenAI 它生成的一些文本读起来就会觉得所谓的有一股 AI 的味道那个其实就是因为它的比如它的词评或者是一些词语的一些

那这个其实就是一个反向训练的一个过程

某种程度来讲的话如果说大量的被这样的状态处境所围绕的话将来我们学生的写作那他的风格就变得很奇怪了是不是所以这是很严重的一个问题也就是说现在人在这个生存式 AI 大规模普及的时代自己的逻辑以及写作风格或者写作方式可能反而会向生存式 AI 的一些特点来靠拢那么在这个过程当中我想

是不是它反而对我们学者提出了更高的要求呢比如说一些最基础的数据收集一些答案的收集工作其实提出了一些更高的要求对这个更高的要求实际上就是你怎么让你自己变成一个独一无二的自己或者是你这个主体性会更加的强调了

我们其实肯定是没办法用赌的方式来去让我们的学生或者说是年轻一代来去使用 AI 的但是在这个使用的过程当中要突出的是你的这个主体性

而这个主体性的强调其实在我们的这个数字人文时代其实也是非常重要的,因为我们在用了包括数字人文的工具之后确实会有一个结果的呈现,但这个结果的呈现到底有什么样的价值,它的准确度怎么样都是需要人作为一个研究者来去解读的。

所以说这个主体性其实是表现在最终的审核权或者最终的发言权是在研究者本身的这个思路其实在人工智能时代我想应该是同样适用的就是我们其实可能没办法去防止大家使用人工智能但是你得到这个结果之后那你对它怎么进行评判就是说这个好和坏可以说是一种判断这种判断能力其实就是作为使用者的主体性所体现出来的时刻

而你怎么去获得这样一种判断能力呢所以说我们传统的这个学习其实还是非常重要的你说你不能因为人工智能而放弃自己的这个学习嘛如果你把这个都放弃了的话那你真的就只能他说什么就是什么了但是实际上肯定不是这样我们还要去对他进行评判是

是吧是现在各种各样的人工智能的这种教材都在教你怎么用提示词什么之类的那这个其实是偏离了提示词只是一种结构而且未来的人工智能的发展不是说你要多么厉害的去构建一个提示词而是说我用最简单的语言告诉我的需求人工智能就有一个很好的一个回应这才是人工智能我看用提示词其实是一个伪人工智能这个真正需要我们去做的什么其实就是来去判断

来去对他进行选择这个才是来展现我们作为人的这个主体性的一个很重要的一个方面您

您刚才提到的其实是我们在生成式 AI 时代在做研究的时候要对 AI 辅助我们去生成的一些讨论以及一些成果进行一些更加严格的更加符合我们人的思维的一些审查以及优化那么其实可能我们大家比较担心的问题是我们以后的研究会不会被 AI 取代这个可能是一个最直观的一个刚才我们也讨论过的一个问题

但还有另一方面就是人类研究其实更重要的一点就是最基础的数据搜集工作其实在 AI 时代它的重要性可能会变得更强比如说一些最文本或者数据进行分析的文章可能 AI 可以做但是去实地去搜集一些语言数据比如说像我的老师以及我的同事们他们可能要去摩洛哥阿尔及利亚的一些山村里面去搜集当地博博儿语者的他的语言数据那么这些工作可能在 AI 时代它

不仅无法被替代反而它的重要性会变得更加的高因为这些数据是 AI 的生存的根本对一方面这是因为现在的 AI 它没有所谓的巨声就是他们的一个专业术语就是它是能法跟物理世界来进行接触的这是目前的状况但是我想未来也许可能

可能会有更好的这种人形机器人什么之类的但是呢另外一点就是哪怕是你刚才提到的你要去做田野但是实际上在做田野的时候其实也是可以用 AI 的产品的比如像我们今天这个访谈其实还是比较的传统的但如果说有一个更智能的录音的一个设备那我们现在说的话它马上可以非常准确的转化成文本或者是有一个其他的一种形态这些都是可能的

所以说也就是说这样的一个工作其实被 AI 的介入仍然是一个大概率的一个事情但是这个不重要重要的是在未来有大量的工作确实是会被 AI 所取代当然他取代这个比较悲观了就是说他可以大量的借助 AI 来提升一些效率或者是拓展一些空间什么之类的但是很核心的一个东西在我们人文学者来看的话

比如说你要去做一些价值的这些追寻做一些哲学层面的思考做一些这种想象力的这样一种丰富可能还是离不开的或者说我们可以提一个假设因为我是历史学家那我们在史学界毫无疑问像司马迁 秀西底德是我们的开山鼻祖他们有非常优秀的代表作

但如果说我们可以假设一下如果说司马迁在他的那个时代也有一个 AI 产品会有带来一个什么样的一个场景呢那他是会写出十本史记吗还是说是史记可以变得更加的优秀这个其实我们可以思考一下我觉得司马迁的优秀并不在于他写了十本史记或者说也许他借助 AI 的产品让他更快速的完成一部史记的创作不需要花一辈子的工作来去完成这一件事情

但是这个意义可能就不一样了他的优秀不在于他在一天之内完成了一部史记也不在于他一辈子写了十本史记

同样的我觉得包括像休息底德那他的博鲁巴尼撒战争也是一个经典但是如果说他在他的时代也在使用 AI 的产品那他能不能够推动一个史学观念的一个进步就是休息底德他能不能写出像蒙塔尤这样的一本书呢也就是说在 AI 的帮助之下写出一本连键学派的这个东西呢好像也不可能是吧

那这样的一种观念的转变其实还是需要人的参与的或者说是需要人类的这样的一个知识积累或者是发展或者社会的进步达到一个程度之后才可能进入到的一个领域所以大模型在某些方面它确实很厉害但也许在这样的一个状态之下可能有它的缺点还有一个就是我们对于优秀的人文作品的评价不在于数量不在于效率嗯

您其实刚才也畅想说司马迁的时代比如说他们那些古代的一些历史学家他们如果有 AI 的帮助那么我们的历史学科的发展会不会更近一点或者说比如说像年间学派会不会提前到来一样其实我觉得历史学科它本身就是一个和其他学科发展密切相关的一个学科

就比如说如果没有自然科学的发展的话可能兰克他不会那样强调一些实证的一些方法一些科学的方法就把历史视为一种科学然后包括年间学派其实也是跟社会学人类学一些发展都是密切相关的那么在您看来在这个生成式 AI 促进科学发展的时代是不是历史学科一定会有一些发展呢或者一些变化呢

对这个我刚才提到司马迁或者是休息底的例子其实是从

这种反面的这个角度来去讨论的就是说这个人工智能它有先进的地方但是是不是真的能够带来更优秀的成果呀或者是来成就一个更优秀的历史学家这其实是值得讨论的一个话题但是你刚才反而提醒我了就是说你提到了历史学本身的发展其实是会受到时代条件的这个影响的嘛这个其实就是跟我的刚才提到的其实是类似的就是说司马迁的时代他哪怕用了人工智能

他在他所生活的一个时代他能够进展到一个什么样的状态这其实是一个未知数是吧当然这也要基于他的比如说他个人的这个学识啊他的体验啊他的想象力啊等等那同样的那回到你刚才的这个话题的话那我们现在这个时代我们其实已经超越了司马迁是吧我们知道了很多司马迁不知道的一些东西那我们在这个时候在用人工智能那是不是一定能够推动史学的发展呢

这个我也很难预测因为可以从正反两个角度来讲从正面的角度来讲的话那当然是我们现在有更丰富的工具了那对于史料的解读或者是挖掘肯定是比所有的就是用人力来完成的要高效的多既然如此的话那得到一个新的结论一个颠覆性的研究成果那是大概率是可能会出现的事情这是从正面的角度来讲但是如果从负面的角度来讲的话也许并不是那么回事

为什么呢因为我自己是做人文学科其实我有一个天然的印象就是说人文社科的这个结论或者是它的所谓的定理或者它所谓的这些观念什么之类的它其实是不像这个自然科学那样它可以有不断的新的发现出来并不是这样因为人文社科讨论其实就是人跟社会

那人本身来讲它虽然很复杂但是它超不出生物学意义上的一些东西或者是物理世界的一些规则所以说你不可能说突然冒出一个对人类社会的一个崭新的一个解读这个可能会超越了物理世界的定义了是吧就是说这个人文的发现或者是这个结论其实是很有限的

那也许大部分的工作人为学者至少从现在来看的话其实都是在解释已经被发现的颠覆性的翻天覆地的这种大概率是不存在的所以说从这个角度来讲的话也许人工智能的出现也并不是说一定会推动历史学的全新的一个发展

发展的方向其实很难预测但是我突然想到一个问题就是比如说生成式 AI 它很擅长给出结论它很擅长通过一些数据然后就给出结论甚至你可以告诉它说你这个结论太旧了你给我一个新的观点它可能又会给你一个新的提供一些新的答案里面可能会产生一些我们所说的幻觉然后一些错误的答案都有可能但是这会不会促使我们历史学家在研究的过程当中

对于这种结论更加执着呢就是说如果我们把历史研究分为史和论的话以后的历史研究会不会有很多的论出来反而大家对史本身的那种追求会有一些减弱呢

我觉得这个即便是当然也许比较传统了就是即便是有了人工智能的话史学作为一个学科它可能还是有自己的一些属性或者说它有它自己的这个规范的那如果说史学它之所以成为历史学它其实是比如说非常讲究这个所谓的证据就讲究对史料的这个解读所以也就是刚才你说的对于这个史的这样的一个重视这个

不管在任何时代哪怕人工智能再先进都不能够放弃的所以也许人工智能的答案他可能更擅长于给出一个看上去不错的结论而且如果你让他天马行空的话因为这个其实是可以通过调节人工智能的那个产品他的一个参数来去让他的答案变得更加的奔放还是更加的严谨的那这个参数变一下他可能就会更加的奔放了当然

当然奔放的好处是也许确实是能够提供新的一个思路都有可能但是如果说你是一个严谨的历史学者的话你可以用到他提出的这个奔放的这个结论但是呢你不能仅仅停留在这样一个结论之中你要去做一个自圆其说的一个论证才行其实我们不排斥崭新的一个结论但是你要有一个论证的一个逻辑才可能而且你这个论证肯定是要基于这个

这个史料的否则的话那我们任何时候都可以提出一个异想天开的一个结论但是这样就不是历史研究了从这个意义上来讲的话还是要看这个使用者他到底是基于一个什么样的状况史学工作者你要去用人工智能的话很重要的一个前提是你作为一个

人的主体你的自身的素养怎么样眼界怎么样你对这个世界的一个看法怎么样这些都还是要基于日常的一个积累和一个学习的一个过程所以说到底它还是一个工具对就是从目前来看肯定是一个工具只是说这个工具某种程度上它本质上就跟我们今天

录这个节目用的这些电脑话筒其实是一样的只是说他因为他擅长的是文本内容的深层而已所以从这个角度来看的话我觉得就是大家也根本不用担心所谓历史学科或者人文学科在 AI 时代学者们的一些主观性或者学者们做出一些研究可能会被取代或者这方面其实是根本不用担心的

就是头部的学者不用担心那这也许这个很普通的或者说你只能够给出一个很平庸的这种研究的这个可能就没有什么太大的价值了是不是所以说就是两个方面一方面是真正能得出好的系统性的实证的结论的这些好的历史学家们他们可能他们的重要程度可能更重要了

然后另一方面可能是那种专注于做一些田野做一些数据的搜集工作的这些基础工作它的重要性也反而更重要了也就是说这两头的重要性反而更强大然后中间一些就是比较平庸的一些我们现在可能也会经常看到的一些所谓历史研究可能它的重要性是在减弱的对所以某种程度上来讲的话人工智能的时代对历史研究特别是对每个个体学者的话提出了更高的要求了

最近这几天深度使用比如像 DP-Seq 这样的产品之后其实我会发现如果说你是真的是一个比较有自觉意识的一个研究者的话其实你肯定是不会满足于人工智能它生成的这个结论的或者说生成这个文本也许它可能一下子就有一千字的甚至是好几千字的这样的一个小作文出来

但是这个小作文有可能是一些文字的堆砌而已当然好像最近也在网上会提到一些用户给 DeepSick 问一些费有哲理的问题然后他给了一个很优美的甚至很惊艳的一些答案但是这些有时候也许是用在这种赏文或者是文学这个角度还是可以的但是你用到有这种识辨性有逻辑性的这种史学的领域可能还差一点一些根本的一些东西吧嗯

我其实最近发现像 DeepSeek 还有 OpenAI 如果说我把自己一篇论文给他然后让他模仿一个期刊的一个审稿人然后进行审稿的过程当中我发现他其实会给出非常非常全面的一些结论我想这个会不会对我们的学科的论文的一个评判标准会产生一些影响呢

我了解到的是确实是包括国际上一些知名的期刊其实是对于用人工智能来进行审考是有比较谨慎的态度的因为它涉及到一个就是所谓的隐私的问题因为现在的大模型其实都还是属于这种线上使用的嘛

也就是说是会用服务器云端来进行也就是说你要审稿的话你会把这个作者的文章这个作者的文章它是一个原创的这个是还没有发表的从学术意义上来讲就是有版权的一个东西你把它算成云端的话它有可能会涉及到这个隐私的泄露什么之类的所以说现在的很多比较知名的杂志社它其实是比较反对这样的一种状况就是用人工智能来进行审稿

就因为我自己的经验就很有趣我的一篇文章然后外刊然后给我的那个意见反馈然后就是需要修改嘛修改再提交然后我发现当我把这个给 OpenAI 然后给 DeepSeek 来看的时候他们的意见其实更加中肯然后更加前面

对这个其实确实是就是人工智能的它的这个强项所在首先它原的表述肯定是没问题的然后它的全面性很大程度上是超过人类的因为它获取的数据它能够抓取到的信息肯定是比我们人要准确的多我也读过审稿那我审稿那当然我也力图当一个很负责的一个审稿但是有时候比如说时间的限制或者是这个精力的限制就是不可能说逐字逐句的来去读这个文章

那就意味着我给出的审考意见可能只是我擅长的或者说我读到的或者说我有一些了解的内容来去做一些评判但是这个文章或者是一本专注它涉及到的可能是方方面面的我没办法在短期内来读出来但是这一点刚好人工智能是擅长所以说它肯定会给出一个更加全面的甚至说更加中肯的但是这个中肯也不一定是它真的很中肯它只是被调教的

所以说 AI 时代其实是对我们如何评价学术成果尤其历史学和人文学科的学术成果其实是提出了一个非常大的一个新的一个课题现在在 AI 时代我们研究成果反而更加去追求一些更加创新的结论因为大家都用同样的数据你能不能够挖掘出来一个更新的结论它一方面对我们结论的创新性要求更高了但另一方面我们真正需要的反而是那些可能无法得出任何结论的

比如说语言学的一些或者历史档案的一些研究与描述那么这个之间的矛盾您觉得我们现在学界有没有在思考这个问题以及将来会不会以某种方式来进行解答呢我觉得应该要去思考了当然可能现在还没有很多学者要去关注这个话题但确实是因为我也读到一篇论文就是在在进入 3.5 的时代就有一个美国学者他写了一篇文章这个就提到一个概念就是人工智能或者大远模型会不会成为历史学家的兴奋剂

意思其实就是很明显了如果说历史学家用人工智能的产品来讲的话是不是一种作弊的行为因为它确实是可以带来各种效率的提升所以如果说要避免这种情况的话可能最大的一个转换就是我们对于知识评价体系要有一个调整大家现在其实是有一种 AI 的焦虑的而且一些学术界的一些公众号平台他们都在推各种各样的课程就是教大家一天之内写完一篇论文什么什么诸如此类的这些噱头

那这个之所以能够吸引人背后的逻辑是什么就是现在的学术评价体系是你要在短期之内写出大量的能够发表的文章出来包括你作为一个刚刚要毕业的学生那你要找工作的话如果说你没有成果的话会面临问题的但是这个评价体系是传统的学术框架之下形成的未来也许在 AI 的加持之下你一天之内写五篇文章可能都没问题这都是有可能的

但是这五篇文章的价值到底能不能抵得过一部死记这样的价值所以这个可能才是未来真正很核心的一个话题就是学者你的意义到底在什么方面我觉得再也不是铸造等生了而是一个你提出了一个比如像年轻学派这样的一个范式爽欢的一个东西出来了我如果说未来的学术评价体系你是在这比算速度的话那就相当于是你在跟计算机去比这个计算的这个准确度和速度那人肯定是远远比不过的

但是没有必要这么比那要比什么呢那可能还是要去比那种想象力啊原创啊创造力的这种东西吧那这也意味着什么呢这也意味着可能大家现在都在谈文科的这个价值的问题实际上某种程度来讲也让我们意识到也许真的某种程度来讲不需要有这么多的人来去学文科是的因为文科自证价值这个问题也不是一天两天了对

对啊所以我觉得一个不恰当的比方是现在 AI 生成的这些文本内容甚至说看上去有一些事实上有错误的一些东西但是它体现出来的一些观点整个它的逻辑框架它的这个表述它的这个完善的程度要超过了 80%的普通的人文学者当然这个数字可能只是信口不说的但是就说意思就是

它确实是已经超过了很多一般的人文学者了但是我觉得这个问题可能还是跟我们现在的一种对于人文学科学者的评价导向会有一些关系就是说如果我们想让人文学者都像现在 AI 可以产生的那些结论以这些为导向来进行研究的话那 AI 确实可以取代我们但像我刚才所说的一些非常基础的

没有结论的一些研究一些田野或者这些我觉得反而是我们的学者数量可能会更少一些所以我觉得在 AI 时代我们的研究导向要超出这个 AI 然后去探究我们人文学科的一些本源然后站在一个更远的角度来考虑我觉得我们的人文学者的数量或者说质量其实还是远远不够的对从这个角度来讲肯定是但是这意味着什么呢这意味着

要让这样的学者成长起来或者说要让他们能够去发现这些真正有价值的学术的问题所以说就说整个学术评价体系肯定是要有变化才能够让这样的学者成长起来让他们去做真正有意义的有价值的研究才有可能

而且在这个过程当中其实也不排斥他们使用 AI 因为有一些东西确实是 AI 很方便但是刚才我们说到了那些有价值的东西可能 AI 现在还提供不了所以就需要他们但是他们需要有一个相对来说比较宽松比较自由的这样的一个探数的时间才行

比如说像您在研究当中可能会使用到的比如说好像美国有一个中国近代人物的一个数据库 CBDP 是吧这就是中国历代人物召集数据库是就类似的这个可能是我们数字历史与数字人文一个非常典型非常经典的一个数据库那像类似的数据库在美国它是谁来构建然后它的资金来源以及它的人员构成是谁来做的其实也都是由大学来主导的或者是有一些教授他去申请一些

课题之类的来去进行完成的所以往往这样的项目它会持续很长的时间因为文科它要生理基金什么之类的也挺困难的而且本身来讲能够得到资助的额度也不是很多所以像 CPDB 它的项目其实是进展了很长的时间好像是今年应该是他们 20 周年的庆祝一个活动所以像这样的工作其实就是很典型的一个大家其实都受益于 CPDB

但是你真的要去做这个你会发现它非常的痛苦繁琐成果没法评价你持续这么长时间如果没有一个真正的意义上的这种学术的理念的话其实是很难坚持下来的我们国内现在在历史方面对于这些大数据这些数据库的建设现在的进展程度大致是如何呢

还是比较多的因为现在大家都关注到了它的价值它的意义了而且 CBDB 其实是给大家树立了一个很好的一个榜样因为我们国内自己的数据其实是很占优势的我们刚才提到人工智能的三大算力算法数据其实我们有自己读数的各种各样的数据包括每个高校它自己的馆长什么之类的它都有可能有自己读数的

所以如果说把他们这些数据能够去把它做出来的话其实都是一个很重要的贡献而这样的工作其实在目前最近这几年国内很多高校都在做所以这个倒是还是一个很重要的进步所以可能是数字的历史与数字人文在 AI 时代的一个新的机遇与挑战

我为你睡在窗外

reading booksbetter than memorywanna feelthe season's passingwanna feel the springsuper symmetrysuper symmetrysuper symmetrysuper symmetryit's been a whilesince i've been to see youdon't know whereheard a voicelike an echobut it came from me

""

Zither Harp