历史与AI的距离:聊天机械人在历史学科科研中的应用_人工智能_模子
中文媒体对人工智能的兴趣在2023年达到一个新高度。高档院校同样如此。例如,2023年12月28日,美国罗文大学精彩教授王晴佳受复旦大学西方史学史团队约请作了题为《数字化、人工智能和历史学的未来》的讲座,全面而深入地讲述了人工智能对历史研究的影响,让笔者深受启示。
在刚刚过去的龙年春节期间,OpenAI发布的文本到***转换模型Sora展现的样片又引发了一轮激烈的谈论。无论用户的哀求是刻画当代时尚女性行走在东京商业区的情景,还是仿照淘金热期间的加利福尼亚州的样貌,Sora都能较为准确乃至维妙维肖地实现。OpenAI乃至声称Sora能够理解用户输入的内容在物理天下中的存在办法,这使得以往的AI***天生工具相形见绌。
与此同时,谷歌在大模型信息处理能力的赛道持续发力,推出了Gemini 1.5 Pro。据称它可以处理高达100万个tokens的高下文窗口,差不多对应一小时的***、11小时的音频、超过30,000行代码的代码库或超过700,000字的文本(约即是《伊利亚特》和《奥德赛》的文本量相加再翻一倍)。这些改造表示出人工智能(Artificial Intelligence)的打算能力在不断以惊人的速率提升。《经济学人》杂志在2023年2月初刊载了《人工智能的繁荣:历史的履历》一文,将GPT的涌现和亨利·福特的企业开始利用流水线生产汽车相提并论。易言之,人工智能的繁荣将不仅仅是信息技能领域快速发展的标志。由此而生的新技能、新产品和新做事很快会渗透到人类生活的许多角落,进而催生人类社会的变革。
你与AI的间隔:很近又很远
对付身处高校的学者和学生而言,AI大模型及干系产品快速迭代带来了许多视觉和生理上的冲击。在运用层面上,对付数据科学(Data Science)的研究者和依赖电脑进行大数据剖析的研究者(包括数字人文的研究者)来说,早已熟稔ChatGPT,大模型、机器学习之类的观点,各种剖析工具和代码工具已融入自己核心的事情流,创造出拥有极佳视觉效果的学术成果。不过,更多的师生是利用谈天机器人来处理邮件说话、文章改写、日常报告天生等重复性强的琐事。“艺高人胆大”的“新科技爱好者”则可能在过去一年里体会到了大措辞模型的“致幻术”,如从机器人那里得到了“西南联大的主要创始人之一杨开慧成功参加了位于苏黎世的第七届国际数学家大会并得到了惟一的一枚铜牌”这样的“新知”,其实为痛楚的期末周送来了富有新意的笑料,强化了人工智能谈天机器人仍是“人工智障”的刻板印象。
从学术研究的角度来看,有鉴于中文历史学期刊的论文揭橥周期动辄以年打算,且仍有许多刊物无法给文章配图,要针对正在迅速发展的、媒体形式极为多样的人工智能展开谈论存在相称大的困难。英文的历史学期刊则在ChatGPT面世后不久,便开始通报不同领域学者的洞见。例如,《历史与理论》杂志在2022年12月出版了《数字历史和理论》专刊。个中收录的10篇专论针对人工智能时期下的历史学与历史叙事等宏不雅观主题展开辩论,关注焦点则是史学理论层面的思考。
个中马尼·休斯-沃林顿(Marnie Hughes-Warrington)在有关数字历史和理论的专刊上揭橥的《走向对人工历史创造者的认可》已经提到了AI在历史编纂学中的潜力。他认为,人工智能的历史学运用不仅局限于模拟人类的历史叙事,而是通过结合推理和普遍接管的不雅观点,形成了一种新的历史叙事办法。沃尔夫·坎斯泰纳(Wulf Kansteiner)则在《历史学家的数字愉快剂:历史、影象和历史理论能否人工智能化?》一文中指出,虽然GPT天生的文本无法担保构造上的真实,但史学理论家可以让定制的大型措辞模型编写一系列关于相同事宜的描述性、叙事性和论证性历史,从而探究描述、阐述和论证在历史写作中的精确关系。
上述学者的谈论固然在理论层面颇有建树,但鲜少涉及大型措辞模型产品的详细利用方法和技巧。为数不多的例外是美国林登伍德大学(Lindenwood University)的学者团队在2023年年底在《元宇宙》(Metaverse)上揭橥的论文《数字历史人物复活:以玛丽·西布莉为例的定制ChatGPT案例研究》。该文以林登伍德大学的创始人玛丽·西布莉(Mary Sibley)为实验工具,将她的海量日记内容作为Claude 2.0的演习数据,开拓出一个能够复现西布莉独特语调和不雅观点的谈天机器人,类似于2019年热播日剧《轮到你了》第二季中的AI女主角。这一成果展现了一种新颖的历史研究和互动学习办法,也为学界如何利用数字技能复现拥有海量史料的历史人物供应了启示。
实际上,当下大措辞模型产品的能力已经足够成为高校师生日常课程学习和科研事情的助手,在信息检索、文献阅读、条记管理乃至科研创新等事务中发挥关键浸染。尤其对付环球史的研究者来说,常常须要处理大量涵盖了不同地区、国家和文明间的相互联系与比较的材料和文献。利用AI产品来提高信息检索效率和处理能力,有助于更深入地探索和剖析这些繁芜的历史关系,来提高研究的深度和质量。然而问题在于,如何将AI产品整合到自己的学习或事情流程之中,优化或定制自己的专属机器人,为其增长功能,提升自己的输入和输出效率,也便是利用人工智能来自我赋能,从而更高效地处理繁杂的信息。
绝知此事要躬行:管窥海内大模型产品工具箱
目前大部分人利用大措辞模型产品的办法是直接以自然措辞输入自己的问题到对话框,并等待AI的回答,仿佛在与一位真人助手交谈。这大略的过程中实在蕴含着很多值得学习的工具性知识。在互动中,AI回答的质量与大模型自身能力密切干系,也受到用户发出的提示词(Prompt)内容的主要影响。固然,目前网络上已经存在许多详细的提示词指南,但一份空想的提示词是须要用户自己在反复实践的互动中不断地熬炼出来的,这就哀求用户所处的网络社区中有AI产品知足以下需求:易得到、模型性能好,且有充足社区资源供应辅导。
除了前文提到的ChatGPT和Gemini Pro这两个大模型领域的“当红流量小花”,海内也有不少相称精良的同类产品可供给用。比如月之暗面科技推出的智能谈天机器人(Chat bot)Kimi Chat就有惊艳的长文本处理能力,能够支持长达20万汉字的输入。又如清华系创业公司的智谱AI。用户可以在智谱清言的客户端体验GLM-4支持的“长文档解读”“高等联网”“数据剖析”“AI画图”等多样化功能。尤其,这一开放平台目前向实名认证的新用户免费赠予数百万tokens,对想要进一步探索AI天下的新手十分友好。字节跳动推出的智能体创建平台“扣子”(Coze)同样颇受好评,缘故原由在于能让缺少编程履历的“小白”快速上手制作自己专属的谈天机器人,并利用知识库(Knowledge),插件(Plug-in),事情流(Workflow)等功能增强机器人的性能。
当然,选择哪款大措辞模型产品终极取决于个人的需求或偏好。用户如何通过持续的利用和探索,找到能够融入自身现有事情流的工具,从而有效提升学习和事情效率才是关键。接下来我将以学习第一次天下大战的历史为运用情境,利用Kimi Chat、智谱AI开放平台、“扣子”来大略展示如何利用提示词优化(Prompt Optimization)、知识库、插件来提升模型的回答质量,使之成为历史学的学习与科研助手。
四两拨千斤:人工智能助手的快速优化策略
谈天机器人的回答质量受到模型的数据集和参数影响,目前,许多从事垂直领域大模型开拓的研究者积极运用微调(fine-tuning)技能来演习大措辞模型,使之在特定领域有更好的表现。但大部分非打算机专业的师生并不具备微调所需的算力资源和专业知识,节制这一技能的韶光本钱也足以令人望而生畏。但是,在不改变模型的条件下,从用户开始琢磨自己想问什么,到谈天机器人终极给出回答,中间有许多步骤供应了可优化的空间(如下面的流程图所示的A和D),来尽可能地使机器人的回答贴合用户所期待的答案。换言之,在人机互动中,大措辞模型谈天机器人通过其预演习能力理解用户输入,并可能结合实时检索来相应查询。用户可以做的,则是向机器人更明确表述自己的需求,“教”机器人如何提取某些信息,这每每可以通过系统的“提示词工程”(Prompt Engineering)来实现。而供应知识库或插件,则是为机器人在最终生成回答之前供应额外的信息支持,市情上大部分大措辞模型产品已为缺少编程和机器学习根本的用户供应了此类做事,相信大家可以花费较短的学习韶光来节制干系运用。
以下是三个与第一次天下大战史有关的研究情境中如何利用Chat bot的大略***先容,笔者在这里抛砖引玉,希望能够引发大家的好奇心,客岁夜胆利用这些产品,将自己的聪明才智和人工智能技能结合,探索出学习的新方法,攀登上学术的新高峰。
04:01
情境1: 有关第一次天下大战研究的文献管理(04:01)
03:23
情境2: 对这些文献进行检索和调用,为学术写作做事(03:23)
02:25
情境3: 利用插件来增强信息检索的体验(02:25)
积跬步以至千里:拥抱更具核心竞争力的自己
可以预见的是,在2024年剩余的9个多月里,科技巨子和新秀们将会推出功能更强大的模型和做事更完善的产品,AI行业的发展也将引发持续关注。近日,Anthropic就发布了Claude 3系列大模型,个中功能最强大的模型Opus在各种基准测试中有着优于GPT-4和Gemini 1.0 Ultra的表现,为人工智能领域的火热竞争添上一把新柴。
一方面,"大众年夜众对科技的迅猛发展感到惊喜,但另一方面,网络社区对“通用人工智能(Artificial General Intelligence)掌控天下”“传统行业迅速消亡”和“掉队的人类被机器取代”等假想情景表达了担忧。这份焦虑乃至被用作AI课程发卖的噱头,在短期内造就了“模型未动、卖课先行”的奇不雅观。
事实上,目前通用人工智能仍旧只是一个哲学观点,我们离一个完备具备人类般繁芜认知架构的AI系统的出身还有相称远的间隔。哪怕是引发街头巷尾热议的文生视比年夜模型Sora,也并非很多自媒体所吹捧的“大天下模型”,或是“物理规律的节制者”。其核心事情事理是结合了扩散模型和Transformer架构:扩散模型从初始的噪声出发,逐步细化成所需的***内容;而Transformer架构则卖力连续***帧的处理,确保***中动作的流畅度和自然性。AGI的终极实现,也即是让机器仿照人类的认知过程、理解繁芜的观点和环境,并具备自我学习和自适应的能力,仍是须要多学科领域深度互助办理的难题。
在时期的年夜水中,与其每天刷手机阅读媒体关于人工智能的“爆炸式”宣布,默默做一个技能革命的察看犹豫者,不如积极动手,探索如何利用现有的人工智能产品和做事来增强我们的认知能力,而“谈天”机器人则是我们实现这种“智能放大”(Intelligence Amplification)的主要交互平台。通过上面的大略先容实在已可以看出,它能做到不仅仅是陪人类谈天和进行大略的信息搜索。通过改进提问办法,以及给机器人增加知识库这一类的“小配件”等方法,我们可以用这些智能体来赞助学习,定制学习材料,乃至让它们担当研究助理,承担大略的数据剖析和可视化等事情。
通过利用这种人机协同事情模式,我们能够把重复性较高的事务交由人工智能机器人去自动化处理,从而提升个人知识的接管与输出效率,专注于自身更具创新性的事情。机器人的赞助能够使我们能够深入整合专业知识,扩展研究视野,进而引发创新思维。此外,与谈天机器人的互动也是对我们通用能力的一种磨炼,它帮助我们学会如何更加清晰地“思考”“提问”和“反思”;如何高效整合信息渠道,提高吸收信息的质量;以及如何为自己设计并优化一个高效的自动化事情流程。虽然这些能力在传统的标准化考试中并不是明确的考点,但在学术研究和职场事情中,自主学习探究,提出有效问题,并探求创新打破能力是具有代价的。综上所述,借助人工智能,我们不仅能够提升专业研究能力,还能磨炼通用技能,从而构筑起自身的核心竞争力,以求有效欢迎技能革命的寻衅与机遇。
(本文作者李思玥系paideia.ai提示词工程师,朱联璧系复旦大学历史学系副教授。)
本文系作者个人观点,不代表本站立场,转载请注明出处!