那么,如何提出好的科学问题?

人工智能时代不会提出好问题的你也许只能和“笨同事”共事_卵白质_这一 AI快讯

这不仅须要具备批驳性思维,而且在信息爆炸、技能快速迭代确当下,更须要科研职员沉得住气、静得下心、坐得了“冷板凳”,坚持对科学理性发问,并且冲要破自我识别真正的好问题,而不是一味地跟随“潮流”。

一项科研成果的主要性,每每在这个课题被提出的第一韶光就已经决定了。
能否提出根本性的好问题,是区分精良科学家与伟大科学家的分水岭。
比如,数学上著名的“哥德巴赫猜想”,引领了一代代科学家勤学不辍地追寻答案,而在1742年提出这个猜想的哥德巴赫显然是伟大的数学家。

以是,做科学研究,会提问题、提好问题是开端、也是根本。

提问能力,将成为每个人必备的能力

科学的发展,正匆匆使提问能力成为每个人必须具备的能力。
从科研来看,毋庸置疑,提出好的科学问题是创新的根本,当下,随着学科之间的界线越来越模糊,学科交叉领悟越来越主要——在此背景之下,创造好的科学问题的能力非常主要。

就以我所在的繁芜体系多尺度研究院来说,这一研究院正是多学科交叉领悟的产物。
当代科学研究,本来就要处理繁芜多体系。
在繁芜多体系之下,每每会有尺度的问题产生,简言之,一是韶光尺度,一是空间尺度。
不论是自然科学还是社会科学,都是包含不同韶光尺度和空间尺度的体系,同时每一个体系的韶光尺度和空间尺度又有着强关联。

所谓空间尺度,便是关于大大小小的问题。
就拿我们人体来说,虽然块头不大,却有各种空间尺度的构成身分,比如原子、细胞等。
至于韶光尺度,则是关于快快逐步的问题。
比如,电子的转移;人的寿命也关乎小韶光尺度和大韶光尺度;至于人类的历史,那便是更大韶光尺度和空间尺度的问题了。

由此可见,每一个韶光尺度、每一个空间尺度都会有其故事,而在这样的背景下从事研究,如何在繁芜体系之中探求到打破口,不仅磨练科学家的科研能力,更磨练创造问题、提出问题的能力。

伴随着人工智能技能的发展,长于提出好问题这一能力即便在日常生活中,也变得前所未有的主要。

一个大略的故事,也容许以给大家以启示。
自从ChatGPT出身以来,我们在事情中就开始利用这一新利器了。
我所在的繁芜体系多尺度研究院名誉院长、2013年诺贝尔化学奖得主迈克尔·莱维特可说是利用Chat GPT频率最高的人。
从ChatGPT出身至今短短一年多韶光,他大约已经向ChatGPT提出了4万多个问题,他的结论大致是:ChatGPT最大的特点是你笨它也笨,你聪明它也聪明。
也便是说,它的智能程度取决于你的提问能力。

具备批驳性思维和武断信念,方能提出好问题

青年科学家是未来的希望,历史上许多主要的科学创造都出自年轻人之手。
对付年轻人来说,在决定从事科学研究的那一刻起,就该当明白自己的出发点究竟是什么,是出于对科学的热爱还是为了功利性的目的。
这也是每一个年轻人必须直面的问题。

在一个信息和技能爆炸的时期,做科学研究特殊是根本研究,尤其须要沉得住气、静得下心、坐得了“冷板凳”,这对付年轻人来说并不随意马虎。
在面临着非常困难的科学问题时,有些人很随意马虎陷入迷茫、焦虑,乃至损失了最初的热爱,更不用说真正静下心来去思考、去发问。

也正是基于这样的现实,对年轻的科研职员来说,除了具备批驳性思维之外,还必须具备武断不移的信念,这样才可能提出好问题,实现科研打破。

2005年,澳大利亚科学家巴里·马歇尔和罗宾·沃伦因创造幽门螺旋杆菌及其在胃炎和胃溃疡中的浸染,被付与诺贝尔生理学或医学奖。
这个诺奖背后的故事令人唏嘘。
要知道,他们提出的假设与当时的主流不雅观点完备抵牾,由于未被同事和学术界认可,他们难以得到研究资金和支持,不得不依赖有限的资源进行实验。
为了证明假设,巴里·马歇尔进行了自我实验:他喝下含有幽门螺旋杆菌的培养液,导致急性胃炎,通过抗生素治愈了自己。

这一实验为他们的理论供应了强有力的证据。
他们的研究不仅改变了胃溃疡和胃炎的治疗方法,还对当代医学研究产生了深远的影响。

做科学不是做“网红”,热点问题未必便是好问题

在强调会提问题,努力提出好问题的同时,我们还要特殊指出一点:热点问题未必便是好问题。

就以我的经历而言。
2018年我刚返国时,AlphaFold还没有掀起风浪,但仅仅两年之后,AlphaFold2的涌现瞬间引起了一波打算构造生物学的革命性高潮。
一夜之间,从科学界抵家当界乃至投融资界,都在热烈谈论这一学科领域的变革。
当时乃至有媒体问我,传统的构造生物学家是不是要失落业了。

但实际上,传统生物学家并不会失落业,而是得到了新的赞助工具。
鼓噪之后镇静下来,我和团队也提出了一个问题:AlphaFold2这个新工具真的办理了所有蛋白质构造预测的问题吗?

在热点之外,我们经由深入思虑和多次谈论后,创造蛋白质构造预测问题还远未被真正办理。
举例来说,由于AlphaFold2紧张利用MSA(多序列比对),把蛋白质=构造和生物序列遗传信息整合到深度学习算法中,以是当面对比如孤儿蛋白(找不到其它与其相像的蛋白)这样的蛋白时,该模型就无法生效了。
因此,我在研究组内开始布局对孤儿蛋白的研究,利用深度学习方法来实现真正的端对端高精度构造预测,也便是实现单序列输出构造。

而最近发布的AlphaFold3正好与我们团队的这一思路不谋而合,即弱化MSA对终极预测结果的影响。
这也解释,海内的科学团队在提出问题、探求科研方向的高度上,完备不亚于国际最顶尖团队,并且在部分领域实现了超越。

此外,AlphaFold2和AlphaFold3的一个明显共性问题是:蛋白质的主链预测精度每每优于侧链的预测精度,这也是目前环球的主流进展,即大多研究环绕主链预测精度的提升来展开。
然而就制药等家当领域来说,对侧链构造预测不准的蛋白构造是没有运用代价的。
这是由于,蛋白质的三维立体构造由主链和侧链共同搭建而成,对付自然界中蛋白质所含有的20种氨基酸而言,其主链完备相同,而侧链则完备不同。
但是,区分氨基酸身份及其化学性子紧张依赖侧链而定,而且蛋白质三维空间构造的唯一性也是由氨基酸侧链相互浸染的特异性而确定,更主要的是药物分子紧张的结合工具也是氨基酸侧链,总之,侧链在蛋白质构造中的浸染不言而喻。

在蛋白质构造预测领域,自然就包括了主链构造预测和侧链构造预测两大问题,但两者的预测难度却不尽相同。
蛋白质的主链和侧链构造是相互关联的,一样平常是基于主链的构象来建侧链的构造,但实际上,哪怕是基于高精度的自然主链构象,要准确预测侧链都相称困难。
如果主链不在自然构象上,要用它来建侧链构培养更难。

打个比方。
基于高精度的自然主链构象来建侧链构造,就像站在静止的船甲板上做金鸡独立,站稳很不随意马虎。
如果是基于非自然主链构象来建侧链构造,那等同于在扭捏的船甲板上做金鸡独立,难度更大。
以是说,预测侧链构造是蛋白质构造预测中末了也是最难的环节,做不好这一环,很多事情,包括药物设计都没法完成。
这种精准预测能力还可用于阐明基因点突变、基因小片段突变的机制,为遗传性疾病研究和治疗供应宝贵思路。

针对这一问题,我带领研究组职员开拓了一系列OPUS-Rota侧链建模算法,最新提出的OPUS-Rota5蛋白质侧链建模算法,利用3D卷积神经网络提取每个残基的局部微环境信息,并利用所开拓的RotaFormer进行特色整合,其侧链建模精度远超目前国际上的其他侧链建模算法。

此外,针对AlphaFold2所预测的构造,OPUS-Rota5也可以进一步进行高精度侧链优化。
结果显示,经由OPUSRota5侧链改动后的AlphaFold2预测构象具有更高的分子对接成功率,这一事情将为小分子药物的研发供应强力支撑。

引领方法创新,便是要冲破传统识别关键问题

AlphaFold2、AlphaFold3等蛋白质构造预测算法,紧张预测蛋白质的静态构造,而如何才能看清楚蛋白质的动态构造,则是科学界面临的一个重大寻衅。
我们提出了一个关键问题:我们的研究只能环绕静态构象来研究吗?是否可以考试测验解析动态生物分子构造?尤其是直接从实验数据中抽提构造动态信息。

环绕这一问题,我们在冷冻电镜数据处理上的人工智能算法,不久前取得了打破性的进展。
OPUS-DSD算法被天下顶级科学期刊Nature Methods(《自然-方法》,影响因子47.99)揭橥。

传统的构造测定算法常日假设冷冻电镜数据中只存在一个静态构象,这极大地限定了冷冻电镜的解析精度和运用效果,导致无法准确解析蛋白质的动态变革。
这种方法不仅无法捕捉到蛋白质的真实运动,也影响了研究者对蛋白质功能的深入理解。

我们的提问和研究,冲破了传统思考的框架,直击冷冻电镜技能在解析生物大分子构造时的局限性,也明确指出了蛋白质研究领域中一个极其主要的问题——如何刻画蛋白质构造的动态变革。

大胆的提问,也须要基于实际的研究根本。
实在,我们提出的这个问题,就具有良好的数据根本。
由于冷冻电镜能够天生大量的蛋白质构造快照,为办理这一问题供应了丰富的数据资源。
从这个新的角度出发办理问题,不仅能够提高冷冻电镜的解析精度,还可以重构出生物大分子的动态变革,使得研究者能够更准确地捕捉到生物大分子的真实构造和动态行为。

OPUS-DSD算法通过深度构造解开缠结来提取冷冻电镜数据中的动态信息,显著提升了蛋白质构造测定的精度。
这个创新性办理方案不仅办理了长期存在的技能难题,还为药物设计等运用供应了新的工具和方法,帮助办理药物设计中因目标蛋白构造不准而导致的新药研发失落败问题。

此外,我们还采取分子动力学仿照的方法研究蛋白质动态构造。
在美国,有一家有名的打算机公司,就专门培植了超级打算机Anton,针对蛋白质构造解析这一用场。

我们没有像这家公司那样弘大的资源来做超算机,但可以把眼力放在算法的创新上,算力不敷可以算法来补。
几年以前,我就开始带领团队以分子动力学仿照的方法来研究蛋白质动态构造,在精度上超越了超级打算机Anton。
如今,我们利用研究组内之前所积累的技能,布局将人工智能与分子动力学仿照整合起来。
该项研究连续发展下去,我们可以借助这种动态方法进一步提高蛋白质的构造建模精度。

可以看出,识别关键问题并提出明确的研究方向,在科学研究中至关主要。
这不仅为研究供应了明确的目标和方向,还引发了创新思维,推动了技能进步和实际运用的发展。
科学研究的进步离不开提出问题这一主要环节,正是通过不断提前程争决关键问题,科学家们才能推动学科的发展和技能的进步。

文:马剑鹏(复旦大学繁芜体系多尺度研究院院长)

图:视觉中国