当今科学界,人工智能(AI)、机器自动化与化学的结合正开辟新的研究领域。这一跨学科领域的潜力如何?对未来科学发展又会产生怎样的影响?本文根据罗毅教授2024年7月7日在墨子沙龙的演讲“人工智能机器化学家”整理而成。
rame class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_3558867203024994305" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FvbvnzfFFCKmnF52P7dd8qXadBMEuoS70icVhtlCYGk7Gp3DZ7yWjbJx3yzcbNzpQp9JtDxHrib6y0H5xusKIIK6w%2F0%3Fwx_fmt%3Djpeg" allowfullscreen="" frameborder="0" data-ratio="1.7777777777777777" data-w="1920" style="border-radius: 4px;" data-src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3558867203024994305">rame>
化学,作为中心科学,不仅在自然科学中拥有核心地位,更在提升人类生活品质中发挥着关键作用。化学的成就,例如合成氨的发明,极大地提高了粮食产量,延长了人类寿命。此外,化学在药物合成、材料科学,尤其是塑料等领域的应用广泛,同时也在现代显示屏技术中扮演着不可或缺的角色。化学是人类最古老的一门科学,它的历史遵循了人的两个基本的追求——财富和长寿。炼金、炼丹早在我们中国古代就存在了,汉武帝的时候发展到了一个鼎盛时期。炼丹一开始是为了长寿,但是发现效果不好,长寿的人不多,所以后来就变成了要成仙。当时炼的丹颜色十分特别,这些特别的颜色都是因为金属引起的,吃多了之后就会重金属中毒,产生幻觉。所以它是不太成功的一条路,后面就慢慢淡化了。 其实炼丹这种古老的想法,全世界都会产生,古埃及人把它叫做“Alchemy”,意为 “埃及的艺术”。确实从化学的角度来讲,大家一直认为炼丹是个艺术。作为一个主流的科学,“Alchemy”在欧洲统治了1000多年,所以早在物理学之前,化学就已经有上千年的历史了。
大家一般认为,1803年约翰·道尔顿(John Dalton)的《原子理论》这本书的出现是整个现代化学的开端。而最有名的“原子理论”,就是1869年的门捷列夫的元素周期表所提出的。他说既然这个世界是由一些“积木”组成的,这些“积木”的单元有多少呢?它满足一些什么样的条件呢?他就画出了一个元素周期表,这是一个伟大的天才型的发现。门捷列夫作为一位如此伟大的化学家,却没有得到诺贝尔奖,是因为他没有讲述清楚具体原因,而诺贝尔早期奖励的是化学的原理。比如第一个得诺贝尔奖范特霍夫(Van’t Hoff)就是做化学动力学的,第三个得诺贝尔奖的是瑞典人阿伦尼乌斯(Arrhenius),他发表了电子电解质的一个理论。量子力学的奠基人之一保罗·狄拉克(Paul Dirac),在1929年的时候提出:对物理化学问题作数学求解的基本规则已完全清楚,困难在于基本规则应用于真实体系的方程过于复杂而无法求解!意思是,基本原理是清楚的,但是具体的结果是永远也知道不了的,因为解不了这样复杂的方程。 后来,计算机的发展使得人类可以开始解更复杂的方程。1952年时候的计算机叫手摇计算机,算一个氮分子要花两年的时间。所以有人断言把世界上的纸全部用完,也算不了一个铁原子。当时瑞典的一个量子化学的奠基人佩尔-奥洛夫·勒夫丁(Per-Olov L?wdin)说:“如果你聪明,你就不需要用计算机,如果你不聪明,你也不知道怎么用计算机。” 现在人工智能也是一样的。化学的基本问题在理解层面上有了巨大的进步,但对于真正去做化学的人这是不够的。我们虽然超越了狄拉克的理论,但实际上并没有解决很多化学的问题。
化学的一个难度叫做维度灾难,维度就是复杂度,它不是一个量决定的,例如刚才讲到的方程,它只有5个常数,从逻辑上来讲,解完这个方程我们就应该知道世界了,但其实不然,因为化学已经进入性能维度,之后还包含结构和性质,因此这个方程从维度上来讲其实是无数个数量级往上递增,所以维度的灾难是越来越复杂的。想要自下而上地把世界像搭积木一样搭出来是非常困难的。在一个非常干净的体系里面是可以把一个分子这样搭建出来的,但在实际材料应用的时候,环境是非常复杂而多变的,因此难以实现。另外,化学还有一个难度叫做“投影式”灾难。人类的思维是有限的,例如生活在三维的物质世界里,人类的思维是超越不了三维的。所以分析问题的时候要抓住主要矛盾,因为人类的大脑只能够承担主要矛盾,矛盾一多大脑就会十分疲惫,这就是典型的思维的限制。我们在理解不了高维的事物时,往往把它投影在不同的低维上,但是投影之后的世界跟真实的世界是相差甚远的。例如上图片右边这样的一个仪器,一个事物投射在不同的方向上,一面是天使、一面是魔鬼,那我们就无法确定这个事物的本质。中国有一个类似事例叫“盲人摸象”,人类在高维世界其实就是个盲人,我们认识这个世界的方式就是“瞎摸”,摸到什么就认为什么是真实的,因为也无法证明,而想要反演回去是非常困难的。现在的化学研究还是依靠简单的办法——“试错式”和“炒菜式”。因为化学是调配的一个结果,需要不断试错,才能从中知晓唯一的正确配方。另外化学跟炒菜也很相似:配料一模一样,一个人就炒得好吃,另一个人就炒得就很难吃;同样的东西有些化学家就能做得非常好,有些就非常糟糕。主要原因是它非常复杂,人类在没有办法掌握所有知识的情况下,我们就把知识分成很多小块,然后把每一小块知识吩咐给不同的人去做。因此我们有了物理、化学、材料和生物等等不同学科。所以人都是生活在知识的孤岛上的。为了解决这一问题,人类做过许多努力,例如《四库全书》、《大英百科全书》,但是没有一个人能把这些知识全都记住。我们再来看实验室的对比,百年前诺贝尔的实验室已经很完备了,再看当今实验室,没有任何进步。现代科技领域很多都已经进入自动化了,而一个教授带着几个学生的这种小作坊的形式太古老了,这种形式是限制现代科学的发展的主要原因之一。还有一个原因是试错的成本是非常高的,而小作坊的形式就会产生低通量。人的精力是有限的,特别在做科学实验的这种高度集中的情况下,延长的时间并不会有额外的产出。其次实验的结果可能跟情绪相关性很大,心情也会影响数据。这些问题是非常复杂的,而人工智能可以解决这些问题。人工智能爆火的原因是它迎合了这个时代,能够为复杂的高维度问题提供一个方案。问题越复杂、它的优势越大,例如人工智能在围棋方面已经远超人类了。情绪波动产生的数据的低通量的问题,很多欧美的实验室也已经通过采用机器代替人来解决了。但这种方式也存有问题,因为它本质上是个自动化的机器,并不能像人一样的可以思考。 人工智能具有解决复杂性和维度灾难的能力,机器人可以解决效率和可靠性的问题,因此人工智能加机器自动化发展是个必然趋势。同时AI的知识是更容易被机器理解的,机器人也可以为AI提供高质量数据,AI和机器可以天然地交流合作,相对于人类之间的低效交流,优势明显。构建人工智能化学家,首先需要它有学习能力,学习就要有知识积累、逻辑分析和动手能力。其次它要能够走通人类科学家的工作路线。机器人“小来”可以在阅读文献的同时指挥计算机建立模型计算、安排机器人做实验——整体的流程它都能完成。“小来”是一套完整的可拓展的系统,新的仪器能够做到即插即用,所有程序都能够做到兼容,所以在未来潜力是非常大的,能够颠覆性地改变整个化学的研究的范式。以高熵金属电催化剂的研究为例,高熵就是要5种以上金属混在一起,“调配”出一种最好的催化剂。但是因为有5种金属,高熵的形态很多,还有各种各样的结构,对机器的合成的技术要求非常高,因而机器人的技术操作能力也要大幅提升。我们预设了两个目标:一是在未知场景下利用未知物质创制催化剂;二是选取最优金属元素创制高性能催化剂。“小来”用两周的时间完成了数以百万计的陨石的配方筛选,创制出了高效产氧的催化剂材料。这项工作需要一个人花上千年才能完成。整个研究工作产生了很强的新闻效应,人类终于向定居火星迈出了重要一步,可以通过机器做好所有前期准备,甚至是产生氧气,《Nature》也专门发了视频来介绍这个成果。nceid="1565210990423246396" data-type="video" data-mediatype="undefined" data-authiconurl="https://dldir1v6.qq.com/weixin/checkresupdate/icons_filled_channels_authentication_enterprise_a2658032368245639e666fb11533a600.png" data-from="new" data-width="1920" data-height="1080" data-id="export/UzFfAgtgekIEAQAAAAAANW051fm4xAAAAAstQy6ubaLX4KHWvLEZgBPE9oEgQTFaWqKFzNPgMItFkfVcq-FRKOl0ZlDVi1ND" data-isdisabled="0" data-errortips="">除了制作氧气,中国天津生物工业研究所几年前还发表过二氧化碳加上水就能够直接通过催化反应制造淀粉的研究工作。利用这些成果,我们可以到火星上产生氧气、食物和各种各样的东西,所以未来还是非常有用的。研究地球上最好的催化剂也是能做到的,我们通过机器一个小时内读取了5万多篇文献。机器总结了所有做过催化剂的金属的关系图,并且推荐了一个新的试剂配合物。我们通过优化就能发现图中的红色区域效果最好 ,事实证明这块的催化剂确实是人类最好的催化剂,稳定且高效。大模型驱动的机器合成与优化,可以通过把大模型和机器人连在一起,让大模型驱动器和机器人之间进行直接交流,来完成整个化学的过程。我们提出需求,它就会给你一个方案,并且进一步优化,提供一个更好的平衡。 大模型里面有个最大的问题是黑箱特性,预测会发散,还会产生幻觉。幻觉并不是个大问题,但是预测发散、抓不住主题是很严重的。但是由于大模型要解决大家通用的问题,很容易出现发散、幻觉——问题指向性不明显,就会有猜测。科学是相对来讲比较集中的,科学的体系是完善的,所以在这套体系里构造一个真实世界的科学数据与知识体系,就能够避免发散。同时,有了最新的数据之后,大模型的预测能力也会提高。我们通过看、闻、听、触等基本方法来了解宏观世界,而对微观世界的理解是利用谱学,例如牛顿(Isaac Newton)将一束光照在一个棱镜上分散出七色光,知道了光是七种颜色组成的。所以为了了解物质的内部结构,人类构造了很多光谱仪来做不同的波段探测这个世界。我们探测微观世界,就是利用波长的不同特征来探测物质的不同特性。 我们现在正在做的工作,就是构造一个谱学的大模型。谱作为中间桥梁,可以做到看一个谱,就能知道它的结构,知道谱的结构就能知道性质。世界就是由结构和材料的特性两个东西决定的。谱学能够提高我们分子识别的预测能力,利用谱学能够更好地来表述分子。我们现在已经有了结构到谱学的关系,所以只要给一个分子结构就能知道它的光谱、得到它的特性。这一条路走通了,第二条路是怎么从谱回到结构上来,反演的关系是更为复杂的。另外关于怎么能够通过表征就知道它的特性的问题,我们也建立了一套人工智能的关系,应用在催化上就是可以通过谱学知道催化剂的好坏。如果能实现“谱学-性质-结构”的三角六循环结构,我们就能建立一个谱学的大模型,基本的逻辑是通过你看见的来给出真实世界的真正的结果。我们的未来目标是在5年之内做一个同时具备跨领域科学大脑、规模化云科学装置、广泛赋能科研这三项能力的“机器科学家集团军”。这个装置里面有很多机器人,所有化学的合成都由它们来操作。大模型的大脑能够指挥所有机器的操作,为研究生提供知识、实验和计算的支柱,为科学家产生原创思想提供帮助,为工程师研发产品提供各种各样的支持。最后还可以通过云平台,把全中国的实验室、乃至全世界的实验室全部合在一起。这种集中式智能汇聚平台,要有多形态、集群化实验、基于智能谱学感知物质并预判演化的先进科研机器人。如今机器的各种形态和动作已经很多了,发展非常迅速,可以做各种各样的东西。但只有谱学大模型的建立,才能是一个大的体系,能做不同的通用模型框架。化学与材料的大模型里有两个关键部分,科学智能算力中台和科学大模型数学原理。现在的大模型都是纯数据驱动的,我们可以通过尝试把科学原理跟数据融合在一起,加速模型的可靠性,实现化学与材料的按需创制。 总平台建成之后,提出需求,科学大模型就会给出一个候选的物质和研究的方案,人机交换后它就开始按照方案进行优化和决策,最后产生一个全局优化的过程。这就是未来化学研究的一个模式。
现在的科学研究,特别在化学方面,很多年轻人被繁琐的事情所累,反而没有时间思考。在这个平台的助力下,人可以多花时间去思考。大家经常会说一句话:在科学研究中提出问题比解决问题更重要。现在只需要提出问题,人工智能都能解决,于是回归到科学的原始——提出问题确实是最重要的一部分。
中国科大的目标就是在合肥建一个世界上最大最强的化学材料大脑,这个大脑还有供一个上百个机器人运行做实验的平台,在全中国的科学院系统里面有各种分平台,通过云网连接形成一个全局一体化的巨大工程,这就叫做集中式智能、分布式创新。这样,我们就可以把所有的智慧都集中到云平台里面,通过人工智能进行高效融合,在不同地方产生应用。
由于微信公众号乱序推送,您可能不再能准时收到墨子沙龙的推送。为了不与小墨失散,请将“墨子沙龙”设为星标账号,以及常点文末右下角的“在看”。
转载微信原创文章,请在文章后留言;“转载说明”在后台回复“转载”可查看。为了提供更好的服务,“墨子沙龙”有工作人员就各种事宜进行专门答复:各新媒体平台的相关事宜,请联系微信号“mozi-meiti”;线下活动、线上直播相关事宜,请联系微信号“mozi-huodong”。
墨子是我国古代著名的思想家、科学家,其思想和成就是我国早期科学萌芽的体现。墨子沙龙的建立,旨在传承、发扬科学传统,倡导、弘扬科学精神,提升公民科学素养,建设崇尚科学的社会氛围。
墨子沙龙面向热爱科学、有探索精神和好奇心的普通公众,通过面对面的公众活动和多样化的新媒体平台,希望让大家了解到当下全球最尖端的科学进展、最先进的科学思想,探寻科学之秘,感受科学之美。
墨子沙龙由中国科学技术大学上海研究院及浦东新区南七量子科技交流中心主办,受到中国科大新创校友基金会、中国科学技术大学教育基金会、浦东新区科学技术协会、中国科学技术协会及浦东新区科技和经济委员会等支持。
最新文章
今天有好东西,大折扣!
仰仰铺子·好物盘点这一期好物盘点,千万别错过!都是好宝贝,超低价,就连我们好久没有福利活动的丝蓓缇黑姜分解酵母也弄到了特
快步剪辑师(快剪辑教学)
摘要:快步剪辑师,快剪辑教学课程,场课为您整理出关于快步剪辑师的相关在线教程知识,欢迎访问了解快步剪辑师(快剪辑教学)的