东南大学王金兰、周跫桦团队在基于大语言模型的晶体合成性研究中取得新进展

2025-09-23
东南大学

近日,量子材料与信息器件教育部重点实验室王金兰教授团队在基于大语言模型的晶体合成性研究中取得新进展,研究成果以“Accurate prediction of synthesizability and precursors of 3D crystal structures via large language models(基于大语言模型的晶体可合成性与前驱体预测)”为题在《Nature Communications》上在线发表。

image.png

材料的实验合成是新材料研发的关键环节之一,如何从理论设计走向实际材料合成一直是一项重要挑战。该工作开发了一套晶体合成大语言模型(CSLLM)框架,通过三个微调大语言模型分别预测任意三维晶体结构的可合成性、合成方法和前驱体。该工作构建了包含可合成/不可合成晶体结构的综合数据集,并开发了高效的晶体结构文本表示方法用于微调大语言模型。可合成性大语言模型取得了98.6%的高准确率,显著优于基于热力学和动力学稳定性的传统筛选方法。此外,合成方法和前驱体大语言模型在分类常见二元和三元化合物的合成方法和固态合成前驱体方面,都达到了90%以上的准确率。基于此框架,研究人员成功筛选出45,632个可合成的理论结构,并通过图神经网络预测了它们的23个关键性质。该工作突破了传统材料可合成性评估的局限性,为理论材料设计向实际应用的转化提供了新的智能化解决方案。

该研究获得了国家重点研发计划、国家自然科学基金、江苏省前沿技术研发计划、江苏省应用数学科学研究中心等项目的资助。

论文链接:https://doi.org/10.1038/s41467-025-61778-y