机器学习辅助合成的锂离子电池正极材料

【背景介绍】

机器智能在高维参数空间上近似相关的能力可以提供物理洞察力，加速材料发现。今天，锂离子电池（LiB）是最重要的技术之一，已经彻底改变了便携式电子和电动汽车行业。然而，开发更高性能的电池材料的传统方法通常需要长时间的研究和复杂的实验努力，因为可以夹带金属离子（Li、Na、K、Mg、Ca和Al）的化合物的潜在组合很容易达到几千种。因此，机器学习（ML）获得了巨大的关注，以规避难以维持的爱迪生式的实验，旨在减少人力和研究成本。然而，在过去的ML学习中，由于具体的合成参数，人们发现很难复制优化的设计变量。

为了解决这个问题，在本文中作者根据已发表的科学记录中经常提到的参数来建立输入特征。随后，结合逆向设计，实现具有高放电能力的阴极材料的基本实验准则的设计到设备的流水线。

【结果与讨论】

机器学习辅助合成的锂离子电池正极材料

图1.设计到设备的三个步骤的示意图。

作者采用反设计框架来预测x+y+z=1的LiNixCo1-x-yMn1-x-y-zO2（NCM）阴极的最佳实验设计。这个框架（图1）包含三个部分。

(1)统计估算技术，对文献整理中的缺失数据进行近似计算。

(2)机器学习和超参数搜索以最大限度地提高普适性。

(3)优化设计变量预测的实验验证。

从反设计中，作者观察到镍的成分、烧结温度、截止电压和充电率（C-rate）与锂离子电池的性能密切相关，这与以前的研究一致。随后，基于反设计准则，作者仔细地在实验中验证了预测结果发现，本文的预测达到了很高的准确性，均方根误差为8.17mAh/g。作者期望本文的研究将为快速、可靠和合理的阴极材料设计奠定基础。

1. 数据归纳

作者的目标是为最佳NCM阴极的实验设计变量提供高度可行的量化指南。在此，作者建立了描述NCM阴极物理描述符的输入变量，如成分比和二次粒子大小，以预测阴极的放电能力。其他因素包括烧结温度和时间也被考虑，因为它们对结晶度和结构稳定性有影响。最后，测试条件，如控制电位窗口和电化学速率的截止电压和C-速率，被选作特征。这些特征描述符是输入变量，而放电能力是目标输出（如表1所示）。

表1 反向设计指导下的NCM合成的总结。

机器学习辅助合成的锂离子电池正极材料

作者发现，个别出版物对合成和测量参数的报告不一致，给材料科学的ML驱动预测带来了巨大挑战。一旦规范了输入特征，作者发现415个数据中几乎有16%是不可用的。为了克服这个问题，作者利用了几种归因技术，即K-近邻（KNN）、随机森林（RF）和连锁方程（MICE）的多重归因，来“填补”缺失的数值。虽然数据归因在材料科学中并不经常使用，但它们在生物科学中的应用却非常广泛。

为了评估每种推断方法的可靠性，作者首先删除了任何由缺失/空值组成的数据行。这个过程将数据规模从415个减少到112个。可以观察到，大部分缺失的信息与第一次烧结温度和时间有关，其次是第二次烧结和颗粒大小，如图2（a）所示。

机器学习辅助合成的锂离子电池正极材料

图2.(a)每个特征中缺失数据的百分比。(b)不同归因方法的比较，即KNN(k-neighbour)、链式多重归因(MICE)和随机森林(RF)方程（MICE）和随机森林（RF）。

在验证各自数学技术的可靠性之前，作者从112个数据中随机删除了16%的数据。理想情况下，“真实”值和计算值之间的差异应该接近0。在这里，作者发现“第一个烧结温度”的特征在推算出的数据集和原始数据集之间表现出最大的差异。在三种方法中，KNN显示出最差的性能。原因是KNN使用k的近邻的“特征相似性来预测缺失值。在“第一个烧结温度”中，80%以上的研究人员使用的温度是500℃。缺乏多样性会误导KNN的预测，而离群点可能会被强烈抑制。相比之下，MICE产生了与KNN和RF相比，MICE产生了最小的方差，成为处理缺失数据的明显选择。因此，作者对415个数据进行了MICE归因，以进一步分析和进行ML预测。

2.前瞻性预测

机器学习辅助合成的锂离子电池正极材料

图3.(a)输入描述符的特征重要性。(b)使用MICE在预测值和目标值之间进行正向建模的性能。插图显示了训练集平均绝对误差（MAE）的直方图。

输入变量的特征重要性用Gini重要性来解释，如图3（a）所示。结果发现，诸如镍和第二次烧结温度、C-速率和截止电压等变量是与放电容量高度相关的四个重要特征。令人惊讶的是，“Co”成分没有像它们的成分对应物（Ni和Mn）那样被列为重要特征。作者认为这可能是由于研究趋势从富含Co到富含Ni造成的。尽管它有274mAh/g的高理论比容量，但它有几个关键的缺点，包括高原料成本、毒性、低热稳定性和在高C率下容量迅速衰减。另一个原因是发现了富含镍的NCM材料，它表现出高容量和低生产成本。因此，在过去的15年里，人们一直在共同努力，在保持阴极材料优越性能的同时尽量减少Co成分。镍和锰是在此期间广泛用于克服这一问题的许多活性成分之一，导致Co的特征重要性排名较低。

作者采用梯度提升回归与决策树（GBR）作为正向建模算法，因为它对小数据集（<1000个数据）预测的稳健性。GBR的超参数是在90%的训练集和10%的验证集的基础上，通过10倍交叉验证网格搜索来调整的。在这项工作中，作者根据决定因素的系数（图3(b)）、R2和平均绝对误差来评估模型的性能。作者发现，GBR的训练拟合得很好，R2为0.99，MAE小于2.2mAh/g，而验证的R2为0.85，MAE为8.9 mAh/g。尽管可能存在某种程度的过度拟合，但考虑到验证数据的合理R2，作者相信描述符和电化学特性的复杂性通过GBR算法得到了很好的体现。

3.向后预测

正向建模通常用于描述材料科学中的基本工艺-结构-性能关系，而作者采用基于粒子群优化（PSO）算法的反向设计模型来寻找最佳阴极NCM实验条件。利用训练有素的模型，预测了满足不同目标放电容量的电化学规范的新设计变量，作为设计到设备管道的指导方针。接下来，作者根据150、175和200mAh/g的预期目标特性，分别对设计变量进行了反向预测。尽管PSO可以产生许多候选设计，但由于有可能超出其训练集的外推作用，预测的设计变量的质量可能会有所不同。由于通过实验验证所有的预测变量是低效的，因此采用了一种神经网络方法来对预测变量的可靠性进行排序。在这种方法中，预测的变量被输入到神经网络中。然后，作者将神经网络预测的排泄能力与GBR的预测值进行比较。比较的方差将作为设计到设备实现的自信指南之一。

4.反向设计的合理化

从特征的重要性中，作者选择了描述放电容量的四个最重要的参数，如图4所描述的。随后，作者建立了一个阴极材料的设计规则。

机器学习辅助合成的锂离子电池正极材料

图4.根据不同的推算数据集，预测反设计变量，不同的期望放电容量。目标属性（上）150 mAh/g，（中）175 mAh/g，（下）200 mAh/g。

从预测的逆向设计中满足所需的电化学性能。很明显，对于富含镍的阴极（LiNixCo1-x-yMn1-x-y-zO2,x>0.6），烧结温度通常随着镍含量的增加而降低。原因有两个方面；首先，由于Li+（0.69埃）和Ni+（0.76埃）的离子半径相当，高烧结温度导致Li+被Ni2+取代，阻碍了电化学过程中锂离子的扩散途径。其次，由于Ni3+和O2-之间的低结合能的性质，富镍阴极的烧结导致氧原子的损失并产生表面缺陷。因此，在较高的烧结温度下，更多的缺氧点将建立在阴极表面，导致结构退化，并延缓界面的电化学反应。因此。研究人员在提高阴极中镍含量的同时降低了烧结温度。

其次，C-速率是决定电池性能的另一个关键变量。在高C-速率下，电化学反应比迟钝的Li+扩散更快；导致锂离子扩散主要发生在电解质溶液和阴极表面之间的界面附近，而远离隔膜的大块NCM则被严重地利用不足。

一般来说，平均预测的截止电压随着目标放电容量值的增加而增加；这与以前的实验结果一致。然而，在本文的数据集中没有指定镍含量和截止电压，令人惊讶的是，该模型能够准确预测镍含量和截止电压之间的相关性，其中高镍含量总是导致低截止电压。此外，由于NCM是一个三元系统，增加一个成分就会减少其中一个或两个成分，这意味着增加镍会导致Co和Mn含量比镍减少。由于缺乏Mn4+这一结构稳定剂，富含Ni的阴极更容易发生相变，导致低截止电压。为了证明作者模型的有效性，作者进行了从设计到设备的流水线方法。

5.实验验证

表1总结了预测的设计变量和实验中用来验证预测的参数。在这个预测中，作者也考虑了加工成本，它被作为一个约束条件来预测设计变量。通过这样做，作者找到了对Co成分依赖性最低的加工条件，同时实现了预期的目标放电容量。

为了验证合成的NCM样品的晶体结构，根据层状六方α-NaFeO2结构（空间群R-3m，编号160），作者对每个样品的峰值进行了米勒指数，没有明显的杂质峰。作者用Rietveld方法进一步完善了XRD数据，从单位晶胞参数的计算值来看，c/a值大于4.9362（氧晶格畸变所需的c/a比），表明有良好的层状结构。

作者还注意到R(I003/I104)>1.2，对应于所需阳离子混合的最低程度。在三种合成的阴极中，以预测的目标放电容量为150 mAh/g，表现出最佳的层状结构和最低的Li+/Ni2+混合程度，这有利于锂离子传输和良好的电化学性能。作者通过扫描透射电子显微镜结合能量色散X射线光谱（STEM-EDS）的元素图谱，进一步表征和验证了合成的NCM阴极的组成。暗模场STEM图像显示了每种NCM阴极材料的球状结构。从EDS元素图谱中，作者确认了Ni、Co和Mn的存在，它们是均匀混合的。从EDS得到的成分比例与机器学习模型的预测数据和电感耦合等离子体（ICP）的测量数据进行了比较。一般来说，从EDS获得的元素比率与ICP结果有很好的一致性。

机器学习辅助合成的锂离子电池正极材料

图5. 基于逆向设计预测与实际材料性能。

图5显示了反设计预测的实验验证，其中不同设计的放电容量从电压-容量曲线中总结出来。根据目标放电容量的反设计预测，合成的NCM粉末分别被指定为MICE@150、MICE@175和MICE@200。扫描电子显微镜（SEM）图像显示了非制备的NCM粉末（图5（a）-（c））。二级粒子与较小的一级粒子密密麻麻。随着Mn's比率的增加，初级粒子的尺寸也随之减小，这与之前的研究一致。作者观察到，MICE@150、MICE@175和MICE@200的基于MICE的NCM电极的放电容量分别为~150.0、~161.0和~209.5 mAh/g。对于MICE@150、MICE@175和MICE@200，它们各自的库仑效率分别为91.7%、80.0%和85.9%。在选择了这些数据集后，作者在一系列不同的C率和截止电压下，进一步比较了ML预测和实验测量的结果，预测和实验之间的平均百分比误差为11%，这表明ML模型合理地捕捉了放电容量的趋势。

最后，作者证实，简单的归因方法对反向预测是有益的。在不减少策划的数据集大小的情况下，作者证明了该的方法可以逆向工程优化阴极材料具有很高的可行性。然而，为了进一步改善ML预测，作者建议还应考虑额外的信息，如内部压力和密度或装载质量，因为这些参数可能影响最终产品。此外，如果数据是从已发表的期刊上收集的，过滤掉低质量的数据可以改善预测结果。由于ML对输入数据很敏感，不恰当的输入值可能会影响预测能力。

【结论】

总之，作者展示了一个强大的数据驱动的逆向设计，在没有事先实验知识的情况下合理地探索设计参数。作者使用几种归因技术进行了数据归因，以“填补”缺失的数值，并获得了一个具有显著预测能力的训练模型（R2=0.99）。随后，作者使用逆向设计技术预测了150、175和200 mAh/g的理想目标放电容量的设计变量。最后，作者验证了逆向设计中的预测设计规则。实验测量和预测之间的低RMSE为8.17 mAh/g，表明这种方法是高度可靠的，能够加快锂离子电池的研究步伐。

此外，基于通过MICE推算的数据集的高放电容量的预测与实验测量结果非常吻合。作者预计，从文献中整理出的数据可能会消除知识转移的障碍，而这一障碍减缓了实现高性能锂离子电池的进展。总的来说，这项工作促进了一种有前途的方法，补充了传统的试错方法来加速材料开发。

Chi Hao Liow, Hyeonmuk Kang, Seunggu Kim, Moony Na, Yongju Lee, Arthur Baucour, Kihoon Bang, Yoonsu Shim, Jacob Choe, Gyuseong Hwang, Seongwoo Cho, Gun Park, Jiwon Yeom, Joshua C. Agar, Jong Min Yuk, Jonghwa Shin, Hyuck Mo Lee, Hye Ryung Byon, Seungbum Hong, Machine learning assisted synthesis of lithium-ion batteries cathode materials, Nano Energy, 2022, https://doi.org/10.1016/j.nanoen.2022.107214