传统上,混合型卷烟中使用的*草烟**必须凭借着视觉、物理外观和感官特征等标准进行手动检测,这个过程很容易受到人为错误的影响,并且相关人工成本也比较高昂。为了降低检测过程中的主观性,并且简化质量分级过程,美国Altria公司的科学家在其烟梗加工设备上,开发了一种高光谱成像系统,以验证*草烟**的不同配方等级(见图1)。

图1:烟叶混合等级验证系统由罩壳、卤钨灯、冷却风扇和高光谱相机组成
收割和烤制的*草烟**植物通常包括三种主要类型的*草烟**:烤烟、白肋*草烟**和东方*草烟**。根据外部因素(例如生长位置、天气、叶片在植物上的位置、色泽和质地),将植物进一步分成等级,该过程以前是通过人工检查完成的。
Altria公司开发了专门用于烟叶配方等级检查的新型高光谱成像系统,以简化*草烟**分级过程。Altria公司高级科学家Amrita Sahu和其同事Henry Dante,因为在这项工作中的出色表现而被授予了2016年度的Jack Nelson 年度创新奖(见图2)。

图2:Altria公司高级科学家Amrita Sahu,开发出了基于高光谱成像的农产品分级系统
“该系统已经能够区分三种主要的*草烟**类型:美国白肋*草烟**、烤烟和东方*草烟**。”Sahu介绍说,“该系统还可以区分同一植株的烟叶位置。”
来自美国Surface Optics公司的SOC710可见近红外(VNIR)高光谱相机安装在系统罩壳内,用于捕获图像;该高光谱相机连接到联想ThinkCentre M93p主机和显示器。这款推扫式线扫相机提供400~1000nm的光谱范围、4.69nm的空间分辨率和128个光谱通道。
两个固定的120V/250W卤钨灯泡固定装置,位于摄像机上方的罩壳顶部,用于提供照明;冷却风扇用来调节温度,并且安装在组件两侧的两个风扇可以保持负压水平,进而确保灰尘不会落在相机镜头上。此外,相机用一个金属护罩提供保护,并且提供一个足够大的开口,可以让镜头穿过,同时还可以进入相机的后部以进行线缆管理和移除。保护罩还可以防止传感器过热,从而减少潜在的图像噪声。
来自美国L3HarrisGeospatial公司的以IDL(界面数据语言)编程语言编写的定制软件,可以采集相机拍摄的图像。L3Harris Geospatial软件的4.5版本和IDL编程语言执行图像分析功能。
在三年的*草烟**季中,Altria公司的团队收集了大量数据,用于训练*草烟**混合等级验证算法。该分类系统对来自美国Labsphere公司的Spectralon标准白色参照物进行成像,并在对样品成像之前记录暗电流。然后,操作人员将*草烟**样品放入罩壳中,在520×696的空间大小内进行成像。预处理包括逐像素扫描整幅图像,以去除饱和度和阴影。通过检查每个像素的最大值是否等于4096(12位传感器可能达到的最大值)来确定饱和像素。阴影像素的阈值为500,该值是通过对已知阴影像素的统计分析确定的。
在消除暗噪声后,该软件将应用中值滤波器,以消除特定频段中存在的任何种类的仪器伪像。然后,通过获取3×3像素块中所有光谱的平均值,并将这些光谱重新分配给原始图像大小的九分之一的新图像,在空间上缩小图像,这样做是为了减少特征提取期间的计算负荷和噪声。每个像素乘以一个校正比率:

其中,CR是校正比率向量,h和w表示高度和宽度。
计算每个像素矢量的算术平均值,然后将其除以标准参考矢量(SR),该标准参考矢量是在处理开始时获取的白色参考的平均值。最后,使用单位矢量归一化方法,用于将每个频谱缩减为一个长度。
系统使用图像分析软件显示样品是否对应于其标记的等级、相邻等级或相距两个或更多个等级(见图3)。后一种情况导致样本的分类异常。系统仅在程序初次启动时,以及检测过程中的每30分钟对白色参考进行成像。

图3:*草烟**植株多个品种的判别分析。
US Burley:美国白肋*草烟**
US Flue Cured:美国烤烟
Oriental:东方*草烟**
由于高光谱成像数据的高维性,需要进行光谱特征提取。该团队设计了混合等级验证算法,以基于距离度量,将*草烟**图像分类到先前计算的每种类型和等级的简化光谱特征,这需要建立每种*草烟**等级的独特光谱特征库。连续最大角凸锥(SMACC)末端构件模型,用作末端构件提取程序。
根据*草烟**的类型,提取了五个或六个末端构件,以代表每种类型和等级的*草烟**的光谱特征。使用线性光谱分解,可以计算出每种类型和等级组合的丰度值,并用作分类的定义参数(光谱轮廓)。在每个*草烟**季,将使用每个*草烟**等级的前六个样本来校准模型的初始值,以说明每年的作物变化。
对图像进行预处理后,将使用预定义的末端构件对数据进行线性分解。为每个像素计算末端构件丰度值,并对整幅图像获得这些丰度的平均值。得到五特征向量来代表光谱轮廓。
在待分析图像的光谱轮廓与特征提取过程中找到的光谱轮廓之间,计算马氏距离。如果样品在标记的类别形心(labeled class centroid)的三倍标准差(three standard deviation)内,则可以接受。如果样品在标记的类别形心的三倍标准差之外,则类别距离可通过以下方法计算:

其中CDR表示类别距离比,LCD为标记类别距离,MACD为最小相邻类别距离。如果类别距离比小于70%,则检查样品。如果类别距离比大于70%,则该样本可以接受。
使用线性判别分析(LDA),可将所有三个*草烟**组的光谱轮廓缩减为三个特征,进行集中和可视化。3D LDA群集图显示了三个主要*草烟**组之间的清晰分隔。使用LDA绘制了*草烟**植物不同烟叶部位的光谱特征(顶叶、红棕叶、上二棚、中部叶和下二棚)。*草烟**植株烟叶部位光谱数据的二维LDA图,显示它们之间存在明显差异。由于化学和感官特征相似(见图4),因此在顶叶和红棕叶之间存在重叠,这是可以预期的。

*草烟**植株
图4:*草烟**植株的烟叶部位显示,大部分重叠发生在顶叶和红棕叶之间,它们的特征在很大程度上相似。
*草烟**配方等级验证算法的结果,针对人工等级进行了验证。该方法对烤烟和白肋烟等级的相对准确度达到93%,这一数字是通过获得正确分类的样本数,再除以整个作物年度进行成像的样本总数而获得的。
灯泡烧坏和镜头未聚焦等问题导致样本分类错误。为了解决这个问题,Sahu引入了一个主样本功能。如果出现异常,操作人员将输入代表原始标记等级的主样本,并检查系统是否正常工作。如果系统确认主样本属于同一等级,则操作人员会将其放在一旁,以供受过训练的人工分级员做进一步检查。如果系统未确认主样本,则软件将关闭并阻止操作人员继续使用,直到确定问题原因为止。
在团队实施该系统后,每小时都会捕获样本图像,并且在需要采取纠正措施的情况下可以提供电子报告。
Sahu介绍说:“该系统简化了检查流程,可以实现*草烟**的立即出货,从而减少了工厂的存储成本和运输积压。”
Sahu建议说,尽管该系统是为*草烟**开发的,但也适用于对茶叶、咖啡或葡萄等农产品进行质量分级。