高光谱成像仪作为光学测量仪器,可以采集到丰富的光谱信息。但在光谱信息采集的过程中,会受到电子噪声、光照等外界噪声干扰,使得光谱数据存在误差。因此,在建立光谱模型之间,需要对高光谱数据进行预处理。本文对高光谱成像仪的原理及光谱数据处理方法做了介绍。
高光谱成像是指在电磁波谱的光谱波段获取较高光谱分辨率(0.6-3.0nm)的图像信息的过程,其理论基础是利用电磁波谱对被测物特性进行分析并以成像的方式对被测物的光谱特性进行研究。所得数据是在特定波长范围内由一系列连续的窄波段图像组成的三维图像。现有高光谱成像系统的成像光谱范围包括400~1000nm,900~1700nm和1000-2500nm等3个标准光谱波段。
高光谱图像的采集方式包括逐点扫描式、线推扫式以及面帧式。目前,应用最多的是线推扫式。一个典型的线推扫式高光谱成像系由电荷耦合器件CCD探测器、成像光谱仪、镜头、光源及其控制器、可调载物台、步进电机、运动控制系统和图像采集系统等组成。
其中,成像光谱仪以光栅型为主,是高光谱成像系统的核心部件,其内部有一个棱镜-光栅-棱镜单元。在推扫过程中,该单元能将待测物一个窄带空间内的有效入射光散射成不同波长,色散后的光信号成像到CCD探测器上。其中的一个方向提供空间信息,另一个方向提供光谱信息,这样就得到了此窄带空间位置上多个像元点的光谱图像。对推扫过程中多个窄带空间区域的光谱图像进行拼接,可获得整个待测物的高光谱图像。
根据高光谱成像系统中光源的类型以及传感器与光源的不同配置方式,可获取4种不同类型的高光谱图像,分别是:反射图像、散色图像、荧光图像和透射图像。
光谱数据预处理方法有多元散射校正、标准正态变量变换、数据规范化、数据平滑校正、导数光谱法、小波变换法等等。下文主要介绍几种常用的方法:
1.多元散射校正(MSC)
多元散射校正是一种对光谱的线性化处理。样本的分布不均或者颗粒大小差异容易产生光散射,不能获取到“理想”光谱。该算法假设,实际光谱与“理想”光谱成线性关系,一般情况下,"理想”光谱无法获取,因此,常用样本数据集的平均光谱来替代。多元散射校正能够消除随机变化,校正后的光谱并非原始光谱。当光谱与待测物质的化学特性比较相关时,多元散射校正效果较好。
2.标准正态变量变换(SNV)
标准正态变量变换类似于多元散射校正,可以用来消除散射误差以及光程变化等影响。但是,两种方法的处理思想不同,该方法不需要“理想”光谱,而是假设每一条光谱中,每个波长的光谱吸收值满足一些条件,比如符合正态分布,则标准正态变量变换就是对每一条光谱进行标准正态变换处理。标准变量变化是分别对每一条光谱进行校正,因此,较适合处理实验样本差异较大的光谱数据。
3.数据平滑校正
光谱仪的不同波段对能量响应的不同,会导致光谱曲线上显示很多随机的“毛刺”噪声,曲线变得不平滑。而数据平滑校正是最常用的一种,其基本思路是:在特定平,滑点的周围选取指定数量的若干点,对其平均或拟合,求得平滑点的最佳估计值,减少噪声干扰,消除随机噪声。移动窗口平均法和Savitzky-Golay最小二乘拟合法都是常用的光谱数据平滑校正方法。
4.光谱导数法
求导可以减少仪器干扰、样本表面不均、光照等因素引起的基线漂移,一定程度上解决光谱信号重叠问题,将隐藏的微弱有效光谱信息放大,提供更好的光谱变化和分辨率。光谱导数法常用于近红外光谱吸收峰谷的辨别以及特征波长的提取中。导数光谱包括一阶导数光谱、二阶导数光谱以及高阶导数光谱等,实际应用中仅用一阶和二阶导数光谱就可以满足要求。很多随机噪声通常属于高频倍号,求导也许会使噪声变大,降低信噪比,若需要对原始光谱求导,前提是光谱分辨率和信噪比要高。常用的光谱导数方有直接差分法和SG卷积求导法。
5.小波变换
小波变换是新发展起来的一种时-频变换分析法,用于光谱数据压缩和噪声消除。小波变换继承了傅立叶变换的局部化思想,变换中的窗口大小随着频率变化而变化。此外,当时-频局部特性和多分辨特性较好时,小波变换还使得光谱信号在不同频率下被分解为多种尺度成分,并且根据尺度成分的大小选取相应的采样步长,从而能够聚焦到任意光谱信号中。小波变换的多尺度分辨率特点能够使其较快地从多噪声信号中获取原始光谱信号,因此,利用小波分析对含有较大噪声的光谱信号进行消除,是一个非常重要的应用。
由于高光谱图像既包含光谱信息,又包括图像信息,因此,高光谱图像数据的分析方法很多。归纳起来,可以分为以下几个步骤。
第一,数据校正与预处理
原始高光谱图像数据是光子强度信息,需进行反射校正获取相对反射率。对于一些球状或类球状待测物,其形状差异会使高光谱图像数据存在空间差异,可在图像维采用曲率校正方法或者在光谱维采用光谱预处理方法减弱或消除该影响。此外,由于高光谱图像的数据量较大(可达数个GB),可通过裁剪、合并等方法减少无用信息从而降低数据量。
第二,数据降维
在图像维,可根据待测物的光谱特性,直接提取反映待测物品质的一个或几个波长下的图像,也可通过一些数据降维方法如主成分分析法(PCA)、独立成分分析法或最小噪声分离法等获取关键的特征图像;还可在上述特征波段基础上,采用波段比算法、差分算法等计算特征图像。图像维的处理方法常见于被测对象的表面缺陷检测研究。在光谱维,在剔除了异常像元后,可对指定像元区域的光谱或者所有像元的光谱进行平均,计算平均光谱或偏差光谱进行分析;也可提取每个像元的光谱信息,用于像素级的分类分析。光谱维的处理方法可用于被测物内部品质和外部缺陷检测等。
第三,模型建立
在图像维,可采用数字图像处理技术对图像进行分割处理从而获取目标,提取特征参数建立相关模型;在光谱维,可将平均光谱或偏差光谱与待测品质关联,通过一些化学计量学方法如偏最小二乘法(PLS)、支持向量机、人工神经网络等,建立待测物品质的定量或定性分析模型。
第四,目标分类
根据建立的模型对待测物品质进行可视化预测研究,建立组分含量分布图像或分类图像。