基于高光譜成像和深度學習的水果成熟度測量
日期:2022-06-17 16:28:22

在水果行業(yè)中,成熟度是評估水果品質的重要指標,可用于確定采收、運輸、銷售等的最佳時間。部分水果可通過表皮顏色判斷成熟度,如香蕉等;牛油果、獼猴桃等水果則需要采用破壞性測量才能確定。為了給出解決方案,我們驗證了高光譜成像和深度神經(jīng)網(wǎng)絡是否能夠預測水果的成熟程度。通過這項工作,我們提供了一個高光譜數(shù)據(jù)集,并在此基礎上測試了不同的模型,從而展示了小型神經(jīng)網(wǎng)絡的優(yōu)勢。在前人研究中,Pinto等人[1]和Olarewaju等[2]利用高光譜成像來確定牛油果的成熟程度,Zhu等[3]利用高光譜數(shù)據(jù)預測獼猴桃的硬度和可溶性固形物含量,這些研究都是基于經(jīng)典的機器學習算法進行的。Mollazade等[4]展示了一個簡單的神經(jīng)網(wǎng)絡對番茄含水量的預測能力,Gao等[5]利用高光譜成像和預訓練的AlexNet(一種深度卷積神經(jīng)網(wǎng)絡)可以預測草莓的成熟狀態(tài),這些研究則是基于深度學習神經(jīng)網(wǎng)絡的。本文作者使用了更廣泛的模型,記錄了更大的數(shù)據(jù)集,分析了測量水果成熟度是否需要高光譜數(shù)據(jù),或者純彩色圖像就足夠。


高光譜成像 (HSI) 技術是近年來日益流行的一種非破壞性測量技術,該技術基于高光譜相機獲取的光譜數(shù)據(jù),其典型光譜范圍可從紫外到近紅外(表1),與標準RGB圖像相比,高光譜圖像有更多的通道,通常超過100個,可通過波長范圍揭示更多被檢測物質的不同化學性質。


表1  高光譜相機的典型波長范圍

類型

紫外線(UV)

可見(VIS)

近紅外(NIR)

波長

100-380nm

380-740nm

740-2500nm


本文的高光譜圖像獲取系統(tǒng)由3個部分組成(圖1),第一個組件是物體支架,由高光譜相機線掃描工作模式所必需的直線驅動器組成。第二個組件是光源。對于高光譜成像來說,足夠明亮和均勻的光源是必不可少的。鹵素燈和LED燈組合使用,以覆蓋更廣泛的光譜。此外,使用聚四氟乙烯曲率反射器來產(chǎn)生漫反射光。最后一個組件是相機,本研究使用了兩款高光譜相機(Specm FX 10和INNO-SPEC Redeye 1.7),以便更好地驗證結果,并覆蓋不同的波長范圍。Specm FX 10有224個通道,光譜范圍400-1000 nm;INNO-SPEC Redeye 1.7有252個通道,光譜范圍950-1700nm。使用折射計測量可溶性固形物的含量,使用硬度計測量穿透阻力以確定果肉的硬度。試驗收集了1038份牛油果和1522份獼猴桃的數(shù)據(jù),它涵蓋了兩種水果從未熟到過熟的成熟過程,高光譜數(shù)據(jù)集可通過https://github.com/cogsys-tuebingen/deephs fruit獲得。

圖122061701.png

圖1  高光譜圖像獲取系統(tǒng):帶有物體支架的直線驅動器、光源和相機。

獲得高光譜圖像后,首先采用簡單的基于像素的神經(jīng)網(wǎng)絡剔除背景,并訓練它來區(qū)分背景和水果,然后將水果分為3類進行研究,即未熟、成熟、過熟,將硬度、甜度和整體成熟度作為研究指標,建立一個小的光譜卷積神經(jīng)網(wǎng)絡,專門用于成熟果實的應用。

本文構建了高光譜卷積神經(jīng)網(wǎng)絡(Hyperspectral Convolutional Neural Network,HS-CNN)水果分類的架構(圖2),將整個網(wǎng)絡設計的盡可能簡單和小,輸入一個水果的高光譜數(shù)據(jù),3個卷積層從輸入的光譜數(shù)據(jù)提取特征映射,采用批歸一化(Batch Normalization)加快訓練過程,使用平均池化(average pooling),最后的分類發(fā)生在CNN的頭部,由一個全局平均池化層(global average pooling layer)和一個全連接層(fully connected layer)組成。全局平均池化層大大減少了參數(shù)的數(shù)量,使預測更加的穩(wěn)定。

圖222061701.jpg

圖2  HS-CNN架構

使用旋轉、翻轉、隨機噪聲和隨機切割作為數(shù)據(jù)增強技術,用Adabound對神經(jīng)網(wǎng)絡進行優(yōu)化,根據(jù)驗證損失提前停止,以防止過度擬合。在數(shù)據(jù)集中測試了5個模型,分別為具有徑向基核的支持向量機(SVM)、k-最近鄰分類器(kNN)、ResNet18、AlexNet和高光譜卷積神經(jīng)網(wǎng)絡(HS-CNN)。測試集為18個標記的高光譜記錄,測試結果如表2所示,每個神經(jīng)網(wǎng)絡給出三個值。當網(wǎng)絡能夠訪問整個高光譜記錄時,F(xiàn)ull值給出了準確度。大多數(shù)情況下HS-CNN模型是優(yōu)于參考模型的,該模型預測牛油果硬度,準確率達93.33%以上,預測牛油果的成熟度水平,準確率均90%以上;預測獼猴桃的成熟程度要比預測牛油果困難得多,因此所有模型的預測精度都明顯較低。然而,我們的模型仍然能預測獼猴桃的硬度和成熟度,準確率分別接近70%和80%。

表2  所有類別的測試準確性

表222061701.png


通過移除或替換高光譜卷積神經(jīng)網(wǎng)絡的組成部分,研究不同部分的影響。以牛油果為例,研究了這些操作的硬度測試精度。隨機剪切和增加測試時間可提高測試準確性(表3-1);深度分離卷積可以防止過擬合,增加測試精度(表3-2);網(wǎng)絡的頭部使用卷積部分的特征映射確定分類結果,全局平均池化減少參數(shù)的數(shù)量,防止了過擬合,提高精確性(表3-3);焦點損失函數(shù)可改善測試精度(表3-4);學習率值為0.01的Adabound算法更好(表3-5);平均池化的精確度比最大池化的精度更高(表3-6)。

表3-1  不同增強技術的影響

Augmentation variant

Accuracy

Full augmentation

93.3 %

Without test time augmentation

70.8 %

Without random noise

73.3 %

Without random cut

69.3 %

No transformation augmentation

80.0 %

表3-2  不同卷積類型的準確度

Convolution type
Normal convolution
DSCNV
Accuracy
80.0%
93.3 %


表3-3  不同頭部架構的準確度比較

Head  architecture
Accuracy
Global Average  Pooling with additional layer
93.3 %
Global  Average Pooling
80.0 %
Fully  connected layers
86.7 %


表3-4  不同損失函數(shù)的準確度

Loss function
Cross entropy  loss
Focal loss
Accuracy
80.0%
93.3 %


表3-5  不同優(yōu)化程序的準確度

Optimizer
Accuracy
Stochastic  gradient descent
80.0 %
Adam
80.0 %
Adabound with  default parameters
80.0 %
Adabound with  learning rate
93.3 %


表3-6  不同池化層的準取度

Pooling
Max pooling
Average pooling
Accuracy
86.7%
93.3%


使用積分梯度(Integrated gradient)來查看高光譜記錄的哪些部分對確定水果的狀態(tài)是重要的,這種技術可以顯示神經(jīng)元對網(wǎng)絡決策的影響,在一定程度上驗證神經(jīng)網(wǎng)絡的決策過程,驗證了預測正確性。圖3a給出了對牛油果成熟度預測影響的空間分布,這種影響均勻的分布在整個水果上。圖3b顯示了基于波長的影響,主要決策發(fā)生在800nm以上。此外,在一定程度上,該網(wǎng)絡利用520 ~ 650 nm的可見光范圍來區(qū)分未成熟果實和成熟果實。這個范圍與牛油果的可見變化相匹配??偟膩碚f,通過卷積神經(jīng)網(wǎng)絡學習的特征似乎是可信的。

圖322061701.jpg

圖3  決策因子對牛油果狀態(tài)判定的影響(a)基于空間,(b)基于波長。

此外,本文還介紹了一種為特定任務生成高光譜記錄假彩色圖像(false color image)的技術(圖4)。訓練了一個基于像素的自動編碼器(圖4a),對水果的高光譜圖像進行編碼和解碼,使用均方誤差進行訓練,潛在空間的大小為3,將其解釋為彩色圖像。使用編碼器的嵌入作為分類器網(wǎng)絡的輸入(圖4b),并訓練分類器以區(qū)分成熟度等級。最終得到了一個專門編碼信息以區(qū)分成熟度等級的編碼器。以這種方式訓練的編碼器可以生成假彩色圖像,從而可視化成熟過程。對于牛油果(圖5),成熟的部分從果實的底部一直長到頂部。對于獼猴桃的硬度分布(圖6),水果上慢慢長出一個受損的部分。

圖422061701.png

圖4  預訓練方法的架構(a)自動編碼器(b)分類器網(wǎng)絡。

圖522061701.png

圖5 牛油果成熟過程的可視化

圖622061701.png

圖6  獼猴桃硬度分布的可視化

本文的研究表明,卷積神經(jīng)網(wǎng)絡可用于高光譜數(shù)據(jù),將水果分為三類(未熟、成熟和過熟)。HS-CNN分類器網(wǎng)絡在牛油果成熟狀態(tài)分類方面表現(xiàn)出卓越的性能,在獼猴桃成熟狀態(tài)分類方面表現(xiàn)出良好的性能。

—— 原文 ——
L. A. Varga, J. Makowski, A. Zell. Measuring the Ripeness of Fruit with Hyperspectral Imaging and Deep Learning. 2021 International Joint Conference on Neural Networks (IJCNN), 1-8 (2021). 

—— 參考文獻 ——
[1] J. Pinto, H. Rueda-Chac′on, and H. Arguello, “Classification of Hass avocado (persea americana mill) in terms of its ripening via hyperspectral images,” TecnoL′ogicas, vol. 22, no. 45, pp. 109–128, 5 2019.
[2] O. O. Olarewaju, I. Bertling, and L. S. Magwaza, “Non-destructive evaluation of avocado fruit maturity using near infrared spectroscopy and PLS regression models,” Scientia Horticulturae, vol. 199, pp. 229–236, 2 2016.
[3] H. Zhu, B. Chu, Y. Fan, X. Tao, W. Yin, and Y. He, “Hyperspectral Imaging for Predicting the Internal Quality of Kiwifruits Based on Variable Selection Algorithms and Chemometric Models,” Scientific Reports, vol. 7, no. 1, pp. 1–13, 12 2017.
[4] K. Mollazade, M. Omid, F. A. Tab, S. Mohtasebi, and M. Sasse-Zude, “Spatial mapping of moisture content in tomato fruits using hyperspectral imaging and artificial neural networks,” in International workshop on Computer Image Analysis in Agriculture, 2012.
[5] Z. Gao, Y. Shao, G. Xuan, Y. Wang, Y. Liu, and X. Han, “Real-time hyperspectral imaging for the in-field estimation of strawberry ripeness with deep learning,” Artificial Intelligence in Agriculture, vol. 4, pp.31–38, 1 2020.

由于相關研究內容非常專業(yè),難免有些理解不準確或者編輯整理的疏漏,請以英文原文為準。

相關閱讀:
? 澤泉科技2022年招聘開始啦,誠邀您加入我們共同發(fā)展
高光譜成像技術:水培生菜營養(yǎng)成分快速檢測
實驗室高光譜數(shù)據(jù)在馬鈴薯晚疫病田間檢測中的潛力
基于NIR光譜儀的鮮食葡萄成熟度非接觸式測量
棉花表型分析:基于多光譜成像和無人機系統(tǒng)

收 藏