淺談視覺異常檢測在工業質檢領域的前景

2022-10-28 12:08:33 精質視覺

　　近年來，人工智能已經逐步進軍工業質量檢測行業，并且取得初步進展，AI在工業領域的可行性、落地性已經在工業領域各場景中得到了證實。目前質檢領域大多采用深度學習中的目標檢測算法。因為深度學習目標檢測方向在社會上用處廣泛，為生活提供了極大的便利，得到了大眾廣泛的認可。雖然通用性極強的目標檢測算法應用在了各行各業，但是其在工業領域的弊端逐漸呈現了出來，深度學習能在自然場景中取得極大的進展不單單是算法上不斷地迭代進步，與算法并駕齊驅的還有其所依賴的龐大的標注數據集。也就是說，監督算法極其依賴標注數據集，需要大量的數據供神經網絡進行學習，一個好的數據集直接影響模型的精度。然而數據集收集困難是目標檢測在大多數工業領域遇到的難點之一。

　　有人會說沒有數據，慢慢積累不就好了嗎?確實，積累數據的確是一種方法，但是積累數據存在時間跨度上的問題，想要積累出一個高精度的模型，需要大量時間，因為質量標準要求高的工業視覺缺陷檢測場景中，很少能產出缺陷零件，更別說能積累出零件各個位置上所有可能出現的各種形態缺陷的數據集。而且此時間跨度對于整個項目與客戶都是不可接受的。

　　目前，使用深度學習目標檢測進行工業缺陷檢測時，主要有以下缺點：

　　(1)缺陷未知性：由于缺陷的成像有位置、形狀、光源等影響因素在，不同因素會組合成各種各樣的缺陷，將使得AI目標檢測算法學習起來變得異常困難。只能不斷增加已知的缺陷類別，如果將來出現未知類型的缺陷類別，設備將失去其該有的作用，可能會給生產方帶來損失。

　　(2)缺陷收集困難：缺陷數據集收集困難，人造或合成的缺陷與真實缺陷相差大，存在低質量樣本數據，數據收集周期較長，可能持續推遲設備的交付日期，這使得生產方將在人力成本上繼續投入，且項目前期誤檢漏檢情況出現頻繁，使得使用方對設備檢測能力的信心出現動搖，這將違背深度學習在工業領域的初衷，為企業提供智能化、無人化的工廠，減小過程成本。

　　(3)低頻缺陷攔截困難：即使是已知且數據集充足類別的缺陷，也會出現與此種類別特征不相近的缺陷，可能出現漏檢情況

　　基于以上問題點，異常檢測算法應用在工業質檢行業的優勢就涌現了出來，因為無監督算法的特性在，可以繞開目標檢測算法在工業領域遇到的部分問題。

　　異常檢測算法優勢：

　　(1)異常檢測是無監督算法，不需要缺陷數據集，僅需要ok數據集即可，部分異常檢測算法僅需要少量ok數據集，避免了收集缺陷困難的問題。

　　(2)不需要對各類別各形態缺陷進行定性，避免了新類別或新特征不能檢出問題，避免了難區分缺陷類別的認定。

　　鑒于以上問題，通過深度學習異常檢測算法，避免了低頻缺陷數據集收集困難，未知類別缺陷難攔截的問題，并在缺陷數據集不足的情況下，能夠很好的解決檢出問題。對于工業領域的零漏檢的高標準要求更進一步。有效的減少了項目周期，更加快速的給企業帶來生產環節上的效益增長。

　　異常檢測：

　　異常是指偏離預期的事件或項目。與標準事件的頻率相比，異常事件的頻率較低。產品中可能出現的異常通常是隨機的，例如顏色或紋理的變化、劃痕、錯位、缺件或比例錯誤。

　　異常檢測(Anomaly Detection)也稱偏差(deviation)檢測或者離群點(outlier)檢測，從數據的角度來看，其實就是檢測出和眾多其他觀測值差別非常大的一個特殊的觀測值。異常檢測在歷史上實際是數據預處理的一個步驟，但是在現代研究中越來越重要，逐漸發展為一個獨立的領域。

　　無監督異常檢測：

　　沒有標簽情況下，往往目標是將一個得分或標號賦予給每個數據對象。比如聚類算法，根據一些規則將數據進行無監督的聚類。簡單直白地講，如果聚類簇比較偏遠，或者密度比較少，可能就是異常。類似查找圖像離群點算法如孤立森林、SVM等。但是基于檢測圖像中離群點是不穩定的，由于零件本身形態特性復雜，很多時候不能區分開正常點與離群點。

　　以前基于深度學習的工作主要集中在生成算法，如生成對抗網絡(GAN)或變分自動編碼器(VAEs) 。無監督生成模型通過學習真實數據的本質特征，刻畫出樣本數據的分布特征，生成與訓練樣本相似的新數據。模型能夠發現并有效地內化數據的本質，并生成這些數據。生成式模型可以用于在沒有目標類標簽信息的情況下捕捉觀測到可見數據的高階相關性。

　　如基于生成對抗網絡(GAN)或變分自動編碼器(VAEs)的生成網絡，在該網絡中，編碼器接受輸入數據，并將其壓縮為潛伏空間表示，然后解碼器將從該空間重構輸入數據。

　　VAE將圖像轉換為統計分布的參數：均值和方差。然后，VAE使用均值和方差參數隨機采樣分布的一個元素，并將該元素解碼回原始輸入。該過程的隨機性提高了魯棒性并迫使潛在空間在任何地方編碼有意義的表示：在潛在空間中采樣的每個點被解碼為有效輸出。

　　基于GAN的網絡比較經典的如AnoGAN,它有兩個對抗模型：生成網絡和判別網絡。生成網絡G從潛在空間中隨機采樣(隨機產生噪聲)作為輸入，其輸出結果需要盡量模仿訓練集中的真實樣本。判別網絡D的輸入則為真實樣本與生成網絡的輸出，輸出為一個標量，代表其為真實樣本而不是生成樣本的可能性，其目的是將生成網絡的輸出從真實樣本中盡可能分辨出來。生成網絡要盡可能地欺騙判別網絡。兩個網絡相互對抗、不斷調整參數，最終目的是使判別網絡無法判斷生成網絡的輸出結果是否真實。生成器G看成解碼器decoder，辨別器D視為編碼器encoder(AE)。在測試階段，輸入原始圖像，生成器輸出與原圖比對可以找到異常區域，辨別器輸出又可以作為異常值，超過一定閾值則可認為是異常樣本。

　　盡管它們是異常檢測基于逐像素重建誤差或評估模型概率密度分布的一種有效方法，但是其應用在檢測領域可能存在負面效果，即通過比較重構出來的圖像之間的像素值的差值來確定是否異常是不穩定的，因為存在形態重構正常但是像素值大小有差異的情況，如此求差的話將產生異常區域，但這種情況其實是在正常區域發生的。