深度學習是計算機視覺中的一項突破性機器學習技術。它從用戶提供的訓練圖像中學習,并可以為各種圖像分析應用程序自動生成解決方案。然而,它的主要優勢在于,它能夠解決許多過去傳統、基于規則的算法難以解決的應用程序。最值得注意的是,這些包括檢查形狀或外觀高度可變的物體,例如有機產品、高度紋理的表面或自然的戶外場景。此外,當使用現成的產品(例如我們的 Deep Learning Add-on)時,所需的編程工作量幾乎減少到零。另一方面,深度學習正在將重點轉移到處理數據、處理高質量圖像注釋和試驗訓練參數上——這些元素實際上往往占用了當今應用程序開發的大部分時間。
典型應用包括:
檢測表面和形狀缺陷(例如裂紋、變形、變色);
檢測異常或意外的樣品(例如缺失、破損或低質量的零件);
根據預定義類別(即分揀機)識別對象或圖像;
圖像中多個對象的位置、分割和分類(i.e. bin拾取);
產品質量分析(包括水果、植物、木材和其他有機產品);
關鍵點、特征區域和小物體的位置和分類;
光學字符識別。
深度學習功能的使用包括兩個階段:
訓練 – 根據從訓練樣本中學到的特征生成模型,
推理 – 將模型應用于新圖像以執行實際的機器視覺任務。
與傳統圖像分析方法的區別如下圖所示:
深度學習工具概述:
異常檢測-此技術用于檢測異常(異常或意外)樣本。它只需要一組無故障樣本來學習模型 外表正常。或者,可以添加幾個錯誤樣本以更好地定義可容忍變化的閾值。這個工具特別有用 在難以指定所有可能的缺陷類型或根本無法獲得陰性樣本的情況下。此工具的輸出為:分類結果(正常或有缺陷)、異常分數和圖像中異常的(粗略)熱圖。
特征檢測(分割)-該技術用于精確分割一類或多類像素特征。屬于每個類的像素必須由用戶在訓練步驟中標記。這種技術的結果是每個類的概率映射數組。
對象分類-此技術用于使用用戶定義的類之一識別選定區域中的對象。首先,需要提供一組標記圖像的訓練。該技術的結果是:名稱檢測到的類和分類置信度。
實例分割 – 此技術用于定位、分割和分類圖像中的一個或多個對象。訓練要求用戶繪制與圖像中的對象對應的區域,并將其分配給類。結果是檢測到的對象列表–及其邊界框、掩碼(分段區域)、類ID、名稱和隸屬度概率。
字符識別–此技術用于定位和識別圖像中的字符。結果是找到的字符列表。







