色婷婷狠狠18禁久久YY,CHINESE性内射高清国产,国产女人18毛片水真多1,国产AV在线观看

掃一掃識別圖片信息的功能如何實現的?背后有哪些原理?

林子帆2年前17瀏覽0評論

分類學危機

目前,手機的掃一掃功能可以幫助我們識別商品信息,識別花的名稱,識別各種動物。這背后有一系列的技術支持。物種識別需要什么樣的技術?識別的過程中用到哪些核心算法和理論?這都是大多數人不知道的。不過,物種識別理論與算法多種多樣,針對不同的東西用到的識別算法也不相同,因此本文著重帶大家了解其中一種算法和理論。即利用神經網絡進行動物的識別。

動物識別涉及生物分類,只有生物學家已經把生物的類別分好了,計算機才能在此基礎上進行物種的劃分與識別。

不過,生物分類學降低了我們對生物多樣性的理解。我們知道幾乎所有分類信息都存在大量的高級專業知識和詞匯,這讓人不易理解,造成知識傳播困難,尤其那些熱愛科普的但不是專業科學家的人一看到到專業詞匯就會頭大。

因此,生物分類知識被局限在有限的地理區域內和有限數量的分類學家中。缺乏向公眾提供分類學知識的機會被稱為“分類學危機”。

計算機要出來解決這個分類學危機了。

分類學家一直在尋找更有效的方法來滿足物種識別的要求,例如開發數字圖像處理和模式識別技術。目前,研究人員擁有昆蟲,植物,蜘蛛和浮游生物的識別技術。這種方法可以進一步擴展到基于現場的生物識別,例如魚類。這些方法有助于緩解“分類危機”。

計算機科學家也設計了一種簡單有效的算法,并定義了一系列將特征識別與人工神經網絡設計(ANN)結合使用的新功能。

那么這個算法可以識別哪些物種呢?可以識別魚類,植物,和蝴蝶。

基于模式識別理論和典型的自動物種識別系統中使用的基本計算機處理路徑,計算機科學家設計了一個用于物種水平自動個體識別的系統。該系統將預處理和提取組件與訓練和識別過程共享。

訓練圖像的特征用于在特征提取之后建立分類進度模式的模型。然后將這些特征和經過訓練的模型記錄在數據庫中,并結合到后續照片的分析中。該過程使用兩種類型的數據對圖像特征進行建模,從而獲得更好的物種識別結果。

當用這種算法去訓練如何識別一個動物時,計算機首先會去除圖像背景,并轉換為灰度。之后應用各種濾鏡消除圖像噪聲來改善圖像,然后將圖像縮小。接下來,將處理后的圖像輪廓化,然后繪制骨骼。上面這些步驟都可使用MATLAB語言中的圖像處理模塊完成。

處理完圖片后,就會對圖片中的動物進行特征提取。這些特征包括幾何,形態和紋理特征,這些特征可以通過圖像處理有效地提取,并且對于物種而言是唯一的。必須確保這些特征是該物種唯一的特征,這樣才能提高識別精準度。

幾何特征提取就得用到數學的功力了。基本上進行4步計算。分別計算樣本區域的像素總數,圖像像素周長,圖像直徑,圖像緊密度。下面的圖中展示了這4步數學公式,不過讀者只需了解無需深究。

隨后,算法需要處理圖像的紋理。紋理是用于均勻描述區域的重要視覺圖案。直觀的度量提供諸如平滑度,粗糙度和規則性之類的屬性。紋理取決于圖像的分辨率,可以遵循兩種方法:統計和頻率。這個算法則使用統計近似值,其中統計值被分析為一階和二階。

從圖像的灰度直方圖獲得統計一級。每個值除以像素總數,就會得到一個新的直方圖,該直方圖表示在需要識別的區域中顯示確定的灰度級。

當然這也需要大量數學公式支持,考慮到不想讓大家頭大,直接跳過。不過我們最好知道處理圖像紋理時用到了哪些公式,這些是方差公式,中位數公式,均勻度公式,同質公式,慣量公式等。有興趣的可以自行了解。

接著要對圖像的形態特征進行處理。

形態特征是那些集中于像素組織的特征。它們分為兩類:二維笛卡爾矩和歸一化中心矩。

分析圖像的特征結構對于物種級別的識別非常重要,因為人眼區分物種的直觀感受就是物種的特征,而算法要做的就是代替人眼完成這些過程。

接下來就用到人工神經網絡了。

先來講講什么叫人工神經網絡,人工神經網絡簡稱神經網絡類神經網絡,在機器學習和認知科學領域,是一種模仿生物神經網絡結構和功能的數學模型或計算模型。

神經網絡由大量的人工神經元聯結進行計算。大多數情況下人工神經網絡能在外界信息的基礎上改變內部結構,是一種自適應系統,通俗的講就是具備學習功能。神經網絡目前也具有情感功能,用到極其復雜的數學計算。

神經網絡可以解決很多問題,例如機器視覺和語音識別。這些問題都是很難被傳統基于規則的編程所解決的。本文討論的物種識別就是如此,普通編程無法解決。

單層神經元網絡是最基本的神經元網絡形式,由有限個神經元構成,所有神經元的輸入向量都是同一個向量。由于每一個神經元都會產生一個標量結果,所以單層神經元的輸出是一個向量,向量的維數等于神經元的數目。

同時神經網絡還有多層神經網絡等等。

神經網絡被定義為由大量自適應處理單元組成的并行計算機模型,這些單元通過互連與變量進行通信。多層網絡具有一層或多層神經元,這些層通過從輸入圖像圖案中逐漸提取更有意義的特征來學習復雜的任務。

與其它機器學習方法相比,神經網絡學習速度較慢,但預測速度更快,并且具有非常好的非線性數據模型。簡單的感知器被分配了多個輸入,但是生成了一個輸出,類似于依賴于輸入權重的不同線性組合并生成了線性激活函數。

多層感知器由一組包含一個或多個輸入層的源節點和一組隱藏節點輸出組成。輸入信號通過網絡逐層傳播。

神經網絡結構由N個輸入N=[N1,N2,…,Nn],一個隱藏層h和一個輸出向量S=[S1,S2,…,Sm]組成。通過轉換向量S,評估每個Si二進制信號[0,1]。在反向訓練算法的基礎上,有監督的訓練階段(即S型激活)是根據權重和偏差在負梯度的方向上進行更新,然后在相反的方向上進行更新。隱藏層和輸出層的S激活函數由以下公式確定。

輸入神經元的數量由每種模式中可用的描述符數量確定,輸出神經元的數量由每個數據庫中分類的物種數量決定。為了確定給定數據圖像的最佳神經元數量,研究者已經探索了識別成功率與神經元數量之間的關系。顯然,需要大量的神經元和世代來處理每個集合中圖像的信息。隨著物種數量的增加,識別也變得更加困難。

神經網絡使用了來自圖像數據的分類物種。但是,大多數其它研究僅使用物種豐富度較低的數據庫,這些數據庫通常跨越許多不同的學科,并且由于形態特征的巨大差異而易于分類。而神經網絡以這些網絡的工作為基礎,并且所需的操作員專業知識,成本和響應時間都很低。神經網絡的物種識別準確性和可用性,可以有效識別魚類,植物,蝴蝶。

不過,物種之間的高表型相似性也會影響人工神經網絡的識別能力,這是由于某些物種的表型差異較小,這些差異僅在細微的細節上有所變化,例如牙齒或鰭半徑,這會影響分類。不過總體上。系統的總體性能達到了高精度和高精確度。具有較低物種數的物種的鑒別成功率較高,這可能由形態特征非常不同的物種而非實際物種的數量導致的。

算法會根據分類關鍵字,區分物種的字符是形態結構,顏色圖案和大小。這些觀察是個體的分類學特征。因此,某些分類學家可能會偏向任何給定特征的值,因此,可以通過使用基于機器的分類來消除人的主觀性和時間限制。

特征提取方法并不取決于人們觀察每個物種的個體標本的方式的變化,因此消除了人類的主觀性。但是,仍然需要人類分類學家來訓練定義物種的神經網絡,并減少主觀性或不確定性。