Určování biologických druhů ve volné přírodě s využitím umělé inteligence

Date issued

2023

Journal Title

Journal ISSN

Volume Title

Publisher

Západočeská univerzita v Plzni

Abstract

Tato práce se zabývá vývojem a výzkumem metod počítačového vidění a konstrukcí datových korpusů využitelných k automatické identifikaci a lokalizaci biologických druhů v přirozeném prostředí a čase. Jedná se tedy o rozpoznávání tzv. ve volné přírodě, jenž při- náší značné množství výzev v porovnání s rozpoznáváním v laboratorních podmínkách. Zmíněné výzvy v kontextu jejich možného uplatnění při monitorování biologické rozmanitosti, ochraně přírody a potenciálně i zdravotnictví zahrnují: (i) vysokou vizuální podobnost různých biologických organismů a jejich částí, (ii) možnost pozorovat jejich různé části z mnoha úhlů, či v různých ročních obdobích, (iii) nevyváženosti v rozložení druhů, (iv) rozdílné následky chybných rozhodnutí, tj. záměna jedovatých druhů za neškodné, a (v) důležitost interpretovatelnosti výsledků. V této práci je popsáno několik nových metod a přístupů strojového učení a počítačového vidění vhodných pro různé případy použití, tj. anotaci fotografií korálových útesů, sledování míry zamoření včelínů Kleštím včelím a automatickou identifikací biologických druhů. Pro popis fotografií korálových útesů pořízených pod vodou byl vyvinut automatický systém pro detekci, klasifikaci a segmentaci jednotlivých substrátů založený na metodě Mask R-CNN a řadě triků. K automatickému sledování míry zamoření včelstev Kleštíkem včelím je navržen přímočarý přístup, který využívá kombinaci prahování a vlastní architektury konvoluční sítě. Díky integraci systému do mobilní aplikace existuje reálný potenciál nahradit běžně používané manuální vyhodnocování, jenž je časově náročné a nepřesné, ale i existující metody založené na počítačovém vidění. Algoritmy navržené pro identifikaci biologických druhů jsou založeny především na hlubokých neuronových sítích a metodách učení s učitelem vyžadující relativně vysoké množství označených dat. Nedostatečná kvalita stávajících datových sad, nebo jejich absence, vedly k vytvoření nových datových sad (DanishFungi 2020, SnakeCLEF a CVarroaDestructor) s celou řadou jedinečných vlastností, které umožňují jejich využitelnost i nad rámec identifikace živočišných druhů. Práce potvrzuje, že nově navržené datové sady s nejmodernějšími architekturami hlubokých neuronových sítí zajišťují dostatečnou odolnost vůči mnoha negativním vlivům spojeným s identifikací druhů ve volné přírodě a poskytují dostatečnou přesnost rozpoznávání. Pro inkrementální zvýšení přesnosti state-of-the-art metod, zlepšení interpretovatelnosti výsledků a omezení záměn jedovatých druhů za neškodné jsme (i) použili pokročilé optimalizační strategie, (ii) připravili techniku pro integraci metadat o pozorování do rozhodnutí a (iii) navrhli nové ztrátové funkce. Algoritmy popsané v této práci se umístily na předních místech v několika celosvětových soutěžích (PlantCLEF, FGVCx Flower, FGVCx Fungi, apod.) zaměřených na automatizaci identifikace a lokalizace biologických druhů.

Description

Subject(s)

cnn, transformers, machine learning, computer vision, fungi, plants, snakes, apiculture, classification, recognition, species recognition, fine-grained; artificial intelligence

Citation

OPEN License Selector