Určování biologických druhů ve volné přírodě s využitím umělé inteligence
Date issued
2023
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
Tato práce se zabývá vývojem a výzkumem metod počítačového vidění a konstrukcí datových korpusů využitelných k automatické identifikaci a lokalizaci biologických druhů v přirozeném prostředí a čase.
Jedná se tedy o rozpoznávání tzv. ve volné přírodě, jenž při- náší značné množství výzev v porovnání s rozpoznáváním v laboratorních podmínkách.
Zmíněné výzvy v kontextu jejich možného uplatnění při monitorování biologické rozmanitosti, ochraně přírody a potenciálně i zdravotnictví zahrnují:
(i) vysokou vizuální podobnost různých biologických organismů a jejich částí,
(ii) možnost pozorovat jejich různé části z mnoha úhlů, či v různých ročních obdobích,
(iii) nevyváženosti v rozložení druhů,
(iv) rozdílné následky chybných rozhodnutí, tj. záměna jedovatých druhů za neškodné,
a (v) důležitost interpretovatelnosti výsledků.
V této práci je popsáno několik nových metod a přístupů strojového učení a počítačového vidění vhodných pro různé případy použití, tj. anotaci fotografií korálových útesů, sledování míry zamoření včelínů Kleštím včelím a automatickou identifikací biologických druhů.
Pro popis fotografií korálových útesů pořízených pod vodou byl vyvinut automatický systém pro detekci, klasifikaci a segmentaci jednotlivých substrátů založený na metodě Mask R-CNN a řadě triků.
K automatickému sledování míry zamoření včelstev Kleštíkem včelím je navržen přímočarý přístup, který využívá kombinaci prahování a vlastní architektury konvoluční sítě. Díky integraci systému do mobilní aplikace existuje reálný potenciál nahradit běžně používané manuální vyhodnocování, jenž je časově náročné a nepřesné, ale i existující metody založené na počítačovém vidění. Algoritmy navržené pro identifikaci biologických druhů jsou založeny především na hlubokých neuronových sítích a metodách učení s učitelem vyžadující relativně vysoké množství označených dat.
Nedostatečná kvalita stávajících datových sad, nebo jejich absence, vedly k vytvoření nových datových sad (DanishFungi 2020, SnakeCLEF a CVarroaDestructor) s celou řadou jedinečných vlastností, které umožňují jejich využitelnost i nad rámec identifikace živočišných druhů.
Práce potvrzuje, že nově navržené datové sady s nejmodernějšími architekturami hlubokých neuronových sítí zajišťují dostatečnou odolnost vůči mnoha negativním vlivům spojeným s identifikací druhů ve volné přírodě a poskytují dostatečnou přesnost rozpoznávání. Pro inkrementální zvýšení přesnosti state-of-the-art metod, zlepšení interpretovatelnosti výsledků a omezení záměn jedovatých druhů za neškodné jsme (i) použili pokročilé optimalizační strategie, (ii) připravili techniku pro integraci metadat o pozorování do rozhodnutí a (iii) navrhli nové ztrátové funkce.
Algoritmy popsané v této práci se umístily na předních místech v několika celosvětových soutěžích (PlantCLEF, FGVCx Flower, FGVCx Fungi, apod.) zaměřených na automatizaci identifikace a lokalizace biologických druhů.
Description
Subject(s)
cnn, transformers, machine learning, computer vision, fungi, plants, snakes, apiculture, classification, recognition, species recognition, fine-grained; artificial intelligence