Název:
Sémantická segmentace obrazu pomocí konvolučních neuronových sítí
Překlad názvu:
Semantic segmentation of images using convolutional neural networks
Autoři:
Špila, Filip ; Věchet, Stanislav (oponent) ; Krejsa, Jiří (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2020
Jazyk:
eng
Nakladatel: Vysoké učení technické v Brně. Fakulta strojního inženýrství
Abstrakt: [eng][cze]
Tato práce se zabývá rešerší a implementací vybraných architektur konvolučních neuronových sítí pro segmentaci obrazu. V první části jsou shrnuty základní pojmy z teorie neuronových sítí. Tato část také představuje silné stránky konvolučních sítí v oblasti rozpoznávání obrazových dat. Teoretická část je uzavřena rešerší zaměřenou na konkrétní architekturu používanou na segmentaci scén. Implementace této architektury a jejích variant v Caffe je převzata a upravena pro konkrétní použití v praktické části práce. Nedílnou součástí tohoto procesu jsou kroky potřebné ke správnému nastavení softwarového a hardwarového prostředí. Příslušná kapitola proto poskytuje přesný návod, který ocení zejména noví uživatelé Linuxu. Pro trénování všech variant vybrané sítě je vytvořen vlastní dataset obsahující 2600 obrázků. Je také provedeno několik nastavení původní implementace, zvláště pro účely použití předtrénovaných parametrů. Trénování zahrnuje výběr hyperparametrů, jakými jsou například typ optimalizačního algoritmu a rychlost učení. Na závěr je provedeno vyhodnocení výkonu a výpočtové náročnosti všech natrénovaných sítí na testovacím datasetu.
This thesis deals with the research and implementation of selected architectures of Convolutional Neural Networks (CNNs) for image segmentation. The fundamental terms from the theory of neural networks are summarized in the first part. It also presents the power of CNNs in the field of image data classification. The theoretical part concludes with the research focused on the particular network architecture and its variants used for scene segmentation. In the practical part, the Caffe implementation of the network is taken from its authors and tailored to the specific needs of this study. The steps required to properly set up the software and hardware environments are an essential part of the process. Therefore, the corresponding chapter gives a step-by-step guide that is especially helpful to new Linux users. A custom dataset containing 2600 segmented images is created and used for training all variants of the selected network. Several adjustments of the original implementation are performed, especially for applying the method of using pre-trained parameters of the networks. The training phase includes a selection of hyperparameters, such as the type of optimization algorithm. Finally, the performance and computational cost of the variants of the trained network are evaluated on a testing dataset.
Klíčová slova:
Caffe; convolutional neural networks; SegNet; semantic segmentation; Ubuntu; Caffe; konvoluční neuronové sítě; SegNet; sémantická segmentace; Ubuntu
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/192992