Název:
Detekce částečně zakrytého obličeje v obrazových datech
Překlad názvu:
Detecting a Partially Obscured Face in Image Data
Autoři:
Kedra, David ; Sakin, Martin (oponent) ; Goldmann, Tomáš (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2023
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Tato bakalářská práce se zabývá analýzou problémů kamerových systémů při detekci částečně zakrytých obličejů a rozebírá současné detektory strojového učení. Smyslem bylo hledat řešení, která napomáhají detekcím tváří i se zhoršenou viditelností. Z tohoto důvodu byly generováním umělých zakrytí upraveny datasety, na kterých se trénovaly modely YOLOv7, YOLOv7-tiny a RetinaNet. Představena je počítačová aplikace uplatňující tyto detektory. Modely jsou srovnány s existujícími řešeními z hlediska kvality a rychlosti. Na většině testovacích datasetů lépe obstávají natrénované modely. YOLOv7 je při minimálním IoU 50 % nejpřesnější na upravených sadách WIDER FACE i UFDD, a to s průměrnými preciznostmi 86 % a 89 %. Na třetím datasetu s rouškami však modely překonává existující detektor RetinaFace. Dle poměru rychlosti a kvality působí nejefektivněji YOLOv7-tiny.
This bachelor thesis deals with the analysis of problems related to detecting partially occluded faces in camera systems and discusses current machine learning detectors. The aim was to find solutions useful for detecting hardly visible faces. For this reason, artificial occlusions were generated into datasets for training the YOLOv7, YOLOv7-tiny and RetinaNet models. A computer application that uses these detectors is presented. The models are compared with existing solutions in terms of quality and speed. The trained models perform better on most test datasets. YOLOv7 is the most accurate on the modified WIDER FACE and UFDD datasets with average precisions of 86 % and 89 % at a minimum IoU of 50 %. On the third dataset with face masks, the existing detector RetinaFace outperformes the others. According to the speed/quality ratio, YOLOv7-tiny is the most effective.
Klíčová slova:
detekce obličeje; detektor objektů; hluboké učení; kamerový systém; konvoluční neuronové sítě; neuronové sítě; Python; PyTorch; ResNet; RetinaNet; strojové učení; umělá inteligence; YOLO; částečné zakrytí; artificial intelligence; camera system; convolutional neural networks; deep learning; face detection; machine learning; neural networks; object detector; partial occlusion; Python; PyTorch; ResNet; RetinaNet; YOLO
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/211054