Computer Vision

Fakult?t

Ingenieurwissenschaften und Informatik

Version

Version 8.0 vom 23.02.2023

Modulkennung

11B1121

Modulname (englisch)

Computer Vision

Studieng?nge mit diesem Modul
  • Informatik - Medieninformatik (B.Sc.)
  • Informatik - Technische Informatik (B.Sc.)
  • Elektrotechnik (B.Sc.)
  • Mechatronik (B.Sc.)
  • Elektrotechnik im Praxisverbund (B.Sc.)
  • Lehramt an berufsbildenden Schulen - Teilstudiengang Informationstechnik (M.Ed.)
Niveaustufe

2

Kurzbeschreibung

Das Sehen und Verstehen einer realen Szene f?llt unserem menschlichen visuellen System sehr einfach, doch wie erlernt ein Computer dieses? Der Fachbegriff für das künstliche Sehen hei?t Computer Vision und beinhaltet mehr als die Aufnahme der realen Welt mittels Foto- und Videokamera. Vielmehr ist das Verstehen des aufgenommenen Bildes die gr??te und rechenintensivste Herausforderung von Computer Vision. Ohne künstliches Sehen und Verstehen w?ren Anwendungen wie Mensch-Roboter-Kooperationen, Gesichtserkennung, bildbasierte 3D Rekonstruktion und automatisiertes Fahren nicht zu realisieren.

Im Rahmen des Kurses lernen Sie Verfahren kennen, die Computern das Verstehen von bildpunktbasierten Aufnahmen erlauben. Ausgehend von den Pixeln des Aufnahmechips werden Sie zun?chst klassische Verfahren wie Template Matching, SIFT, SURF und HOG anwenden. Künstliche Intelligenz (KI) gepaart mit den im Internet verfügbaren Bilddaten erm?glichen der modernen Computer Vision die klassischen Verfahren in den Schatten zu stellen. Deshalb erlernen Sie erg?nzend die grundlegenden Konzepte der KI-basierten Computer Vision wie Convolutional Neural Networks, die Handschriften erkennen k?nnen, oder Generative Adversarial Networks, die Gesichter ver?ndern k?nnen. Mit dem Wissen aus der Vorlesung und den Erfahrungen aus dem Praktikum k?nnen Sie jeden Computer bzw. jedes Smartphone mit einer Kamera zu einem visuellen System machen, das sieht und versteht.

Lehrinhalte
  1. Von Pixeln zu semantischen Symbolen
  2. Objekterkennung und -wiedererkennung
  3. Echtzeitf?hige Computer Vision – vektorisierte Algorithmen & GPU-Anwendungen
  4. Bildklassifizierung
  5. Bildsegmentierung
Lernergebnisse / Kompetenzziele

Wissensverbreiterung
Die Studierenden, die dieses Modul erfolgreich studiert haben, kennen und verstehen aktuelle Verfahren der Computer Vision und k?nnen diese mittels existierender Frameworks umsetzen. Sie kennen die wesentlichen Verfahren, um neuronale Netze auf Bilddaten anzuwenden.
Wissensvertiefung
Kenntnisse auf dem Gebiet der Algorithmenentwicklung werden vertieft und Wissen im Bereich der Videotechnik wird erweitert.
K?nnen - instrumentale Kompetenz
Die Studierenden sind in der Lage, Objekterkennungen und Bildklassifizierung in C++ mittels Frameworks wie OpenCV zu implementieren. Ferner k?nnen die Studierenden Convolutional Neural Networks mittels Frameworks wie Keras designen und basierend auf eigenen Bilddatens?tzen trainieren.
K?nnen - kommunikative Kompetenz
Die Studierenden k?nnen die Komplexit?t und Anwendbarkeit von Verfahren der Computer Vision absch?tzen und sich fachlich über diese austauschen. Ferner k?nnen Sie fachfremden Personen einen ?berblick über die Verfahren geben.
K?nnen - systemische Kompetenz
Die Studierenden k?nnen Datens?tze für aktuelle neue KI-basierte Verfahren aufbauen und den Trainingsaufwand absch?tzen. Sie k?nnen für vorgegebene Anwendungsszenarien passende Verfahren der klassischen und KI-basierten Computer Vision identifizieren und mit vorhandenen Verfahren kombinieren.

Lehr-/Lernmethoden

Die Veranstaltung gliedert sich in einen Vorlesungs- und einen Praktikumsteil. Die Studierenden erarbeiten unter Anleitung Computer Vision Systeme und analysieren deren Schwachstellen. Ab dem zweiten Drittel des Semesters implementieren die Studierenden einen vorgegebenen Algorithmus eines Forschungspapiers und reproduzieren dessen Ergebnisse.

Empfohlene Vorkenntnisse

Mathematik 1, 2 und ggf. Mathematik 3 (I), Programmierung 1 und 2

Modulpromotor

Sch?ning, Julius

Lehrende

Sch?ning, Julius

Leistungspunkte

5

Lehr-/Lernkonzept
Workload Dozentengebunden
Std. WorkloadLehrtyp
30Vorlesungen
30Labore
Workload Dozentenungebunden
Std. WorkloadLehrtyp
20Veranstaltungsvor-/-nachbereitung
25Literaturstudium
20Prüfungsvorbereitung
25Vorbereitung Labore
Literatur

Dawson-Howe, Kenneth. A practical introduction to computer vision with opencv. John Wiley & Sons, 2014.Kaehler, Adrian, and Gary Bradski. Learning OpenCV 3: computer vision in C++ with the OpenCV library. " O'Reilly Media, Inc.", 2016.Dadhich, Abhinav. Practical Computer Vision: Extract Insightful Information from Images Using TensorFlow, Keras, and OpenCV. Packt Publishing Ltd, 2018.Géron, Aurélien. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. O'Reilly Media, 2019.

Prüfungsleistung
  • Mündliche Prüfung
  • Praxisbericht, schriftlich
Unbenotete Prüfungsleistung

Experimentelle Arbeit

Dauer

1 Semester

Angebotsfrequenz

Unregelm??ig

Lehrsprache

Deutsch und Englisch