03.11., 10.11, 17.11. und 24.11.2021 | UMA | Natural Language Processing

Natural Language Processing

Ein Online-Kurs der Universität Mannheim

Termine:
Mittwoch, 03.11.2021, von 14:00 – 15:30 Uhr
Mittwoch, 10.11.2021, von 14:00 – 15:30 Uhr
Mittwoch, 17.11.2021, von 14:00 – 15:30 Uhr
Mittwoch, 24.11.2021, von 14:00 – 15:30 Uhr

Format:
Lehrvideos und Online Kurs mit praktischen Übungen

Inhalte:
Dieser Kurs vermittelt Grundlagen in der automatischen Textanalyse (eng. „Natural Language Processing“ bzw. NLP). Er beginnt mit einer Einführung in typische Anwendungsfälle von NLP aus der Industrie sowie der Vorstellung einer prototypischen Preprocessing-Pipeline zur Ermöglichung weiterführender Analysen. Anschließend wird die automatische Klassifikation von Dokumenten in vordefinierte Kategorien (z.B. „positiv“ und „negativ“) mit Machine-Learning-Algorithmen behandelt. Abschließend werden fortgeschrittene Methoden (Topic Models und Word Embeddings) zur numerischen Darstellung der Semantik, also Bedeutung, von Text behandelt.

Methoden:
Anhand von Vorlesungsvideos, Online-Meetings, Literatur und praktischen Coding-Aufgaben werden Grundlagen des Natural Language Processing (NLP) vermittelt. Als Programmiersprache wird hierzu Python dienen. Die Teilnehmenden lernen, wie sie Elemente einer protoypischen Pipeline zur Aufbereitung von Textdaten mittels der Python-Bibliothek „Natural Language Toolkit“ (NLTK) eigenständig implementieren können. Als Beispiel-Daten werden wir auf Jahresberichte von Unternehmen zurückgreifen. Die automatische Textklassifikation wird mit der Bibliothek „scikit-learn“ vermittelt. Als Daten-Grundlage hierfür werden Produkt-Reviews dienen. Die weiterführenden Methoden zur Darstellung von Semantik werden schließlich mithilfe der Bibliothek „gensim“ implementiert.

Zielgruppe:
Alle, die mehr über die automatische Verarbeitung unstrukturierter (d.h. Text-) Daten erlernen wollen und bereits über Grundkenntnisse in der Programmiersprache Python verfügen.