Natural Language Processing
Ein Online-Kurs der Universität Mannheim
Termine:
Mittwoch, 03.11.2021, von 14:00 – 15:30 Uhr
Mittwoch, 10.11.2021, von 14:00 – 15:30 Uhr
Mittwoch, 17.11.2021, von 14:00 – 15:30 Uhr
Mittwoch, 24.11.2021, von 14:00 – 15:30 Uhr
Format:
Lehrvideos und Online Kurs mit praktischen Übungen
Inhalte:
Dieser Kurs vermittelt Grundlagen in der automatischen Textanalyse (eng. „Natural Language Processing“ bzw. NLP). Er beginnt mit einer Einführung in typische Anwendungsfälle von NLP aus der Industrie sowie der Vorstellung einer prototypischen Preprocessing-Pipeline zur Ermöglichung weiterführender Analysen. Anschließend wird die automatische Klassifikation von Dokumenten in vordefinierte Kategorien (z.B. „positiv“ und „negativ“) mit Machine-Learning-Algorithmen behandelt. Abschließend werden fortgeschrittene Methoden (Topic Models und Word Embeddings) zur numerischen Darstellung der Semantik, also Bedeutung, von Text behandelt.
Methoden:
Anhand von Vorlesungsvideos, Online-Meetings, Literatur und praktischen Coding-Aufgaben werden Grundlagen des Natural Language Processing (NLP) vermittelt. Als Programmiersprache wird hierzu Python dienen. Die Teilnehmenden lernen, wie sie Elemente einer protoypischen Pipeline zur Aufbereitung von Textdaten mittels der Python-Bibliothek „Natural Language Toolkit“ (NLTK) eigenständig implementieren können. Als Beispiel-Daten werden wir auf Jahresberichte von Unternehmen zurückgreifen. Die automatische Textklassifikation wird mit der Bibliothek „scikit-learn“ vermittelt. Als Daten-Grundlage hierfür werden Produkt-Reviews dienen. Die weiterführenden Methoden zur Darstellung von Semantik werden schließlich mithilfe der Bibliothek „gensim“ implementiert.
Zielgruppe:
Alle, die mehr über die automatische Verarbeitung unstrukturierter (d.h. Text-) Daten erlernen wollen und bereits über Grundkenntnisse in der Programmiersprache Python verfügen.