Informationen zur Anzeige:
Abschlussarbeit: "Implementierung eines Modells zur gezielten Datenextraktion und -klassifikation aus Textdokumenten"
Abtsgmünd
Aktualität: 08.11.2024
Anzeigeninhalt:
08.11.2024, Kessler & Co. GmbH & Co. KG
Abtsgmünd
Abschlussarbeit: "Implementierung eines Modells zur gezielten Datenextraktion und -klassifikation aus Textdokumenten"
Aufgaben:
Trotz weitgehend digitalisierter Prozesse fallen in einigen Verwaltungsbereichen immer noch große Mengen an heterogenen Textdokumenten an. Das manuelle Abarbeiten dieser Dokumente (z.B. Rechnungen und Lieferscheine) ist zeitaufwändig und fehleranfällig. Moderne Methoden des maschinellen Lernens bieten vielversprechende Ansätze, um diesen Prozess zu automatisieren.
Durch die Nutzung eines bereits implementierten Workflow-Automation-Tools und einer integrierten Texterkennungs-Technologie (Optical Character Recognition, kurz OCR) können Dokumente in maschinenlesbare Zeichenketten umgewandelt werden. Die Herausforderung besteht nun darin, aus diesen Rohdaten gezielt die für die Weiterverarbeitung relevanten Informationen zu extrahieren und zu klassifizieren.
Entwicklung und Implementierung eines Modells zur Extraktion und Klassifikation relevanter Informationen aus Textdokumenten basierend auf maschinellem Lernen, Natural Language Processing (NLP), regelbasierten Algorithmen oder einer Kombination aus den genannten
Vergleich und Evaluation der Modelle anhand von Kriterien wie Genauigkeit, Effizienz und Robustheit
Sicherstellung einer reibungslosen Schnittstelle zwischen dem Workflow-Automation-Tool und dem entwickelten Modell
Dokumentation der Implementierung sowie der Evaluationskriterien und -ergebnisse
Qualifikationen:
Student (m/w/d) der Informatik, Wirtschaftsinformatik, Data Science oder eines vergleichbaren Studiengangs
Idealerweise Erfahrung mit der Programmiersprache Python sowie einschlägigen Machine-Learning-Bibliotheken (z.B. scikit-learn, TensorFlow, oder PyTorch)
Kenntnisse im Bereich NLP, insbesondere in der Textvorverarbeitung, Merkmalsextraktion und Klassifikation wünschenswert
Kenntnisse im Bereich verteilte Systeme bzw. deren Schnittstellen (z.B. REST-API, MQTT, ...) sind von Vorteil
Interesse an der Datenverarbeitung und Automatisierung von Geschäftsprozessen
Analytisches und strukturiertes Denkvermögen sowie Kommunikationsstärke
Standorte