Jobsuche

Externer Stellenmarkt Angebote für Studierende

25 km

Informationen zur Anzeige:

Abschlussarbeit: "Implementierung eines Modells zur gezielten Datenextraktion und -klassifikation aus Textdokumenten"
Abtsgmünd
Aktualität: 08.11.2024

Anzeigeninhalt:

08.11.2024, Kessler & Co. GmbH & Co. KG
Abtsgmünd
Abschlussarbeit: "Implementierung eines Modells zur gezielten Datenextraktion und -klassifikation aus Textdokumenten"
Aufgaben:
Trotz weitgehend digitalisierter Prozesse fallen in einigen Verwaltungsbereichen immer noch große Mengen an heterogenen Textdokumenten an. Das manuelle Abarbeiten dieser Dokumente (z.B. Rechnungen und Lieferscheine) ist zeitaufwändig und fehleranfällig. Moderne Methoden des maschinellen Lernens bieten vielversprechende Ansätze, um diesen Prozess zu automatisieren. Durch die Nutzung eines bereits implementierten Workflow-Automation-Tools und einer integrierten Texterkennungs-Technologie (Optical Character Recognition, kurz OCR) können Dokumente in maschinenlesbare Zeichenketten umgewandelt werden. Die Herausforderung besteht nun darin, aus diesen Rohdaten gezielt die für die Weiterverarbeitung relevanten Informationen zu extrahieren und zu klassifizieren. Entwicklung und Implementierung eines Modells zur Extraktion und Klassifikation relevanter Informationen aus Textdokumenten basierend auf maschinellem Lernen, Natural Language Processing (NLP), regelbasierten Algorithmen oder einer Kombination aus den genannten Vergleich und Evaluation der Modelle anhand von Kriterien wie Genauigkeit, Effizienz und Robustheit Sicherstellung einer reibungslosen Schnittstelle zwischen dem Workflow-Automation-Tool und dem entwickelten Modell Dokumentation der Implementierung sowie der Evaluationskriterien und -ergebnisse
Qualifikationen:
Student (m/w/d) der Informatik, Wirtschaftsinformatik, Data Science oder eines vergleichbaren Studiengangs Idealerweise Erfahrung mit der Programmiersprache Python sowie einschlägigen Machine-Learning-Bibliotheken (z.B. scikit-learn, TensorFlow, oder PyTorch) Kenntnisse im Bereich NLP, insbesondere in der Textvorverarbeitung, Merkmalsextraktion und Klassifikation wünschenswert Kenntnisse im Bereich verteilte Systeme bzw. deren Schnittstellen (z.B. REST-API, MQTT, ...) sind von Vorteil Interesse an der Datenverarbeitung und Automatisierung von Geschäftsprozessen Analytisches und strukturiertes Denkvermögen sowie Kommunikationsstärke

Standorte

Abschlussarbeit: "Implementierung eines Modells zur gezielten Datenextraktion und -klassifikation aus Textdokumenten"

Drucken
Abtsgmünd