Data Engineer/Analyst (m/w/d)

Jobriver HR Service

Internet, IT

Berlin

Art der Beschäftigung: Vollzeit
67.000 € – 83.500 € (von XING geschätzt)
Vor Ort
Aktiv auf der Suche

Über diesen Job

Data Engineer/Analyst (m/w/d)

Berlin

Vor Ort

Vollzeit

Mid-Level

vor 51 Tagen

Aktualisiert vor 45 Tagen

42.000 € – 63.000 € / Jahr

Beschreibung

Das Unternehmen ist ein innovatives High-Tech-Unternehmen mit Sitz in Berlin, das sich auf die Entwicklung und Vermarktung von Produkten und Schlüsseltechnologien in der maritimen und Offshore-Technik spezialisiert hat. Die Expertise des Unternehmens umfasst Robotik, High-Tech-Sensorik, künstliche Intelligenz, fortgeschrittene Informatik, Kommunikationstechnologie sowie Positionierung. Gegründet im Jahr 2000 von international renommierten Entwicklungsexperten und Wissenschaftlern, hat sich das Unternehmen kontinuierlich weiterentwickelt und ist stolz auf seine Technologieführerschaft in der Meeresforschung, smarten Robotik und maritimen Sicherheit. In dieser Rolle als Data Engineer/Analyst sind Sie verantwortlich für das Entwerfen, Erstellen und Warten von skalierbaren Datenpipelines sowie ETL/ELT-Workflows. Sie implementieren Active-Learning-Workflows, Pre-Labelling-Pipelines und Feedback-Loops zur Verbesserung der Annotationseffizienz. Zudem integrieren Sie Daten aus verschiedenen Quellen und stellen die Datenqualität, Zuverlässigkeit und Verfügbarkeit sicher. Sie entwickeln automatisierte Validierungs-, Monitoring- und Observability-Mechanismen für daten- und ML-gestützte Labeling-Prozesse und arbeiten eng mit Analytics-, ML- und Produktteams zusammen, um kuratierte Datensätze für Reporting und Modellentwicklung bereitzustellen. Das Unternehmen bietet ein angenehmes Arbeitsumfeld in einem hochmotivierten Team mit abwechslungsreichen Aufgaben und hoher Eigenverantwortung, sowie ein unbefristetes Arbeitsverhältnis mit flexiblen Arbeitszeiten und einem attraktiven Gehaltspaket.

Anforderungen

Der ideale Kandidat verfügt über ein abgeschlossenes Studium im Bereich Informatik, Ingenieurwesen oder einer vergleichbaren Fachrichtung. Sie haben Erfahrung mit Python für Datenverarbeitung, Pipeline-Entwicklung und Automatisierung von ML-Workflows. Vertrautheit mit SQL und allgemeinen Datenbankkonzepten ist erforderlich, um Daten abzufragen, zu transformieren und zu validieren. Praktische Erfahrung mit ETL/ELT-Prozessen und Orchestrierungs-Tools wie Airflow, dbt oder Prefect wird vorausgesetzt. Zudem sollten Sie Erfahrung mit Cloud-Datendiensten und verteilten Datenverarbeitungs-Frameworks mitbringen. Kenntnisse in Active-Learning-Prinzipien, Datenlabeling-Strategien und Annotations-Tools sind von Vorteil. Ein grundlegendes Verständnis von ML-Konzepten, einschließlich Modelllebenszyklus, Feature-Pipelines und Evaluationsmethoden, ist ebenfalls wichtig. Erfahrung mit MLOps-Konzepten wie Modell-/Datenversionierung, Monitoring und Reproduzierbarkeit sowie mit CI/CD-Praktiken und Infrastructure-as-Code-Tools wie Terraform oder CloudFormation runden Ihr Profil ab. Persönlich zeichnen Sie sich durch Teamfähigkeit, analytisches Denken und eine hohe Kommunikationskompetenz aus.