Für die Hauptabteilung Digitale Bibliothek/Abteilung Langzeitarchivierung suchen wir zum Eintritt ab 2.1.2023, befristet bis 31.12.2027, eine/n engagierte/n Webarchiv Crawl Engineer (20 Stunden/Woche).



Die Österreichische Nationalbibliothek archiviert laufend den österreichischen Webspace, um das digitale kulturelle Erbe langfristig zu erhalten und zugänglich zu machen. Domain-Crawls bzw. Crawls ausgewählter Webseiten finden in unterschiedlicher Intensität statt. Weitere Informationen zum Webarchiv finden Sie unter https://webarchiv.onb.ac.at/.

Webarchiv Crawl Engineer
(20,00 Stunden/Woche)

Ihre Aufgaben
Einrichtung, Konfiguration und Monitoring von Crawls unterschiedlicher Webseiten mit bestehender Open Source Software des Webarchivs (z.B. Domain Crawls der .at Domäne, Crawls ausgewählter Webseiten)
Qualitätskontrolle der archivierten Webseiten und Verbesserung der Crawls
Datenanalyse, Logfileanalyse und Reporting
Durchführung von Datenimporten und -exporten

Unsere Anforderungen
Abgeschlossene IT-Ausbildung (z.B. HTL) und/oder relevante Berufserfahrung
Kenntnisse zu Webtechnologien (HTML, JavaScript, etc.) und Internetprotokollen (http)
Erfahrung in Unix Shell Scripting
Erfahrung mit Webcrawlern, Scrapern, Python, Java von Vorteil
Analytische Fähigkeiten, z.B. um Strukturen von Webseiten zu erkennen
Strukturierter, kooperativer sowie serviceorientierter Arbeitsstil
Englischkenntnisse zum Austausch innerhalb der internationalen Webarchiv Community

Bewerbungen
Ausschließlich online über unser Jobportal mit Angabe Ihrer Gehaltsvorstellung.

Das Jahresbruttogehalt für diese Position auf Basis 20h/Woche liegt bei mindestens EUR 18.200,- mit der Bereitschaft zur Überzahlung, abhängig von Qualifikation und Berufserfahrung.