Die Idee, meine Blatt-Sammlung zu veröffentlichen gärte schon einige Jahre, bis ich mich Ende 2022 endlich ernsthaft darum kümmerte. Dabei hatte ich die Vollständigkeit der Sammlung leider ziemlich überschätzt. Lediglich knapp ein Viertel Exemplare (63 Stück) kamen zusammen.
Die Hefte wurden entklammert und jeder Bogen mit jeweils vier Blatt-Seiten auf einem DIN A3-Scanner eingescannt. Vielen Dank an die Firma
Oberländer, die hervorragende Arbeit leistete und mir auch im Preis sehr entgegen kam.
Die Selektion der einzelnen Seiten aus den scans geschah automatisiert mit jpegtran und manuell mit gimp.
Die PDFs wurden zusammengebaut mittels freepdfconvert und in Text-PDFs umgewandelt via pdf2go. Die Druckqualität der Hefte ist teilweise nicht sehr OCR-freundlich. Das wirkt sich natürlich auch auf die Textsuche und copy/paste von Texten in den PDFs aus.
Das Blättern in den Heften ist mit einem modifizierten
wheelzoom realisiert.
Für die Suche wurde aus jeder Heftseite mittels Tesseract eine Textdatei erzeugt. Die Dateien werden dann einfach sequentiell durchsucht.
Als Erscheinungsdatum wählte ich immer den ersten Tag des Veranstaltungskalenders (ein Freitag); auch wenn Blatt normalerweise am Mittwoch davor erschien, und auch dann, wenn auf dem Titelblatt ein falsches Datum steht.
Im Juli 2023 lernte ich liebe Menschen kennen, die mir halfen, die Sammlung zu vervollständigen. Genannt seien: Karl "Charly" Amannsberger, der mir den Tipp gab, beim
Archiv der Münchner Arbeiterbewegung e.V. nach fehlenden Blättern nachzufragen. Darüber bekam ich Kontakt zu Lutz, der ungefähr zur selben Zeit das gleiche Projekt in Angriff nahm.
Das führte zu...
Teil 2