Currock hat geschrieben: ↑26.04.2024 08:17
Nur mal so eine Frage zum Verständnis:
Was ist denn gewünscht? Lieber einen anständigen Scan des Originals (ob schief oder gerade ist mal egal, hauptsache lesbar) oder der Text an sich?
Ideal wäre ja ein PDF mit den gescannten Seiten, in denen der Text integriert ist. Soll irgendwie gehen, dann hat man beides und der Text ist durchsuchbar. Ich habe solche PDFs auch schon mal gehabt, aber erstellt habe ich noch keines.
Da schlagen zwei Herzen in mir.
Als Teil von a8preservation.com hätte ich gerne ein PDF in originalem rot mit so viel Kontrast, dass es zumindest für Menschen lesbar ist. OCR wäre das Sahnehäubchen.
Generell sollte jede Anleitung in gut lesbarem Format auf archive.org und/oder atarimania.com vorliegen.
Major Blink hat geschrieben: ↑26.04.2024 14:37
Also mir wäre ein gerade Scan der gut lesbar ist am liebsten. Wir haben sehr gute Multifunktionsgeräte bei uns. Über den Scan läuft dann automatisch ein professionelles Texterkennungsprogramm und nach ein paar Minuten oder sogar Sekunden (je nach Größe des Dokuments) bekommen wir per Mail ein durchsuchbares PDF.
Das ist so ungefähr mein übliches Vorgehen, wobei ich lokal scanne und das später manuell Tesseract aufrufe.
Die Idee mit dem netzwerkbasierten MuFu-Gerät ist aber eine gute. Ich probier das am Montag mal im Büro. Vielleicht hat der Scanner mehr Kontrast und erzeugt nicht nur eine homogene rote Fläche, wie mein brother hier daheim.
Un abhängig davon, hoffe ich auf passendes Licht draußen, dass ich die Seiten übers Wochenende mit dem Smartphone draußen abfotografieren kann - ohne Schatten von mir oder Reflexe vom Sonnenlicht.