Making an epub file from a scanned book
One of the travelogues which I want to read is
Reinhold von Werner: Die preussische Expedition nach China, Japan und Siam in den Jahren 1860, 1861 und 1862, 2. Aufl. F. A. Brockhaus, Leipzig 1873
It exists as pdf which is difficult to read on small devices. You find text/epub files of this travelogue on archive.org and other sites but they consist of 95% errors and bad OCR. The problem is the old font used in the 19th century.
Fortunately, there is help available (Münchener Digitalisierungszentrum & Google).
The Bayerische Staatsbibliothek, Referat Digitale Bibliothek/Münchener Digitalisierungszentrum (DB/MDZ) offers high-quality scans as jpg files.
Example

These files can be loaded one by one into https://images.google.com. You get automatically an OCR. This OCR is now of high-quality. You just need to copy and paste it into a text file.
Example: text after OCR
"Um 5. März 1860 verließen wir den Hafen von Hamburg und sagten damit dem deutschen Vaterlande Lebewohl, und zwar für lange lange Zeit. Der Nordostwind blies scharf und kalt, bie Thürme der alten Hansestadt hüllten sich allmählich in einen Schleier, den Schneeflocken immer dichter um sie webten, die Ufer wurden öder und einförmiger, sie traten immer weiter zurück, und als uns der Schleppdampfer wegen der eintretenden Flut bei Freiburg loswarf, der Anker in den Grund rasselte, zeichneten sie sich an dem trüben Himmel nur noch als dunkle Linien ab, über welche dann und wann eine Kirchthurmspike oder ein kahler Baumwipfel als einzige Abwechselung emporragte. Die Möven flogen freischend um unser Schiff, die schmuzig gelbe Fläche des Stromes war eine trübselige Umgebung, und wir wünschten sehnlichst den folgenden Tag herbei, um mit ihm in die freie See zu kommen. Er erschien ebenso trüb und falt, wie der gestrige Abschied genommen, aber er brachte einen stürmischen Nordost mit, der bald unsere Segel schwellte und uns mit Windeseile der Nordsee zuführte. Um Mittag flogen wir bei Cuxhaven vorbei, dann kam der Thurm von Neuwerk, dann das Feuerschiff, die Umrisse von Helgoland tauchten schwach am Horizonte auf, un bald in der granen Dämmerung wieder zu verschwinden, und nun schwammen wir allein auf dem weiten Wasser, dessen schaungekrönte Wellen der scharfe Bug unsers
Schiffes durchschnitt. Der Wind nahm beständig an Stärke zu, bald hatten wir den schönsten Sturm, aber er war uns günstig, und wenn er uns auch empfindlich schaukelte, brachte er uns dafür schon nach 48 Stunden in den Kanal und am dritten Tage nach Portsmouth, wo wir das Geschwader trafen. Wir lagen hier vier Wochen, theils um unsere Ausristung zu ver vollständigen, theils um die Vorrathsgegenstände für die übrigen Schiffe einzunehmen, und erst am 5. April traten wir unsere Weiterreise an. Wir waren sehr froh, als wir der Kreideküste Englands Lebewohl sagen konnten. Das lange Verbleiben dort, das in unvorhergesehenen und deshalb um so unangenehmern Ver zögerungen seinen Grund hatte, wirkte vollständig niederdrückend auf uns, und jeder athmete hoch auf, als die „Nadeln", die zadigen Klippen an der Westspitze der Insel Wight, unsern Blicken entschwanden, sich unser Schiff auf den lichtgrünen Wellen des Kanals wiegte und mit schneller Fahrt vor der frischen Brise dahinflog. Unser nächstes Ziel war Madeira, jene Perle des nordatlantischen Oceans, die selten ein nach dem Süden gehendes Kriegsschiff unbesucht läßt. Unsere Reise verlief ohne alle Unfälle mit den gewöhnlichen Attributen von Seekrankheit für die Neulinge, lächerlichen Intermezzos und traurigen Mienen der darunter Leidenden. Einstimmig ward aber das wärmere Klima von uns begrüßt, dessen schneller Eintritt von uns täglich angenehmer empfunden wurde."
You can see that there are only few errors, in some texts there are many more, depends on the font used.
This text I transfer to Gemini and ask for a correction focusing on clarity, grammar, spelling, and flow. Sometimes, old spellings are corrected into today's German but that is OK for me.
The example above then looks like:
"Am 5. März 1860 verließen wir den Hafen von Hamburg und sagten damit dem deutschen Vaterlande Lebewohl, und zwar für lange, lange Zeit. Der Nordostwind blies scharf und kalt, die **Türme** der alten Hansestadt hüllten sich allmählich in einen Schleier, den Schneeflocken immer dichter um sie webten. Die Ufer wurden öder und einförmiger, sie traten immer weiter zurück, und als uns der Schleppdampfer wegen der eintretenden Flut bei Freiburg loswarf, der Anker in den Grund rasselte, zeichneten sie sich an dem trüben Himmel nur noch als dunkle Linien ab, über welche dann und wann eine **Kirchturmspitze** oder ein kahler Baumwipfel als einzige Abwechslung emporragte. Die Möwen flogen **kreischend** um unser Schiff, die schmutzig-gelbe Fläche des Stromes war eine trübselige Umgebung, und wir wünschten sehnlichst den folgenden Tag herbei, um mit ihm in die freie See zu kommen. Er erschien ebenso trüb und **kalt**, wie der gestrige Abschied genommen, aber er brachte einen stürmischen Nordost mit, der bald unsere Segel schwellte und uns mit Windeseile der Nordsee zuführte. Um Mittag flogen wir bei Cuxhaven vorbei, dann kam der Turm von Neuwerk, dann das Feuerschiff, die Umrisse von Helgoland tauchten schwach am Horizonte auf, um bald in der grauen Dämmerung wieder zu verschwinden, und nun schwammen wir allein auf dem weiten Wasser, dessen **schaumgekrönte** Wellen der scharfe Bug unseres Schiffes durchschnitt. Der Wind nahm beständig an Stärke zu, bald hatten wir den schönsten Sturm, aber er war uns günstig, und wenn er uns auch empfindlich schaukelte, brachte er uns dafür schon nach 48 Stunden in den Kanal und am dritten Tage nach Portsmouth, wo wir das Geschwader trafen. Wir lagen hier vier Wochen, teils um unsere **Ausrüstung** zu vervollständigen, teils um die Vorratsgegenstände für die übrigen Schiffe einzunehmen, und erst am 5. April traten wir unsere Weiterreise an. Wir waren sehr froh, als wir der Kreideküste Englands Lebewohl sagen konnten. Das lange Verbleiben dort, das in unvorhergesehenen und deshalb umso unangenehmeren Verzögerungen seinen Grund hatte, wirkte vollständig niederdrückend auf uns, und jeder atmete hoch auf, als die „Nadeln“, die zackigen Klippen an der Westspitze der Insel Wight, unseren Blicken entschwanden, sich unser Schiff auf den lichtgrünen Wellen des Kanals wiegte und mit schneller Fahrt vor der frischen Brise dahinflog. Unser nächstes Ziel war Madeira, jene Perle des nordatlantischen Ozeans, die selten ein nach dem Süden gehendes Kriegsschiff unbesucht lässt. Unsere Reise verlief ohne alle Unfälle mit den gewöhnlichen Attributen von Seekrankheit für die Neulinge, lächerlichen Intermezzi und traurigen Mienen der darunter Leidenden. Einstimmig ward aber das wärmere Klima von uns begrüßt, dessen schneller Eintritt von uns täglich angenehmer empfunden wurde."
Heavily corrected words are shown by ** before and after.
The corrected text looks really good, imo.
With the corrected text, I will have to learn how to make an epub file. As soon as I have finished it, I will offer the epub here, so check in 1-2 weeks if it is available.
I will also report on how to do it. So, this post will get a large update in a few days.
Caution:
What I am not going to do is going through the corrected text and check if everything is OK. I just want to read it on my Kindle.
If you need a version which is nearer to the original you have to do the process by yourself.
Comments
Post a Comment