Buchscanner – Made by Do It Yourself
In diesem Beitrag möchte ich Ihnen mein aktuelles Projekt vorstellen. Es geht um den Bau eines Buch-Scanners, also um ein Gerät das es ermöglicht, Bücher und deren Inhalt zu digitalisieren.
Vorab der Hinweis, dass das Digitalisieren von urheberrechtlich geschütztem Material für den Privatgebrauch (noch) nicht verboten ist. Vergleichbar mit dem herstellen einer privaten Kopie von Audio CD’s oder DVD’s wird im Grunde nur einer Zerstörung des Originales durch unsachgemäßen Umgang vorgebeugt. Wie sich die Gesetzeslage in dieser Richtung in den nächsten Monaten oder Jahren entwickelt, bleibt abzuwarten.
Werke, die der Gemeinfreiheit unterliegen, also Schriftentum dessen Urheber vor mehr als 70 Jahre verstorben ist, dürfen kopiert, veröffentlicht und weitergegeben werden, sofern keine vererbbaren Ansprüche der Hinterbliebenen bestehen (§ 64 UrhG).
Ein Beispiel dafür wären die Schriften von Sigmund Freud. Er starb 1939 und dieses Jahr ist es erstmals möglich, seine Originale neu zu veröffentlichen, ohne die Nutzungs-, Lizenz- oder Urheberrechte zu verletzen. Voraussetzung dafür ist natürlich, dass das Buch in digitalisierter Form vorliegt, damit es der Druckerei übergeben oder gar in Eigenregie gedruckt und hergestellt werden kann.
Letzteres ist übrigens, vergleicht man die heutigen technischen Möglichkeiten mit den Herstellungskosten für Bücher, gar nicht mal unmöglich. Günstige und brauchbare schwarz/weiß Laser Drucker ab 200,- Euro können bereits heute Seiten für Preise ab 1,3 Cent/Blatt ausdrucken. Buchbindehandwerk und Herstellung von einfachen Klebebindungen für Taschenbücher werden in unzähligen Workshops im Internet und diversen Fachbüchern auch für Laien verständlich vorgestellt und detailreich beschrieben.
Was halten Sie z. B. von einer in Leder gebundenen Ausgabe des Originales von Warum Krieg? (Briefwechsel Sigmund Freuds mit Albert Einstein) oder gar einer Kopie der Gutenberg Bibel, die sicher auch in Ihrem Bücherregal einen besonderen Platz einnehmen würde?Nun, ich möchte dem Tatendrang nicht vorgreifen und mich auf das bisher Geleistete beschränken.
An dieser Stelle bereits der Hinweis, dass mein Bookscanner funktioniert und erfolgreiche Testläufe vorliegen. Bücher bis zu einer max. Größe von 40 cm x 34 cm können eingescannt und digitalisiert werden.
Es geht in meinem Projekt keinesfalls darum, Google Books nachzuahmen oder gar in direkte Konkurrenz zu treten. Sicher kann ich aber einen kleinen Beitrag dazu leisten, wichtige Bücher in ihrer ganzen Schönheit und vor allem des Inhaltes wegen für alle Zeit zu erhalten, weil diese dann digitalisiert vorliegen und an jedem Ort der Welt veröffentlicht werden können.
Dieser Workshop, der sich mit der Herstellung und dem Gebrauch eines Buchscanners beschäftigt, wird ständig erweitert und aktualisiert. Schauen Sie also öfter mal vorbei, wenn Sie das Thema interessiert.
Wer den einfachen Weg einschlagen möchte und aus einem schier unbegrenzten finanziellen Topf schöpfen kann, dem empfehle ich einen Blick auf den professionellen Buchscanner der Firma Treventus und/oder die Espresso Book Maschine der Firma On demand books. Die Espresso Book Maschine kann, digitalisierte Buchdateien vorausgesetzt, ein ca. 300 Seiten umfassendes Buch in weniger als 4 Minuten herstellen.
Übrigens wurden im Oktober 2009 bereits Espresso Book Maschinen an 25 Standorten weltweit betrieben. Schätzungsweise schlappe 200.000 USD sollten ausreichen, um sich diese beiden Zukunftsmaschinen zu besorgen.
Wer sich aber für 200,- bis 300,- Euro einen Buchscanner im Eigenbau anfertigen möchte, der ist hier richtig. Ich werde versuchen, die Schritte auf meinem Weg zum fertig digitalisierten Buch so genau wie möglich zu beschreiben. Falls etwas unklar sein sollte, steht Ihnen für Fragen oder konstruktive Kritik die Kommentarfunktion zur Verfügung.
Die Idee für das ganze holte ich mir, wie soll es anders sein, natürlich aus dem Internet. Es gibt sogar eine private englischsprachige Seite, die sich mit dem Bau eines Buchscanners beschäftigt und die auch als Grundlage für mein, ich nenne es mal vorsichtig Vehikel, dient.
Auf DIY Book Scanning erhalten sie alle relevanten Informationen, um mit dem Bau Ihres Buch-Scanners zu beginnen. Auch die verwendete Software Scan-Tailor und deren Gebrauch wird beschrieben. Ein angeschlossenes Forum und die News informieren über Aktuelles und geben erste Hilfestellungen.
Was habe ich nun für meinen Buchscanner verwendet? Etwas Holz, eine Plexiglasplatte (glasklar), einige Schubladenschienen und einen Halogenstrahler (120 Watt) aus dem Baumarkt mit den 3 Buchstaben. Schrauben und Muttern hatte ich noch reichlich hier rumliegen. Zusätzlich wurden 2 ausziehbare Stative mit 3D Kopf angeschafft, die die beiden teuersten Investitionen des Projektes, 2 Digitalkameras des Typs Canon Powershot A590 IS, sicher fixieren. Bisher sind Kosten von ungefähr 80,- Euro (ohne die Kameras) entstanden.
Natürlich können auch andere, höherwertige Digitale Spiegelreflexkameras oder ähnliche Typen verwendet werden, aber diese Kamera bietet derzeit nach Meinung vieler Forumsteilnehmer das beste Preis- Leistungsverhältnis. Die Auflösung von 8 Mio. Megapixel sollte bei Ihrer eventuell vorhandenen Digitalkamera nicht unterschritten werden, um auch größere Bücher in akzeptabler Qualität zu scannen bzw. fotografieren zu können.
Auch ist es wichtig, das Ihre Kamera SDM/CHDK fähig ist, um den elektronischen Impuls zum manuellen Auslösen zu empfangen. Schauen Sie im Zweifelsfall im Handbuch Ihrer Digitalkamera nach. Die Canon Powershot A590 IS besitzt diese minimalen Voraussetzungen und kann im Schnitt für 75,- bis 120,- Euro käuflich erworben werden, da die Kamera nicht mehr ganz aktuell, aber dennoch und nicht nur bei Book-Scanner-Bauern wegen ihrer vielen Funktionen sehr beliebt ist.
In der Zwischenzeit habe habe ich 2 Kameras erwischt, wobei ich mit den Anschaffungskosten von 79,90 bzw. 76,09 Euro (incl. Versand) ganz zufrieden bin. Woher, na raten Sie mal. Auf ebay werden immer mal welche privat und gewerblich versteigert.
An dieser Stelle der Hinweis, dass in dem Fall der Kauf via gewerblichen Anbieter erfolgen sollte, da man die Kamera, wenn sie defekt geliefert wird, an den Verkäufer zurück schicken kann und dieser das Teil zurück nehmen muss. Nicht mal die Versandkosten braucht man zu bezahlen, da der Wert der Kamera oder der Auktionspreis mit Sicherheit über 40,- Euro liegen dürfte.
Bei privaten Anbietern haben Sie nicht unbedingt das Recht, die Kamera zurück zu senden falls sie nicht funktionieren sollte, da ein Privatanbieter nicht dazu verpflichtet ist und meist nur auf die Kulanz des Verkäufers vertraut werden kann. Schauen Sie sich aber immer und unbedingt die Bewertungen des jeweiligen Verkäufers an, um späteren Ärger und Stress zu vermeiden.
Seien Sie geduldig, warten Sie ein günstiges Angebot ab und schlagen Sie im richtigen Moment zu. Falls Sie noch nicht wissen, wie man effektiv auf ebay bieten sollte , empfehle ich Ihnen einen Blick in meinen Workshop Online Auktionen erfolgreich gewinnen.
Nun was brauchen wir noch? Einen Auslöser, der beiden Kameras sozusagen den Befehl gibt, 2 Buchseiten auf einmal zu fotografieren. Im Forum des DIY Bookscanners ist auch der Eigenbau eines Auslösers beschrieben. Ich habe mich für ein fertiges Modell des Typs Ricoh CA-1 entschieden. Kostenpunkt um die 30,- Euro z. B. beim größten Gebrauchtbuchhändler im WWW, der auch Elektronikartikel und anderes diverses Zeug anbietet.
Was noch? Ein sogenanntes Y-Kabel, dass den 5 Volt Impuls zum Auslösen an beide Kameras weiterleitet und, wenn nicht im Lieferumfang Ihrer Kameras vorhanden 2 Datenkabel zur Verlängerung. Wie bereits in meinem Kommentar vom 24.10.2010 angekündigt, funktioniert das folgende abgebildete Kabel nicht mit den anderen Komponenten. Ich hoffe Sie haben noch kein Y-Kabel dieses Typs angeschafft. :-/
——————————
Was Sie sich aber getrost besorgen können, um die Verkabelung der Kameras und des Auslösers zu bewerkstelligen, sind folgende Kabel bzw. Adapter. Diese Kombination wurde bereits erfolgreich getestet und funktioniert. Ich habe mir das folgende Y-Kabel in Hong Kong bestellt, per Paypal bezahlt und erhielt gestern (28.04.2010) ein Mail, dass die Sachen mit einer geschätzten Lieferzeit von 12-18 Tagen unterwegs sind. Die beiden Adapter bekommt man ohne Probleme in Deutschland.
Wenn Sie die Möglichkeit haben, diese Kabel selbst herzustellen, in einem Bastlerladen oder innerhalb Europas zu bestellen, sollten Sie die Gelegenheit nutzen. Ich selbst wurde in unserem hieransässigem Fachgeschäft für Hard- und Software mit der Bemerkung stehen gelassen, dass es keine Y-USB Kabel gibt.
Auch eine Online-Suche bei Conrad.de oder Reichelt.de brachte keine zufriedenstellenden Ergebnisse, soll heißen, dieses Y-Kabel ist nicht oder nur schwer lieferbar. Hier aber nun die Bilder und die Bezeichnungen (unter denen sie die Teile finden) der Kabel und Adapter, welche ich auf ebay.de erworben habe und die die beiden Canon Powershot mit dem Auslöser Ricoh CA-1 verbinden:
USB AM M auf 2 AM M Verlängerung Y-splitter Kabel
(die beiden Buchsen werden jeweils mit dem Datenkabel der Kameras verbunden … das Steckerende kommt in den unteren Adapter)
(in Hong Kong bestellt)
——————————
USB Adapter “A” Buchse > ” A ” Buchse
(dieser Adapter verbindet das Y-Kabel mit dem unteren Teil)
(bei deutschen Händler erhältlich)
——————————
USB Adapter A Stecker > 5 pol. mini B Buchse
(dieser Adapter verbindet den Rico CA-1 Auslöser mit dem Y-Kabel)
(bei deutschen Händler erhältlich)
——————————
So, alles verkabelt und funktionstüchtig? Dann weiter im Text. Hinweisen möchte ich auch noch auf eine andere Möglichkeit, die beiden Kameras auszulösen. Bei meinen Recherchen zu dem Projekt stieß ich auf folgenden Fernauslöser der Firma digi-dat. Auch wenn unsere Powershot A590 IS nicht explizit bei den unterstützten Kameramodellen aufgeführt ist, sollte dieser Auslöser ebenfalls funktionieren. Eventuell hilft eine Anfrage per Mail an die Firma. Der Preis dieses Fernauslösers schlägt mit 41,65 Euro zu Buche. Hinzu kommen Kosten für Adapter und eventuell Kabelverlängerungen.
Aber das nur als Hinweis am Rande, da es mehrere Möglichkeiten gibt, die beiden Kameras auszulösen. Auch der Kommentar von Pagnol am 30.04.10 klingt interessant. Demnach ist es in absehbarer Zeit möglich, auf das ganze Kabelwirrwarr zu verzichten, da auf diybookscanner.org an einer Software (vorerst nur für das Betriebssystem Linux) gearbeitet wird die das anschließen der Kameras, das Auslösen und die Verarbeitung der Bilder direkt über den PC ermöglicht.
Was ist das nun im unteren Bild für ein Vehikel und brauchen Sie das unbedingt?
——————————
Diese eigenartige aber wohl einmalige Konstruktion ist zu empfehlen, falls ihr Buchscanner zu den etwas größeren Exemplaren gehören soll. Da mein Buchscanner problemlos Bücher von einer maximalen Größe bis 405 mm Länge und 345 mm Breite scannen kann, ist der, ich nenne ihn einfach mal Schlitten, auf Grund seiner Größe doch ziemlich schwer geworden. Schlitten ist das Teil, dass manuell immer hoch und runter gefahren wird, um die Seiten des Buches umzublättern. Daher habe ich den Buchscanner um ein Gewichtsausgleichkonstrukt (was für ein Wort) ergänzt, dass es nun ermöglicht, den Schlitten mit dem kleinen Finger zu bewegen. Die 2 Gewichte einer Hantel sorgen an einer geflochtenen Angelschnur und über 4 Umlenkrollen geführt, sozusagen für eine leichte Auf- und Abfahrt des Schlittens.
Ja liebe Besucher der neuen Bundesländer, das sind Teile aus einem Stabilbaukasten der ehemaligen DDR. Mein Schwager hatte sie für meine beiden Neffen vor vielen Monden eingekauft und gesammelt. Die Lausbuben spielen aber heute viel lieber mit Nintendo, Lego und Co. Glück für mich, Pech für die pädagogisch wertvolle Entwicklung meiner Neffen, aber das ist ein anderes Thema.
An Arbeitszeit, um den Scanner soweit fertig zu stellen wie er auf den oberen Fotos dargestellt ist, habe ich ca. 20-25 Stunden aufgewendet. Je nachdem, wie handwerklich geschickt Sie sind, können Sie diese Zeit unter- bzw. überbieten.
Die ersten Testläufe sind abgeschlossen und der Buchscanner funktioniert.
Demnächst werde ich dann das ein oder andere eingscannte Buch in einem separaten Artikel vorstellen. Spezielle Wünsche, welche Bücher digitalisiert werden sollten, werden natürlich auch angenommen. Schreiben Sie mir in dem Fall ein Mail oder nutzen Sie dafür die Kommentarfunktion in diesem Artikel.
Wie bereits oben erwähnt unterliegt dieser Artikel aber weiterhin ständiger Aktualisierungen und wird zu gegebener Zeit ergänzt bzw. erweitert.
——————————
Weitere Informationen zu Digitale Sammlungen oder der Wikisource, die sich mit dem Sammeln von urheberrechtsfreien Quelltexten beschäftigen, finden Sie auf den jeweiligen Webseiten.
——————————
Nachtrag am 15.04.2010:
An dieser Stelle noch eine Anmerkung zu der verwendeten Kamera des Typs Canon Powershot A590 IS. Ich habe heute versucht, per Fernauslösung ein oder mehrere Bilder mit dem Ricoh CA-1 zu machen, indem ich ihn an die Kamera anschloss. Das Ergebnis war nicht das, was ich eigentlich erwartet hätte. Es tat sich nämlich gar nichts. Kein Bild, kein Impuls zum auslösen des Apparates und der Gedanke, dass die Kamera bereits defekt geliefert wurde.
Am Auslöser selbst konnte es nicht liegen, da ich diesen mit einer anderen Ricoh Kamera getestet habe und wunderbare Ergebnisse erzielen konnte, also Bilder per Fernauslöser schoss.
Das Problem lag, wie so oft, an den fehlenden Informationen zum Thema CHDK. Die Voraussetzung für Canon Kameras, die an diesem Projekt Buchscanner teilnehmen dürfen ist, wie bereits weiter oben erwähnt, die Möglichkeit, den Funktionsumfang der Kamera mit CHDK zu erweitern.
CHDK greift nicht etwa in die Original-Firmware ein sondern setzt sozusagen auf ihr auf und kann jederzeit entfernt werden. Ein Update der vorhandenen Firmware auf der Kamera erfolgt also nicht. Aber, ohne die Erweiterung CHDK funktioniert auch eine Steuerung via USB Kabel bzw. Auslöser nicht. Es ist also unbedingt erforderlich, sich das entsprechende CHDK Firmware Update für seine Kamera zu besorgen und aufzuspielen, da dieses vom Hersteller aus nicht installiert wird.
Nach 1-2 Stunden Lektüre, ausprobieren und testen sollte ihre Kamera dann ebenfalls via Fernauslöser ansteuerbar sein und die gewünschten Ergebnisse, sprich die Bilder schießen. Weitere Informationen erhalten Sie auf den Seiten des CHDK-Forums und der CHDK-Wiki. Falls dahingehend noch Fragen auftauchen, bin ich natürlich auch bereit, im Rahmen meiner Möglichkeiten zu helfen. Nutzen Sie in dem Fall einfach die Kommentarfunktion dieses Artikels oder schreiben Sie mir ein Mail.
——————————
Nachtrag am 08.05.2010:
Heute möchte ich hier mal wieder ein paar Neuigkeiten zum Projekt Buchscanner anfügen. Obwohl mein Y-USB Kabel noch nicht eingetrudelt ist. Habe ich mit einer Kamera bereits Testaufnahmen gemacht und mit Scan Tailor bearbeitet.
Zuvor aber noch ein paar Hinweise am Rande. Wer mit Digitalkameras schon einige Erfahrungen gesammelt hat, der wird festgestellt haben, dass das im Grunde genommen eigentlich ganz erhebliche Stromfresser sind, wobei das LCD-Display wohl den größten Teil der Energie verbrauchen dürfte. Normale, also nicht wieder aufladbare Batterien versagen schon nach kurzer Zeit ihren Dienst und sind keinesfalls zu empfehlen. Zu bevorzugen sind wiederaufladbare Akkus der NiMH-Klasse, um nicht nur den Geldbeutel sondern vor allem die Umwelt zu schonen.
1. Ich habe mich gar in Umkosten gestürzt und einige AA Akkus vom Typ Eneloop gekauft. Diese sind zwar in der Anschaffung nicht billiger aber allemal besser als die normalen NiMH Akkus. Der Vorteil der Eneloop besteht bekanntlich darin, dass sie sich, auch über einen längeren Zeitraum gesehen, kaum entladen und ihre volle Power, die für Digitalkameras notwendig ist, behalten. Im Praxistest bin ich wirklich erstaunt, wie lange man mit diesen Batterien arbeiten kann, da mit Hilfe der CHKDK Software eine Anzeige der Restspannung in Prozent auf dem Display der Canon erscheint.
Wer noch ein paar Euro mehr übrig hat, der kann sich natürlich auch für um die 18,- Euro/Stück zwei Netzteile vom Typ ACK800 besorgen. Dies ist dann die eleganteste Lösung und man hat nie wieder Probleme mit leeren Batterien, vorausgesetzt man bezahlt seine Stromrechnung pünktlich.
2. Durch die ständigen Ergänzungen, Aktualisierungen im eigentlichen Artikel und den Anmerkungen von Ihnen in Form der Kommentare, über die ich mich natürlich sehr freue, besteht die Befürchtung, dass das ganze hier etwas unübersichtlich wird. Eventuell gibt es die Möglichkeit, diese Webseiten um ein Forum zu erweitern und diesen Beitrag in verschiedene Kategorien aufzuteilen. Als Vorbild könnte das Forum auf DIY Book Scanning dienen. Ich werde in absehbarer Zeit mal schauen und glaube irgendwo gelesen zu haben, dass es ein Plugin für das hier zur Anwendung kommende CMS Content-Management-System mit dem Namen WordPress gibt. Eventuell wäre das geeignet, um diesen Buchscanner Workshop übersichtlicher zu gestalten.
3. Geplant ist vielleicht auch eine Broschüre oder gar ein kleines Buch, in dem alle persönlichen Erfahrungen und die der Kommentatoren einbezogen werden, die mit diesem Workshop verbunden sind. Ein Buch in Eigenregie herzustellen ist, dank günstiger Drucker und freier DTP Desktop-Publishing Programme wie beispielsweise Scribus, also dank der heutigen technischen Möglichkeiten kein allzu großes Unterfangen mehr.
4. Mein Workshop wurde, wie in den Kommentaren nachzulesen, ebenfalls auf der Webseite Ich mach was mit Büchern von Leander Wattig veröffentlicht. Dort hat Jakob einen interessanten Kommentar hinterlassen, der sich ebenfalls mit dem Bau eines Buchscanners beschäftigt und den ich Ihnen nicht vorenthalten möchte.
Nun aber zu der Software Scan Tailor und deren Bedienung. Auf der Webseite des russischen Programmentwicklers Joseph Artsimovich können Sie in englischer und russischer Sprache nachlesen, was Scan Tailor kann und macht. Es ist eine Software, die in erster Linie dazu dient den Rohscann, in unserem Fall also der Fotografie, entsprechend auszurichten, zu bearbeiten und als Tagged Image File Format, kurz .TIFF abzuspeichern. Diese Dateien können dann mit einer entsprechenden Texterkennungssoftware (OCR) bearbeitet und als PDF oder jedem anderen Format derer die OCR Software fähig ist, weiter verarbeitet werden. Scan Tailor ist also keine direkte OCR Software.
OCR Software sind z. B. tesseract-ocr, ABBYY FineReader, OmniPage oder Readiris, um nur eine kleine Auswahl zu nennen. Mit Erfahrungswerten, welche Software am besten für die Texterkennung geeignet ist, kann ich noch nicht dienen. Sicher wird sich das aber in den nächsten Wochen ändern. Ich glaube mich zu erinnern, das Omnipage in verschiedenen Beurteilungen von Kunden immer ganz gut abgeschnitten hat und werde das Programm mal testen.
Wer aber eben sein zu digitalisierendes Buch nur in einer 1:1 Kopie auf die Festplatte sichern möchte und keine durchsuchbaren oder editierbaren PDF Dateien benötigt, der kommt auch ohne die Texterkennung und entsprechende OCR Software aus.
Zurück also nun zu Scan Tailor. Nachdem wir uns die aktuelle Version heruntergeladen und installiert haben, starten wir das Programm. Hier ebenfalls der Hinweis auf die Wiki bzw. Bedienungsanleitung von Scan Tailor, die in englischer und russischer Sprache zur Verfügung steht und hier nur kurz erläutert werden soll. Falls Sie Fragen zu weiteren Einstellungen und/oder Tipps zum Programm selbst benötigen, benutzen Sie bitte die Kommentarfunktion am Ende dieses Beitrages. Ich werde versuchen, nach bestem Wissen und Gewissen zu helfen.
Scan Tailor lässt sich, nachdem die Bilder von der Kamera auf die Festplatte übertragen und in ein neues Projekt geladen wurden, ziemlich einfach bedienen und besteht aus den folgenden 6 Arbeitsschritten, die Sie im oberen linken Bereich des Programms aufrufen können.
1. Fix Orientation (Lagebestimmung der Seite ändern)
2. Split Pages (Seite automatisch oder manuell aufteilen)
3. Deskew (Feinabstimmung der Zeilenlage)
4. Select Content (auswählen des Inhaltes)
5. Page Layout (Anzeige der fertigen Seite und letzte Kontrollmöglichkeit)
6. Output (Ausgabe als .tiff Datei in den entsprechenden Ordner)
7. Sláinte (einen guten irischen Whiskey bei angenehmer irischer Musik genießen und auf das Ergebnis anstoßen)
Ich empfehle, erst einige wenige, sagen wir 10 Seiten zu bearbeiten, um erste Erfahrungen mit Scan Tailor zu sammeln und nicht gleich ein komplettes Buch zu laden, um sich dann eventuell über das Ergebnis und die vertane Zeit zu ärgern.
So, das soll es für heute erst mal gewesen sein. Ich stehe für Ergänzungen oder Fragen natürlich auch weiterhin zur Verfügung und wünsche Ihnen bei Ihrem Buchprojekt viel Erfolg.
——————————
Nachtrag am 17.11.2011:
Buchscanner-Projekte sind Unikate, die sich in ihrer Form, dem Aufbau und der Wirkungsweise auch grundsätzlich unterscheiden können. Herr Fischer überließ mir freundlicherweise einige Bilder seiner Konstruktion, die ich hier gerne einfüge.
Er stellte sich und seinen Buchscanner erstmals im Kommentar Nr. 53 vor. Unter Kommentar Nr. 57 erhalten sie bei Bedarf eine ausführliche Beschreibung seiner interessanten Konstruktion, um Druckerzeugnisse zu digitalisieren.
——————————
Gerne lade ich Sie an dieser Stelle auch in den neuen Anzeigenmarkt für antiquarische, vergriffene und seltene Bücher ein, der für Sie geöffnet ist.
——————————
Und eine Umfrage füge ich hier auch noch mit an.
——————————































Hallo, bin auch bald soweit anzufangen. Ich habe aber Angst, bei der anschließenden Software-Geschichte, da mein Englisch stark eingerostet und eh nur Minimalistisch war. Die von Dir genannten Seiten sind echt eine wahre Fundgrube (hatte ich auch schon gefunden).
Bei der Frage eines anderen “Voters” möchte ich nur sagen: “ich möchte sowas!!!”
Mein Schrank quillt über, mein Pocketbook braucht Futter und mehrer Bände einer Reihe erscheinen in solch langen Zeitabständen, dass ich bis dahin die vorherigen bereits verlegt habe, aber dann doch nochmals lesen möchte.
Ich sehe auch nicht ein, dass ich mit gekauften Büchern nicht machen kann, was ich will (Als Sicherung digitlisieren!)
solange ich diese nicht weitergebe, kann mir (noch ) niemand dies verbieten.
Außerdem finde ich, wir Europäer verschlafen mal wieder einen (Entwicklungs-) Zug.
Amiland veröffentlich inzwischen sehr viele Bücher, Zeitschriften sind sogar online downzuladen und bei uns heißt es mal wieder: Wir beobachten, sehen dieser Entwicklung aber noch skeptisch entgegen.
Also kurz gesagt: Super, weiter so. Wer´s nicht braucht, ist ja nicht gezwungen, sich hier herum zum treiben.
Hi,
Vielen Dank für den Kommentar. Ich freue mich immer wieder über neue Interessenten. Das mit der Software bekommt man bestimmt auch irgendwie hin. Meine Englischkenntnisse sind ebenfalls nicht gerade berauschend aber zum Glück gibt es ja noch Babelfish und ähnliche Online Übersetzer.
Nur der Zeitpunkt zur Veröffentlichung des Artikels war etwas ungünstig gewählt. Ich brauche noch eine 2. Canon Powershot A590 IS und im Moment sind die Preise für die gebrauchten Kameras auf ebay um durchschnittlich 20% gestiegen. :-/
Wenn sich noch mehr Kommentatoren einfinden, ist es sicher auch möglich, ein kleines Forum einzurichten, dass sich dann speziell mit diesem Workshop in deutscher Sprache zum Bau eines Buchscanners beschäftigt und auch Bilder der eigenen ‘Apparaturen’ hochgeladen werden können.
Viel Erfolg bei deinem Projekt.
Herzlichen Gruß
Uwe Ross
Hallo Herr Ross,
vielen Dank für diesen sehr interessanten Beitrag! Ich würde ihn gern parallel bei wasmitbuechern.de veröffentlichen und Ihnen dafür einen Account anlegen. Was halten Sie davon? So bekäme Ihr Beitrag und Ihre dahinter stehende Initiative noch etwas mehr Aufmerksamkeit …
Später könnten wir auch auf Ihr Forum speziell zu diesem Thema verweisen und hoffentlich richtig was in Gang bringen.
Viele Grüße
Leander Wattig
P.S.: Sie könnten den Beitrag natürlich auch selbst einstellen, wie auf der Startseite bei uns beschrieben …
Hallo Herr Wattig,
Vielen Dank an Ihrem Interesse. Das Projekt Buchscanner habe ich bereits in Ihrem Schwarzen Brett verlinkt. Natürlich dürfen Sie den Beitrag zusätzlich parallel auf Ihren Seiten veröffentlichen oder verlinken. Aktualisierungen erfolgen hier, wie bereits im Artikel vermerkt, zu gegebener Zeit.
Auch ich habe großes Interesse, mehr ‘Buchscanner-Bauer’ zu begeistern und eventuell eine Datenbank für digitalisierte gemeinfreie Bücher, unabhängig von Google Books, online, kostenfrei und für jedermann zugänglich zu schaffen.
Am kommenden Wochenende finde ich sicher die Zeit, um mir das Prozedure auf Ihrer Startseite genau anzusehen und einen (verkürzten) Beitrag zu meinem Projekt zu verfassen und Ihnen per Mail zu senden.
Herzlichen Gruß
Uwe Ross
Hallo Herr Ross,
klasse, dass Sie mit einer Parallel-Veröffentlichung einverstanden sind. Wie ich gesehen habe, hatten Sie bereits ein Profil bei uns angelegt. Über dieses habe ich das Ganze veröffentlicht. Sie können sich auch mit Ihren Daten einloggen und den Beitrag ggf. anpassen. Ansonsten habe ich schon allerhand Verweise auf Sie/Ihre Seite ergänzt. Zu Beginn auch, dass hier das Original erschienen ist. Weiter habe ich auf die Kommentare hier hingewiesen. Wenn ich noch etwas anpassen soll, geben Sie mir bitte einfach kurz Bescheid. Jetzt bin ich erstmal gespannt, ob sich auch andere für das Thema interessieren. Gern auch später eine Fortsetzung parallel bei uns.
Viele Grüße
Leander Wattig
hallo,
durch meine recherchen zum scannen von büchern bin ich durch zufall auf diesen beitrag gestoßen. ich finde die idee sehr interessant und es ist eine gute alternative zum herkömmlichen buchscannern.
wie lange würde es rein rechnerisch gesehen dauern damit ein 600 Seitenbuch abzuphotograhieren und am rechner in ein pdf, txt oder andere textdatei umzusetzen.
muss man alle bilder dann am rechner noch mit dem Scan Tailor programm bearbeiten?
ich bin selbst am überlegen wie ich meine 100 bücher digitalisiert bekomme um sie auf einem ebook-reader lesen zu können. derzeit bin ich noch am überlegen wie ich das machen soll weil es doch ca 60000 seiten sind… ein scanner mit dem man bücher digitalisieren kann hab ich schon gefunden… ich kann mich allerdings nicht entscheiden welchen weg ich gehen soll.
allerdings werde ich diesen beitrag hier weiterhin mit spannung verfolgen
gruß Thomas
Hi,
Wie lange es dauert, ein 600 Seitenbuch einzuscannen, zu bearbeiten und in eine (durchsuchbare) pdf umzuwandeln? Diese Frage kann ich leider noch nicht beantworten. Ich schätze aber mal so über den Daumen gepeilt mindestens 10 Stunden. Sicher auch etwas zügiger, wenn man sich mit der Hard- bzw. Software angefreundet hat, alles reibungslos funktioniert und man dadurch effektiver arbeiten kann.
Du schreibst, dass du bereits einen Scanner gefunden hast, mit dem man Bücher digitalisieren kann? Meinst du damit einen Flachbettscanner ala PLUSTEK OpticPro A360 oder ähnliche Modelle?
Am Wochenende werde ich, einige Testseiten scannen und mit Scan Tailor bearbeiten. Eine Canon Powershot habe ich ja bereits, das auslösen der Kamera funktioniert und der Scanner ist auch zu Testläufen bereit. Die 2. Kamera dürfte im Laufe der nächsten Woche eintreffen.
Noch eine Anmerkung zu dem beschriebenen und abgebildeten Y-Kabel von Motorola. Im englischen Forum wurde der Beitrag in den letzen Tagen mit folgender Anmerkung editiert: EDIT: DO NOT BUY THIS Y CABLE, IT WILL NOT WORK (Kaufen Sie dieses Y Kabel nicht, es funktioniert nicht mit den anderen Komponenten des Buchscanners).
Also Finger weg von diesem Kabel. Ich hatte glücklicherweise auch noch keines bestellt, da sich selbst die Bestellung als recht schwierig erweist. Das Kabel ist in Europa nicht erhältlich und in den USA sind Kabel für solche Centbeträge nicht so einfach zu ordern.
Nun wird aber eine andere, getestete und funktionierende Lösung in dem folgenden Artikel beschrieben:
http://diybookscanner.org/forum/viewtopic.php?f=1&t=353
Die Aktualisierung des gesamten Beitrages hier und auf den Seiten von was mit Büchern erfolgt ebenfalls am Wochenende.
Herzlichen Gruß
Uwe
also ich habe ein scanner gefunden der ausschließlich dafür gedacht ist bücher zu scannen und ein gutes software packet ist auch gleich mit dabei
http://www.filmscanner.info/PlustekOpticBook3600Corporate.html
da schafft man ca 200 seiten pro stunde…..
ich bin am überlegen das gerät zu kaufen und dann zu test bzw meine bücher zu scannen und bei einem preis von ca 250 euro ist das ein guter preis.
Hm, ja den Plustek OpticBook 3600 hatte ich auch schon ins Auge gefasst, bin aber nach der Lektüre der 5 Amazon Rezensionen zu dem Gerät wieder davon abgekommen:
Diese Rezensionen stammen von Käufern, die versucht haben, mit dem Teil zu arbeiten. Dein Link von Filmscanner beschreibt den PlustekOpticBook aus der Sicht eines Verkäufers.
Aber eben, du kannst das Gerät ja ausprobieren und bei Nichtgefallen oder ungenügender Funktionsweise ohne Angabe von Gründen innerhalb von 4 Wochen zurück senden, sofern du über das Internet bestellst. Falls du dir ein solches Gerät besorgst, würde ich mich über Erfahrungsberichte freuen.
Zurück zum Thema. Gestern habe ich die ersten Aufnahmen mit einer Kamera gemacht und die Bilder in Scan Tailor verarbeitet. Die exakte Bedienung des Programmes erfordert jedoch noch einige Einarbeitungszeit. Ich denke aber, dass ich im Laufe der Woche brauchbare Ergebnisse liefern kann.
Heute schaffe ich es auf keinen Fall, da ich noch 1,5 kg frisch gepflückten Bärlauch zu Pesto verarbeiten muss.
Also die Rezensionen gehen teilweise sehr auseinander…. aber alle sagen das die software nicht die beste ist.
Da die alternative preislich im selben feld liegt ( das scanner kostet ca 250 euro) und auch Abbyy Fotoreader mit dabei ist denke ich das ich im Juni mir so ein Gerät kaufen werde…da ich viele Bücher zu sammen habe und öfter neue mit dazukommen ist für mich die Scangeschwindigkeit sehr entscheident.
Bber trotz dieser tatsachen bin ich sehr auf den Buchscanner und die Resultate hier gespannt und sollte sich der Buchscanner Opticbook als unzureichend herausstellen kann ich immernoch auf die Erfahrungen hier zurückgreifen.
Es ist schön zu sehen, dass das Interesse für diese Thematik um sich greift. Mein eigener Scanner ist auch fast fertig.
Das Gefummel mit den verschiedenen USB-Adaptern und Y-Kabeln wird man sich künftig höchstwahrscheinlich ersparen können, denn auf diybookscanner.org arbeitet man an einem Computerprogramm, das den Anschluss beider Kameras an den Computer vorsieht. Um eine Doppelseite “einzuscannen” braucht man lediglich eine Taste zu drücken, damit das Programm die Auslöser betätigt die Fotografien von der Kamera auf den Computer herunterlädt und nummeriert. Für viele potentielle Benutzer wird es vermutlich einen Haken gebe: es wird voraussichtlich nur das Betriebssystem Linux unterstützt werden.
Na das sind doch mal gute Nachrichten.
Mir wäre es auch lieber, wenn zukünftige Geräte ohne diese ganze Verkabelung auskommen könnten.
Die Beschränkung der Software auf Linux würde aber möglicherweiße viele fleißige Bookscanner-Bauer außen vor lassen, da der Großteil der PC-Nutzer mit den Entwicklungen aus Redmond (Microsoft Windows) unterwegs sein dürfte.
Aber um es mit den Worten unserer Bundeskanzlerin auszudrücken: “Wir werden versuchen, für dieses Problem eine gemeinsame Lösung zu finden“.
Ich habe vor einigen Jahren mal eine Suse Linux Version 7.3 parallel zu einem Windows Betriebsystem installiert und betrieben. Wenn ich die CD’S etwas entstaube, ist es eventuell möglich, die Software zusammen mit einer kleinen Partition Linux auf meinem Windows Rechner zum Laufen zu bringen.
Oder es erscheint irgendwann doch noch eine Version für Windows, da das Interesse an den Buchscanner-Projekten auch in Zukunft auf Interesse stoßen wird. Auf alle Fälle sollte man die Entwicklung der Software via diybookscanner.org weiter verfolgen.
Ich kann es Ihnen ans Herz legen, einmal die Linux-Distribution Ubuntu auszuprobieren. In puncto Benutzerfreundlichkeit hat Linux in den letzten Jahren noch einmal einen Sprung gemacht, Ubuntu ragt hier meiner Meinung nach besonders hervor.
Der Grund für die Beschränkung auf Linux ist die Absicht, ein Rund-um-sorglos-Paket fürs Digitalisieren von Büchern anzubieten, das ausschließlich auf quelloffener Software aufbaut – und es gibt meines Wissens keine auf Windows lauffähige quelloffene OCR-Software.
Hallo, dem Kommentar von Pagnol wollte ich etwas zufügen:
Die “Gebastelei” mit dem Y-Kabel kann man auch umgehen, wenn man sich dies fertig kauft. Zwar muß auf der Kamera eine andere Betriebssoftware geladen werden, dies geht aber sehr schnell und ist in mindestens einem Fotoforum gut erklärt und wird auch “softwaretechnisch” weiterentwickelt.
Dieses Y-Kabel kann man bei “http://www.digi-dat.de/produkte/index.html#SDM” bestellen (ich habe eins mit 65cm Kabel gewollt) und nachdem auf der SD-Karte in der Kamera eine andere Software ist, kann man mit beiden Kameras gleichzeitig auf Knopfdruck loslegen. Die Software ist “StereoPhoto Maker (German)”
Allerdings haperts bei mir an dem Zusammenbau des Gerätes. (Mein Mann sträubt sich noch mit Händen und Füßen gegen dieses Projekt)
MfG Gigi
Hi Gigi,
Vielen Dank nochmal für den Hinweis. Ich hatte den Artikel letztes Wochenende unter anderem mit folgendem Absatz aktualisiert:
“Hinweisen möchte ich auch noch auf eine andere Möglichkeit, die beiden Kameras auszulösen. Bei meinen Recherchen zu dem Projekt stieß ich auf folgenden Fernauslöser der Firma digi-dat. Auch wenn unsere Powershot A590 IS nicht explizit bei den unterstützten Kameramodellen aufgeführt ist, sollte dieser Auslöser ebenfalls funktionieren. Eventuell hilft eine Anfrage per Mail an die Firma. Der Preis dieses Fernauslösers schlägt mit 41,65 Euro zu Buche. Hinzu kommen Kosten für Adapter und eventuell Kabelverlängerungen.”
Das sich Ihr Mann für das Projekt begeistert, bekommen Sie sicher auch noch geregelt. Wenn alle Stricke reisen, empfehle ich, die übrigen Kabel zu verwenden, um ihn an die Werkbank zu binden und nicht eher zu lösen, bis das Gerät fertig ist.
Hallo zusammen,
ich habe auch mal Digicam Scan Luft geschnuppert, um es dann schliesslich wieder zu lassen. Immerhin kam eine 10MP Canon 400D zum Einsatz, die Resultate waren aber letztlich nicht befriedigend.
Probleme: – Ausleuchtung
– Objektivverzerrungen (Unschärfe in den Ecken)
– Geschwindigkeit
Wenn man es schafft, die 2 Faktoren Kamera und Licht zu optimieren und viel Spass am basteln hat, wird man halbwegs vernünftige Resultate erzielen können. Doch extra 2 teure Digicams dafür anzuschaffen ist nicht jedermanns Sache.
Wie gesagt haben sich meine Tests nicht mit einem handelsüblichen Scanner messen lassen. Und ich wollte beides: perfektes Rohmaterial und klasse OCR. Für OCR empfehle ich übrigens Abby Finereader. M.E. gibt es da aktuell nichts besseres.
Mittlerweile gibts recht preiswerte Alternativen:
schon mal von Photokopierapparat mit Scanfunktion gehört?
Auf unserer Uni haben sie neuerdings diese Dinger. Inkl. USB Port. Und das tollste daran: es kostet genau nichts! Also auch für nicht Studenten eine Möglichkeit, preisgünstig perfekte PDF Scans von Büchern zu erstellen.
Der Scan dauert übrigens nicht länger als normales Photokopieren, und man kann wählen zw. 300-600 dpi Auflösung. Habe so bereits 3 400-Seiten Wälzer in je 20 Min. in ein pdf auf USB-Stick beamen lassen.
Vielleicht für den einen oder anderen von euch ein Geheimtipp…
Hi,
Kannst du mal den Typ des Fotokopierers mit Scannfunktion, der bei euch in der Uni steht, in Erfahrung bringen und hier noch einfügen? Würde mir das Teil gerne mal genauer anschauen.
Gibt es da keine Probleme beim scannen mit der Wölbung bei aufgeschlagenem Buch? Bis zu welcher max. Größe kann gescannt werden? Fragen über Fragen.
Bin mal gespannt, wann die ersten Espresso Book Maschinen in den Universitäten und Bibliotheken hier in Deutschland auftauchen. Dann wird es noch einfacher, Publikationen, sofern bereits digitalisiert und urheberrechtlich abgeklärt, an Ort und Stelle für eine geringe Gebühr in wenigen Minuten herzustellen.
Mach ich gern, schau heut mal nach.
Bei dickeren Büchern hat man ab und an das Problem mit der Wölbung. Da leidet halt dann der Buchrücken ein wenig…
Format: ich denke A3. Mehr wäre wohl unrealistisch. Für den Bücherscan aber vollkommen ausreichend.
Also, das Gerät ist ein
Toshiba e-studio 5520c
Format: A3
Zu finden bei:
http://electronicimaging.toshiba.de/cgi-bin/WebObjects/ToshibaPortal.woa/1/wo/SIRYRtVs8eZppfzZVe7SKM/3.0.9.7.0.3.1.1.3.5.3
Hm, feines Teil, da tränen einem die Augen. Einen Preis konnte ich nicht in Erfahrung bringen. Nur soviel, dass Teil mit 4 neuen Tonern (cyan, magenta, gelb, schwarz) auszustatten, kostet mal fix um die 800,- Euro. :-/
Aber auf alle Fälle auch eine schöne Sache, Kopien von Büchern für den privaten Gebrauch herzustellen, wenn das Gerät in der Uni zur freien Verfügung steht.
Noch eine Möglichkeit, Bücher zu digitalisieren, habe ich dieser Tage auf der folgenden Webseite entdeckt.
Bücher digitalisieren bei Promago
Das Buch wird nach seiner “Zerstörung” per Einzugscanner digitalisiert. Was es nicht alles gibt, aber mir wäre das nix, da ich es (noch) nicht über das Herz bringen kann, ein Buch auf die Kreissäge zu legen, um an die einzelnen Seiten zu kommen.
Wie weit ist mein Buchscannerprojekt? Nun, dass Y-Kabel aus Fernost ist letzten Samstag hier eingetroffen. Leider musste ich feststellen, dass sich an den 2 Enden keine USB-Buchsen, sondern Stecker befanden. Auf dem Bild der Auktion und auch der Beschreibung des Artikels war zu entnehmen, dass sich dort eigentlich hätten Buchsen befinden müssen.
Na was soll’s, bevor ich das Y-Kabel zurück nach Hong Kong schicke und ein anderes verlange, besorge ich mir lieber noch 2 USB Adapter von Buchse auf Buchse für jeweils 2,19 € (inkl. Versand) und kann das Thema Verkabelung dann hoffentlich endlich ad acta legen.
Einige Versuche, diverse Fotos von einer Kamera mit der Texterkennungs-Software Omnipage zu bearbeiten und als PDF abzuspeichern, wurden auch erfolgreich durchgeführt. In dem Fall wäre eine vorherige Bearbeitung mit der Software Scan Tailor nicht notwendig. Näheres dazu aber in den nächsten Tagen bzw. Wochen.
Ich musste mitlerweile eingestehen, dass die Erkennung von Omnipage 17 besser ist als die der Konkurrenz. Ich erreiche doch damit glatt eine Genauigkeit von 99.9%…
Zur geometrischen Korrektur von Buchseiten empfehle ich übrigens Book Restorer v4.2.1 (kostenpflichtig, oder eben auch nicht…). Es gibt aktuell nichts besseres zum Begradigen von Textzeilen.
Vielen Dank für den Hinweis auf Book Restorer. Die Ausprobierversion kommt sogar mit derartigen Scans zurecht:
http://yfrog.com/3odeformedp
Vielleicht lässt sich mit Book Restorer der Traum vom Scanner realisieren, der mit einer mittig über dem im 90-Grad-Winkel aufgeschlagenen Buch angebrachten Kamera auskommt.
cappac: Deine Beobachtung betreffend OmniPage kann ich bestätigen. Im Vergleich zum FineReader arbeitet OmniPage vor allem flotter.
Book Restorer ist tatsächlich kein schlechtes Programm. Obwohl es bei mir ab und an mal hängen bleibt bzw. abstürzt, was aber sicher auf Bedienungsfehlern meinerseits beruht. Ist denn ein Preis für die Software bekannt? Die Firma i2S SA, die übrigens auch schmucke Buchscanner herstellt, hält sich da ja sehr bedeckt.
Hier der direkte Link zu Book Restorer und darunter geht es zu einem vollautomatischen Buchscanner.
Book Restorer
Buchscanner für betuchte Büchernarren
Soeben erhielt ich einen Anruf der Walter Nagel GmbH & Co. KG aus Bielefeld. Das ist der offizielle Vertriebspartner der französischen Firma i2S SA für den deutschsprachigen Raum.
In diesem sehr interessanten Gespräch wurde mir unter anderem der Preis für eine vollwertige Einzelplatzversion von Book Restorer mitgeteilt, den ich euch nicht vorenthalten möchte. Danach werden 4.000,- Euro für die Software nötig sein, um diese uneingeschränkt zu nutzen. Eine etwas abgespeckte Version, mit der max. 50.000 Seiten bzw. Images bearbeitet werden können, kostet 1.000,- Euro. :-/
Ohne Frage, ein stolzer Preis für ein Programm, dass aber derzeit sicher im Bereich der Digitalisierung weltweit eines der besten sein dürfte. Für weitere Fragen zu Book Restorer oder anderen Buchscannern, z. B. dem Einstiegsmodell von i2S SA, dass für rund 10.000,- Euro zu haben ist, wendet ihr euch am besten direkt an die Firma Walter Nagel über obigen Link.
Also zurück zu Scan Tailor, oder … ?
Ich frage mich, ob die Verwendung eines Roboterarmes, wie sie bei conrad.de angeboten werden, auf die Dauer nicht zu flexibleren Ergebnissen führen würde. Nur eine Kamera oder Scanner, größere Seiten möglich und der Automatisierungsgrad wird begrenzt durch die Fähigkeiten zur Programmierung.
Da die Arme eine Lernmodeus haben dürften, ist nur eine Kamera wohl immer möglich, das Umblättern braucht noch wenigstens einen Sensor oder man gibt Seitenzahlen als Parameter ein. Vielleicht im übernächsten Winter…
Interessant ist das allemal. Ein automatischer Seitenumblätterer sozusagen. Ab 149,95 € bekommt man die Roboterarme bei conrad.de. Man müsste sich so ein Teil mal bestellen und ein wenig damit experimentieren.
Aber eben, nicht heute oder morgen …
Hallo wiedereinmal,
also ich bin seit einer woche der besitzer des Plustek Optibook 3600. bei Media Markt hab ich es bestellt und hat 250 € gekostet was eine gute alternative ist zu einem selbst gebauten scanner ist.
Ich habe heute mein erstes Buch gescannt und mit allem drum und dran 4 stunden gebraucht (830 Seiten). in der Stunde schafft man ca 250 seiten und ich hab noch ein paar pausen eingelegt.
Nach dem scannen wandelt die OCR von Abbyy Finereader die bilder in texte um und kann sie dann in word, works oder text datei ausgeben….bei bilder hat sich das programm etwas schwer und da stehen dann zeichenkonstellation die man nicht entziffern kann und wenn am anfang eines satze ein buchstabe ganz groß gedruckt ist erkennt das ocr das auch nciht. ansonsten ist das was ich kurz gelesen habe gut gelungen.
ICh hab mir die texte in Word ausgeben lassen und sie dann als PDF abgespeichert.
Mit Calibre wandel ich die PDF dann in ePub um was sehr gut geht.
Zum lesen hab ich mir ein iPad gekauft und da kann ich auch das buchcouver mit richtig anzeigen lassen ( in Calibre kann man ein couver auswählen was man für das jewalige buch haben will)
1 Buch geschafft, bleiben noch 115
achso noch als zusatz…. das scann programm kann man sagen welche seite es um 180° drehen soll..also muss man nur umblättern und auf die scannfläche legen
Moin Thomas,
Besten Dank für deinen Erfahrungsbericht. 4 Stunden zum einscannen eines 830 Seiten starkes Buches, kommt dann noch die Zeit für die Nachbearbeitung hinzu?
Na da hast du ja noch was vor dir. Viel Erfolg beim Scannen der restlichen 115 Bücher.
Gruß Uwe
Hallo Uwe,
Die Zeit ist schon komplett… Ich scanne die Seiten ein und wenn alle gescannt sind Klick ich einfach im Programm auf weiter und dann agiert die OCR automatisch und gibt mir den Text dann in word aus. Und dann als pdf oder anderes Format speichern und in ein Format umwandeln das ein ebook Reader lesen kann.
Ist natürlich ein Haufen Arbeit. Bei deinem Vorgang brauchst du doch mehr Zeit oder?
Hab jetzt schon ein zweites Buch fertig. Das war genauso dick… Bei dicken Büchern muss man zur Mitte hin den Buchrücken ein Büschen an die scannerkante drücken aber es bleibt am rücken kein schaden zurück.
Also wenn man nicht handwerklich begabt ist, ist dieser Scanner ein gute Sache und vom kosten Faktor kommt er mit einem selbstgebauten Scanner fast gleich da man dort ja 2 Kameras braucht und die sind auch nich so günstig
Na ja, das einscannen geht eigentlich ziemlich fix und mitunter schneller als bei professionellen Buchscannern. Die Nachbearbeitung ist halt zeitaufwendig. Kommt aber auch darauf an, ob es sich bei dem Buch nur um reinen Text handelt oder einen Bildband mit hochauflösenden Grafiken.
Die Bearbeitung eines Romans z. B. der nur als 1:1 Kopie auf der Festplatte abgelegt werden soll, dauert auch nicht so lange wie ein Sach- oder Fachbuch, dass als durchsuchbares PDF gespeichert werden soll. Da muss die OCR-Software ran und anschließend wird der Text überprüft und gegebenenfalls korrigiert.
Ja, vom Preis für die Grundausstattung her nehmen sich unsere zwei Methoden nicht viel und vom Zeitaufwand ist das auch ungefähr gleich. Wollen wir hoffen, dass uns in Zukunft nicht die Lust am Bücher scannen vergeht.
Hallo,
hier [LINK wurde entfernt] gibt es einen Testbericht über VueScan, das sehr gut mit dem OpticBookPro zusammen arbeitet. Das Knopf drücken kann man sich damit ersparen, da automatisch weiter gescannt wird.
Es werden viele Tips zum Buchscannen und der Nachbearbeitung gegeben – viele davon auch für den hier gezeigten Buchphotographieautomaten anwendbar.
Hi,
Den Link zum Forum der Webseite donationcoder.com wurde von mir entfernt, da Firefox eine gesicherte Verbindung zu einem ungültigem Sicherheitszertifikat auf meinem PC nicht aufbaut.
VuesScan dagegen habe ich auf die wikipedia weitergeleitet. Sollte man sich auch mal genauer anschauen das Proggi. Vielen Dank für den Tip
Gruß Uwe
Hallo Uwe,
prima Infos für alle die mobil lesen wollen.
Mich verwundert etwas dass so wenig Probleme bei dickeren Büchern haben,sie lassen sich nur sehr schwer eben auflegen.Hab neulich probiert ein gut gebundenes 600-seitiges Fachbuch abzulichten, die starke Krümmung in der Mitte hat selbst Finereader nicht gepackt.
Hast du mir dazu noch einen Tip?
Gruss
Hendrik
Hi Hendrik,
Ein Möglichkeit wäre, den Buchrücken mit einer Kreissäge abzutrennen und die losen Blätter danach mit einem Einzugscanner zu digitalisieren. Aber eben, dabei wird das Buch als solches zerstört und diese Methode ist sicher nicht jedermanns Sache.
Ich nehme an, du benutzt einen normalen Flachbettscanner, bei dem die Krümmung selbst durch starken Druck und vor allem bei dickeren Büchern hinderlich sein kann. Oder hast du dir einen eigenen Buchscanner gebastelt?
Gruß Uwe
Hallo Uwe,
ich habe quasi mal den Buchscanner von dir simuliert,also das Buch aufgeschlagen und fotografiert.

Dabei hab ich festgestellt dass ich ziemlich Druck auf die Glassplatte aufbringen musste,
damit die Krümmung nicht zu stark ist.
Ich bin grad ziemlich in dem ganzen Thema gefangen…
Das Buch auseinander sägen und die Blätter mit einem ScanSnap durchlaufen lassen, klingt echt cool,
aber dann muss erst mal noch alles formatiert werden
Das Formatieren wird mit Finereader nicht schlecht erledigt, aber bei Büchern mit vielen Abbildungen etc.
muss man oft manuell eingreifen, bei 500 Seiten ist der Tag rum, ich wollt doch eigentlich mehr lesen als scannen
Also vielleicht doch nur scannen, ohne OCR und Formatierung, gibt aber bei 500 Seiten riesige pdf Dateien,
die nicht unbedingt sehr schön aussehen und sich nicht durchsuchen lassen.
Will ich das Buch vielleicht doch noch mal lesen, oder nur noch als ebook haben?
Ich könnt es ja gleich als ebook kaufen, wäre da nicht die Sache mit dem (blöden) DRM…
Auf das Thema Buchscanner bin ich gekommen, da ich viel lese und mir immer eigene Notizen ins Buch mache.
Leider find ich die Notizen nicht mehr so gut wieder, warum also nicht gleich alles elektronisch machen?
Mit dem PDF Annotator könnte man das gut machen, setzt allerdings ein PDF voraus was sich beschreiben lässt
und hier kommt dann auch schnell das DRM ins Spiel.
Schöner wärs noch mit einem ebook reader, für Notizen wäre aber ebook.pub Vorraussetzung, glaub ich wenigstens.
Würd mich freuen wenn du mir noch deine Meinung zu dem Ganzen sagen könntest.
Vielen Dank und Gruss
Hendrik
Hi,
spannende Sache.
Ist denn in ScanTailor eine Batchbearbeitung möglich?
In der aktuellen Omnipage Version werden auch Digitalkameras mit unterstützt.
Was ich noch suche sind Digikameras mit mehr als 12 Mio Pixel und einer Fernbedienmöglichkeit.
Kennt da jemand was? Könnte hier vielleicht noch eine Empfehlungsliste entstehen.
Gruß
Matti
Hi Matti,
Die erste Frage kann ich dir so nicht beantworten. Am besten du experimentierst mal ein wenig mit Scan Tailor.
Eine Empfehlungsliste für Digitalkameras über 12 Mio Pixel wäre sicher auch angebracht, wenn genügend Erfahrungsberichte zur Verfügung stehen.
Dieser Artikel wird, laut Statistiken und dank des Google-Translator-Plugins auch in anderen Ländern mit Interesse verfolgt. Schauen wir mal, ob eine derartige Liste entsteht.
@Hendrik
Sorry, für die späte Antwort.
Soso, du bist also einer derjenigen, die Notizen in ihre Bücher schreiben? :-/
Nein, ist ja nicht schlimm und im Endeffekt sind es ja deine Bücher und irgendwo hab ich mal gelesen, dass ein Buch mit Randnotizen dem zukünftigen Leser sogar behilflich sein kann.
Wenn du viele Notizen machst und der PDF Scann durchsuchbar sein soll, kommst du wohl um eine OCR Bearbeitung nicht herum.
Für die Begutachtung der Software PDF Annotator und ebook.pub habe ich noch keine Zeit gefunden. Durch einfaches rumexperimentieren und improvisieren wurden aber schon die tollsten Erfindungen gemacht. Schließlich ist dieser Buchscanner auch nach einer Idee des Erfinders im Do it yourself-Forum entstanden. Probier einfach etwas herum, um die für dich beste Lösung zu finden.
Übrigens habe ich erst gestern eine News aufgefangen, dass Xerox nun auch die Espresso Book Machine verkauft. Vorerst nur in den USA und zu einem noch unbekannten und sicher hohem 5-stelligen Preis, aber bisher ist (fast) alles was in den Staaten an Neuheiten auftauchte, im Laufe der Zeit über den großen Teich geschwabt.
Ja das mit der digitalen Rechteverwertung (DRM) ist auch ein etwas heißes Eisen. Man muss aufpassen, das man da keine Grauzonen betritt und sämtliche ebook-Reader Hersteller nutzen ja nicht umsonst ihre eigenen DRM Systeme, um einen Mißbrauch zu vermeiden oder der ungezügelten Verfielfältigung Einhalt zu gebieten.
Aber wer weiß, sicher ist es in absehbarer Zeit möglich, einen ebook-Reader selbst zu bauen. In Zeiten von i-Pads sicher keine allzugroße Herausforderung mehr und es würde mich wundern, wenn es da nicht schon eifrige Programmierer gibt, die die nötige Software erarbeiten.
Auch wenn ich den Standpunkt vertrete, dass das physische Buch nicht vom eBook verdrängt werden darf, sollte man der Zukunft aufgeschlossen gegenüber stehen. Aber, ein elektronisches Buch kann vom Anbieter unter Umständen gelöscht werden und für die Entwendung eines haptischen Buches braucht man schon einen Durchsuchungsbefehl.
Gruß Uwe
Endlich gibt es eine Software, die pdf’s mit 100%-ig fehlerfrei erscheinenden Texten produziert: Adobe Acrobat (ab Version 9). Das Verfahren nennt sich “Clearscan” (einfach “Acrobat Clearscan” googlen). Es funktioniert so: Die gescannten Bilder werden auf Text durchsucht. Nichttext bleibt Bild im Endresultat (gut für Texte mit vielen Abbildungen). Text wird ge-OCR’t. Das Ergebnis der OCR wird aber nicht im Resultat-pdf angezeigt, sondern nur unsichtbar hinterlegt (lediglich für Textsuche, Herauskopieren von Texten, oder Vorlesefuntionen). Ansonsten werden aus den grafischen Textbuchstaben Fonts erzeugt, die im pdf embedded werden, und der entsprechende Fontbuchstabe ist dann das, was der Leser sieht. Das ist eine wunderbare 100%-ige Repräsentation des Originalbuchstabens, selbst wenn die Acrobat-OCR versagte (d.h. der hinterlegte aber unsichtbare Buchstabe nicht übereinstimmt). Acrobat versucht dabei, die erzeugten Fonts klein zu halten, indem nicht nur exakt gleiche sondern auch weitestgehend ähnlich aussehende Buchstaben zusammengefasst werden. Die grafische Repräsentation wird dabei schön geglättet (Übliche Fonts sind ja sowieso über Vektordefinitionen beschrieben).
Seit ich dieses Verfahren verwende, benötige ich nach dem Scannen kaum Zeit mehr, in der ich persönlich in den pdf-Erzeugungsprozeß eingreifen muß:
1. Scannen (leider manuell)
2. Scantailor erkennt Textspiegel (autom.)
3. Kontrolle Textspiegelerkennung Scantailor (leider manuell erforderlich, Scantailor liegt manchmal daneben)
4. Erzeugung bereinigte Seiten durch Scantailor (autom.)
5. Import der Bilder in Acrobat X (autom.)
6. OCR mit Clearscan in Acrobat X (autom.)
7. Abspeichern des pdf
Nur Schritt 1 und 3 erfordern noch menschliches Eingreifen (und Schritt 7… 5 Sekunden
Resultat des Ganzen ist ein pdf, welches eine nahezu perfekte, aber jedenfalls völlig(!!!) visuell textfehlerfreie Repräsentation des Originals ist, und das nur ganz geringfügig größer ist als ein reines Text-PDF (wenn ansonsten keine Abbildungen im Text sind). Die 100%-ig fehlerfreie Textanzeige, darauf will ich nochmal hinweisen, ist hier NICHT durch zeitaufwendiges Korrekturlesen entstanden, sondern verfahrensimmanent schon so vorhanden.
Ich nutze ein iPad als Reader, sowie ein eInk-Gerät mit 10 Zoll… die mit Clearscan entstandenen pdf’s eignen sich vorzüglich für diese Readergröße (bei üblichen Textspiegelgrößen).
Für 6 Zoll Reader ist das Verfahren aber kaum brauchbar, da ja ein pdf ohne Text-Reflow entsteht, d.h. der Textspiegel ist wie im Original, d.h. für kleine Screens zu klein (bzw. evtl. kann man im Querformat über die Seite scrollen). Durch konvertieren in andere Formate verschenkt man den Vorteil der Originaltreue des Clearscan, da ins neue Format (z.B. epub) die erzeugten Clearscanfonts nicht übernommen werden, sondern nur die nicht sichtbare Texterkennung aus dem pdf… und die hat auch bei Adobe Acrobat OCR nun mal ihre Fehler ab und zu. Jedenfalls scheint Adobe Acrobat OCR in dieser Hinsicht nicht besser als FineReader zu sein… was aber wie gesagt wegen Clearscan in den pdf’s keine Rolle spielt: die optische Repräsentation ist dort 100%-ig, bei ganz kompakten Dateigrößen.
P.S.
Noch eine Anmerkung zum geschilderten Verfahren… es mag nicht wichtig erscheinen, aber da die pdf-embeddeden Fonts aus den Scans erzeugt werden, sind sie weitgehend identisch mit den im Buch verwendeten Fonts. Das mag nicht für jeden Text wichtig sein, das gleiche optische Bild zu haben wie im Original, aber bei manchen Büchern mögen sich die Hersteller was dabei gedacht haben, genau diesen oder jenen Font verwendet zu haben, mit diesem Zeichenabstand und jenem Zeilenabstand… und das gesamte Erscheinungsbild wird dann bei Acrobat Clearscan eben sehr gut reproduziert… sieht also (weitgehend) aus, wie vom Verlag erzeugt!
Hallo Max,
Vielen Dank für deine wertvollen Beiträge.
Hallo,
aufgrund meiner Sehbehinderung bin ich sehrh häufig dazu gezwungen, mir Texte durch Einscannen und OCR-Verfahren zu erschließen. Als ich letzte Woche mal wieder ewig vor dem Scanner in neimem Büro gesessen habe, hatte ich die Idee, mal ein bisschen mit meiner relativ neuen Lumix 14 MP Digitalkamera zu experimentieren. Die Ergebnisse waren leider mehr oder weniger unbrauchbar, weshalb ich mich auf eine Recherche im Netz begeben habe und schließlich auch hier gelandet bin.
Ich finde das Projekt sehr interessant. Leider sind die vorhandenen Ressourcen zum Nachbau auf diybookscanner.org aus meiner Sicht aber etwas unübersichtlich. Bevor ich mich also in meinem Freundeskreis umhöre, wer mir bei der Verwirklichung des Projektes behilflich sein würde, ein paar Fragen an Uwe:
Funktioniert das Gerät bzw. gesamte Verfahren jetzt so, wie es erwartet wurde? Welche Infos / Anleitung hast Du als Basis für Dein Projekt verwendet? Eignet sich das Verfahren auch für Sachbücher mit mehreren Abbildungen?
Viele Grüße,
Markus
Hi Markus,
Das Gerät funktioniert und auch die Bearbeitung mit Hilfe der Software Scan-Tailor ist möglich. OCR Erkennung wurde ebenfalls erfolgreich mit Omnipage getestet. Wenn auch die Texterkennung nicht bei 95% liegt und eine Nachbearbeitung unumgänglich ist.
Bevor das Buch also im druckfertigen PDF Format vorliegt, wird ein nicht unerheblicher Arbeitsaufwand vorausgesetzt. Abhilfe schafft da meines Wissens derzeit nur ein Kauf von professionellen Bookscannern ab 10.000 USD. Eventuell lässt sich aber der Arbeitsaufwand nach der Fertigstellung der Bearbeitungssoftware für Linux (siehe diybookscanner.org Forum) verkürzen.
Die Infos für mein Projekt stammen vorwiegend von diybookscanner.org und aus dem Internet. Eine Anleitung für meinen Buchscanner gab es nicht. Ist halt ein Unikat.
Das Verfahren eignet sich sicher auch für Sachbücher mit mehreren Abbildungen. Nur sollte man das Ergebnis nicht mit dem Original vergleichen, da auch die für den Druck eingesetzten Papierqualitäten oder die jeweilige Preiskategorie der Laserdruckermodelle einen entscheidenden Einfluss auf die fertige Seite nehmen.
Gruß Uwe
Hallo,ich scanne auch Bücher und möchte aber die Schrift verbessern. D.h. er soll nach der Texterkennenung die Schriftfarbe, -Kontrast stärken.
Wie kann ich das bearbeiten?
Hi,
Ein Weg führt meiner Meinung nach über ein Textbearbeitungsprogramm wir Word oder Open Office, in den du die Texte der gescannten Bücher einfügst. Dann kannst du den kompletten Inhalt nach eigenen Ansprüchen abändern und erneut ausdrucken.
Sicher gibt es auch ein professionelles Bildbearbeitungsprogramm, dass diese Arbeiten erledigt. Vielleicht ist Gimp ganz gut geeignet, um die Schriftfarbe und den Kontrast des Textes zu verbessern?
Gruß Uwe
Hallo Uwe,
mein “Sommerprojekt” wird ein Buchscanner werden und ich verfolge aufmerksam die Diskussion in diesem Forum. Was mich interessiert ist: Ist der Scanaufwand mit einer Kamera mehr als doppelt so groß, als wie mit 2 Kameras. Schließlich ist das auch ein Preisfaktor.
Frohes Schaffen
Wolfgang
Hi Wolfgang,
Der Zeitfaktor spielt meiner Meinung nach eine entscheidende Rolle, wenn nur 1 Kamera verwendet wird. Das Einscannen der Seiten dürfte die doppelte Zeit in Anspruch nehmen.
Viel Erfolg mit deinem Sommerprojekt.
Gruß Uwe
Hallo Herr Ross,
ersteinmal wollte ich mich für die hier von Ihnen veröffentlichten Informationen rund um das Thema Buchscaanner bedanken!
Ich hab mir einen Buchscanner nach der Vorlage von Daniel Reetz gebaut und bin damit auch sehr zufrieden, zumindest was die Handhabung und die Geschwindigkeit angeht, in der ich Bücher “scannen” kann. Ebenfalls positiv hervorzuheben ist die Tatsache, dass sich damit praktisch jede Größe von Büchern scannen lässt, ohne das das Buch als solches Schaden nimmt.
Das Einzige was mich auf den Bildern stört sind Spiegelungen von der von mir verwendeten Lichtquelle (ein kleiner Halogenscheinwerfer aus dem Baumarkt mit 120 Watt) und dem Holzrahmen an dem er befestigt ist. Diese Spiegelungen treten logischerweise besonders stark auf, bei Seiten mit dunklen Bildern oder schwarzem Hintergrund.
Ist der von mir verwendete Scheinwerfer die optimale Beleuchtungseinheit für einen Buchscanner? Kann es eventuell auch an dem im Scheinwerfer enthaltenen Leuchtmittel liegen? Liegt es an dem Einfallswinkel des Lichts in das V des Scanners? Spiegelt kaltes (weißes) Licht weniger? Wie kann ich in Zukunft solche Spiegelungen vermeiden?
Ich bin für alle Anregungen SEHR DANKBAR!
Viele Grüße aus dem Schwarzwald, an alle Scanner da draußen.
DIY-Bookscanning rocks!!!