Wenn Sie gedruckten Text in digitalen Text konvertieren möchten, den Sie kopieren, einfügen, bearbeiten und durchsuchen können, müssen Sie OCR-Scanner (Optical Character Recognition) verwenden.
Wenn Sie ein Foto eines Dokuments scannen oder aufnehmen, wird dieses in einem Format wie JPEG oder PDF gespeichert. OCR-Software kann dann die Buchstaben und Zahlen innerhalb dieser Dokumente erkennen und sie in ein durchsuchbares PDF konvertieren. 4 Methoden zum Erstellen und Bearbeiten von PDF-Dateien für Free 4 Methoden zum Erstellen und Bearbeiten von PDF-Dateien kostenlos aus allen gängigen Dateitypen in unserer Computerwelt, PDF ist wahrscheinlich eine der restriktivsten, während zur gleichen Zeit für alle verfügbar sein zu verwenden (vor allem zu lesen) .... Lesen Sie mehr, oder in eine Datei, die Sie in Programmen wie Microsoft Word bearbeiten können.
Das Problem ist, dass einige OCR-Scanner viel besser funktionieren als andere, wobei das Beste am Geldbeutel liegt.
Omnipage18 zum Beispiel kostet 150 Dollar, ist aber besonders gut darin, verschiedene Sprachen zu erkennen. Adobe Acrobat Pro DC kostet unglaubliche $ 400, hat aber eine unglaubliche Genauigkeit. ABBYY FineReader kostet 150 US-Dollar, aber es ist fantastisch, Dokumente wie Zeitschriften und Broschüren in durchsuchbaren Text umzuwandeln. Wir werden das Online-Angebot von ABBYY später in diesem Artikel testen.
Wenn Sie jedoch nach freien Alternativen suchen, die Sie unter Windows oder OS X herunterladen und verwenden können, sollten Sie diese OCR-Tools testen. Die 5 besten OCR-Tools zum Extrahieren von Text aus Bildern Die 5 besten OCR-Tools zum Extrahieren von Text aus Bildern Wenn Sie haben Sie jede Menge Papier, wie bekommen Sie all diesen gedruckten Text in etwas umgewandelt, das ein digitales Programm erkennen und indexieren kann? Halten Sie eine gute OCR-Software in der Nähe. Weiterlesen . Wenn Sie jedoch lieber ein kostenloses OCR- Online- Tool verwenden möchten, lesen Sie die unten aufgeführten Ergebnisse, da wir die ersten Tests durchgeführt haben.
Der Test
Scheint, dass die meisten Leute jetzt ihre Smartphones verwenden, um sie zu scannen Scannen und verwalten Ihre Quittungen, sparen Platz, Papier und Zeit Scannen und verwalten Sie Ihre Quittungen, sparen Platz, Papier und Zeit Quittungen sind leicht verloren und schwer zu finden, wenn Sie sie brauchen die meisten. Glücklicherweise löst die digitale Lösung beide Probleme. Lesen Sie weiter, ich entschied mich für die Scannable App von Evernote (Kostenlos für iOS und Android). Ich überflog die erste Seite von Richard Dawkins Climbing Mount Improbable, um zu sehen, welche Ergebnisse wir mit sehr einfachen Formatierungen erzielen konnten. Ich habe auch eine Seite von Tim Ferriss ' The 4-Hour Chef gescannt, um die Scanner mit einer etwas komplizierteren Formatierung auszuprobieren. Ich habe jede dieser Dateien als PDF gespeichert.
Diese Dokumente wurden dann durch einige der angeblich besten Online-OCR-Tools geleitet, um zu sehen, wie gut sie waren.
Kostenlose Online-OCR
Glücklicherweise ist keine Registrierung für die kostenlose Online-OCR erforderlich. Und ich war doppelt beeindruckt, als ich ihren Anspruch sah, die Formatierung und das Layout meines Dokuments beizubehalten.
Die Website behauptet, PDF, GIF, BMP, JPEG, TIFF und PNG als Eingabe unterstützen zu können. Ausgaben können entweder DOC, ein PDF-Textdokument, RTF und TXT sein. Leider konnte ich nicht herausfinden, ob sie eine Dateigröße haben.
Basisdokument in PDF
Absolut perfekt umgesetzt. Es gibt nicht viel mehr zu sagen! Wir haben einen sehr guten Start.
Basisdokument nach DOC
Die eigentlichen Worte scheinen sich einwandfrei gewandelt zu haben, abgesehen von der "Unze" von "Mount Rushmore", die irgendwie unwissend geht. Die Formatierung ist jedoch eine andere Geschichte. Viele Kommas wurden durch Unterstriche ersetzt und zufällige Leerzeichen wurden an allen Stellen des Dokuments eingefügt. Wenn man später sieht, wie sich die Premium-Software in diesem Test durchgesetzt hat, ist das keine schlechte Leistung.
Komplexes Dokument in PDF
Das Konvertieren des Dokuments dauerte satte 120 Sekunden! Nach Fertigstellung war der gesamte Text mit einer Genauigkeit von etwa 95% konvertiert worden, obwohl der Text in der separaten Box oben rechts auf der Seite nicht durchsucht werden konnte. Einige andere Zeichen in der gesamten PDF-Datei waren ebenfalls falsch.
Komplexes Dokument nach DOC
Diesmal dauerte die Konvertierung nur 10 Sekunden, wobei der Text erneut mit einer Genauigkeit von etwa 95% konvertiert wurde. Es gab einige seltsame Abstandsprobleme, und die Software hatte Probleme beim Konvertieren der Schriftart oben rechts im Dokument und verpasste hier und da ein paar Zeichen.
Urteil
Wenn Sie einfach formatierte Dokumente in PDF konvertieren möchten, ist dies ein fantastisches Werkzeug. Hinsichtlich der Umstellung auf DOC waren die Ergebnisse nichts, worüber man nachdenken könnte.
i2OCR
i2OCR macht einige beeindruckende Behauptungen. Das Tool erkennt über 60 Sprachen, kann mehrspaltige Layouts verarbeiten (durch Entfernen der Formatierung), hat keine Dateigrößenbeschränkungen, kann hochgeladene Dateien und URLs konvertieren. Und Sie müssen sich auch nicht registrieren, um dieses Tool zu verwenden.
Der Service funktioniert, indem einfach der Text aus Ihrem Bild extrahiert und unformatierter Text ausgegeben wird. Sie können Fehler schnell in der Seitenansicht korrigieren, bevor Sie den Text in andere Programme kopieren oder als DOC, PDF oder HTML herunterladen.
Hinweis: Als ich versuchte, meine PDF-Dokumente hochzuladen, wurden diese von i2OCR abgelehnt, also musste ich diese in JPEG umwandeln (indem ich einen Screenshot von ihnen anfertigte und dann die Dateien hochlade).
Basisdokument in Nur-Text
Aufgrund der Funktionsweise dieses Tools gehen alle Formatierungen verloren, obwohl die Konvertierung von Bild zu Text fast perfekt war. Es gab einige kleine Fehler wie Absatzabstand, und einige Kommas wurden durch Punkte ersetzt, aber das sind kleine Nigger.
Komplexes Dokument in Nur-Text
Der Großteil des Textes wurde ohne allzu viele Fehler umgesetzt, abgesehen von dem Titel und dem Rezept oben rechts, das für dieses Tool nicht lesbar war. Die Art, wie die Spalten in reinen Text umgewandelt wurden, war alles andere als ideal. Wenn Sie diese Umwandlung durchführbar machen möchten, ist viel Zeit erforderlich, um die Zeilen in zusammenhängende Sätze umzuordnen.
Urteil
Für grundlegende Dokumente funktioniert i2OCR großartig. Die Fähigkeit, den Text vor dem Download zu bearbeiten, ist auch eine sehr nette Geste. Für komplexere Dokumente ist die Konvertierung jedoch immer noch ziemlich genau, aber die Art, wie der Text ausgegeben wird, wird Ihr Leben nicht viel einfacher machen.
Online-OCR
Online-OCR unterstützt derzeit 46 verschiedene Sprachen und kann PDF, JPG, BMP, TIFF und GIF in das Word-, Excel- oder Nur-Text-Format konvertieren. Die Website behauptet "konvertierte Dokumente sehen genauso aus wie das Original - Tabellen, Spalten und Grafiken".
Die Version, die Sie ohne Registrierung verwenden können, ermöglicht die Konvertierung von bis zu 15 Bildern pro Stunde (5 MB Limit). Wenn Sie sich für ein Konto anmelden, können Sie über dieses Limit hinaus weitere Seiten erwerben, während Sie auch mehrseitige Dokumente und ZIP-Archive konvertieren können.
Basisdokument nach DOC
Das Basisdokument wurde fehlerfrei konvertiert, abgesehen von der römischen Ziffer. Ich wurde nicht abgeholt. Wie auf der Website versprochen, war die Formatierung genau so wie im Buch. Ein großes Lob an dieses Tool.
Komplexes Dokument nach DOC
Nachdem ich von den bisherigen OCR-Tools bei der Konvertierung des komplexen Dokuments enttäuscht war, war ich von Online-OCR massiv beeindruckt. Das Layout war nahezu perfekt, wie Sie oben sehen können. Wieder einmal wurde das Rezept nicht so gut aufgenommen, aber alle anderen kleineren Fehler waren vernachlässigbar.
Urteil
Absolut fantastische Ergebnisse von Online OCR. Der einzige Nachteil, den ich sehe, ist, dass es keine Möglichkeit gibt, die konvertierten Dokumente als PDF herunterzuladen, da die genannten Ausgabeformate nur DOCX, XLSX und TXT enthalten.
ABBYY FineReader Online (10-Seiten-Testversion)
Wie bereits erwähnt, ist ABBYY einer der Marktführer für OCR-Software und kostet rund 150 US-Dollar für sein komplettes herunterladbares Programm. Sie bieten jedoch eine 10-seitige kostenlose Testversion für ihr Online-Tool an (Registrierung erforderlich). Mit einem Online-Tool für ein Abonnement von 5 US-Dollar können Sie jeden Monat 200 Seiten konvertieren.
Die akzeptierten Dateien können bis zu 100 MB groß sein, in einem der folgenden Formate: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP und PNG. ABBYY erkennt auch fast 200 Sprachen. Besonders beeindruckend sind die Ausgaben mit DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 und EPUB.
Sie können sogar während Ihrer Testphase einige BETA-Funktionen ausprobieren. Die erste Möglichkeit besteht darin, Ihr Dokument in eine andere Sprache zu übersetzen. Die andere Möglichkeit besteht darin, das konvertierte Dokument in Ihr Cloud-Speicherkonto zu exportieren, egal ob Dropbox, Google Drive, Evernote, Microsoft OneDrive oder Box.
Basisdokument zu DOCX
Die Gesamtergebnisse waren gut, aber nicht erstaunlich, da dies ein Premium-Produkt ist. Mehrere Kommas und Punkte wurden vertauscht, mehrere Anführungszeichen wurden durch ein Sternchen ersetzt, ein paar Großbuchstaben fehlten und ein Wort (Literalist) wurde falsch geschrieben.
Komplexes Dokument nach DOCX
Nach der Konvertierung gab es nur sehr wenige Fehler im Text innerhalb des Dokuments (abgesehen von der OCR, die erneut mit der Schriftart dieses Rezepts kämpft!), Aber die Formatierung ließ viel zu wünschen übrig.
Die drei Spalten nahmen irgendwie zwei Seiten ein, wobei die zentrale Spalte nur auf der zweiten Seite erschien. Wenn Sie wirklich etwas mit diesem konvertierten Dokument machen wollten, würden Sie sich die Haare ausreißen.
Basisdokument in PDF
Beim Überprüfen der konvertierten PDF-Datei konnte ich keinerlei Fehler finden. Vielleicht haben wir herausgefunden, wo ABBYY sich auszeichnet. Fantastische Ergebnisse.
Komplexes Dokument in PDF
Auch hier konnte ich in dieser konvertierten Datei keine Fehler finden. ABBYY versteht es offensichtlich, außergewöhnlich gut in PDF zu konvertieren.
Urteil
Wenn Sie gerne ein paar Dollar zahlen, scheint die Konvertierung in PDF-Dateien mit diesem Service hervorragend zu funktionieren. Die Möglichkeit, konvertierte Dateien in Ihren Cloud-Speicher zu synchronisieren, ist besonders nützlich, wenn Sie eine große Menge an Dokumenten scannen. Wie auch bei den anderen Optionen hat ABBYY immer noch nicht herausgefunden, wie man Dokumente problemlos in DOC konvertieren kann, um sie einfach zu bearbeiten.
Das endgültige Ergebnis
Wenn Sie, wie die meisten Leute, nur ein paar Zeitschriftenartikel und Haushaltsrechnungen scannen möchten, müssen Sie diese Dokumente nicht bearbeiten. Daher ist die direkte Konvertierung in ein PDF für Sie geeignet, da Sie diese Dokumente weiterhin durchsuchen können. Dafür war Free Online OCR definitiv das beste kostenlose Tool, das wir getestet haben. Davon abgesehen, wenn Sie bereit sind, 5 $ pro Monat für nahezu Perfektion zu bezahlen, war ABBYYs FineReader Online etwas genauer.
Wenn es darum geht, Dokumente in DOC zu konvertieren, haben wir keine Lösung gefunden, die perfekt war, aber die besten Ergebnisse wurden mit Online OCR erzielt. Die Konvertierung war nicht perfekt, aber die Integrität der Formatierung wurde weitgehend erhalten und Fehler waren vernachlässigbar. Wenn wir diese Ergebnisse mit dem "Premium" -Angebot von ABBYY vergleichen, können Sie nicht anders, als massiv beeindruckt zu sein.
Die OCR-Funktionen von Google Drive wurden in diesem Beitrag nicht berücksichtigt. ein bisschen für die Überalligkeit von Google, aber mehr für die Tatsache, dass wir ein paar andere kostenlose Online-OCR-Dienste da draußen testen wollten.
Ihnen überlassen: Welche anderen Online-OCR-Tools würden Sie unseren Lesern empfehlen? Und welche hast du ausprobiert, die du nie wieder benutzen würdest?