Wie funktioniert OCR in Ubuntu?

Wenn Sie Dokumente in Ihren Computer einscannen, stellen Sie möglicherweise fest, dass einige der grundlegenden Funktionen von PDF-Readern - z. B. Suchen oder Hervorheben - für die gescannten Dokumente nicht funktionieren. Das bedeutet, dass Sie ein OCR-Programm (Optical Character Recognition) benötigen, das den eigentlichen Text - im Gegensatz zu einem Bild des Texts - in den Computer einlesen kann. Das Ubuntu-Betriebssystem bietet einige Programme zur Erleichterung von OCR-Vorgängen, die alle in den Ubuntu-Repositorys verfügbar sind.

Optische Zeichenerkennung

Die optische Zeichenerkennung ist die Software, mit der Text aus Bildern erkannt und in ein Dokument eingefügt wird. Wenn Sie Objekte wie Bücher in einen Computer scannen, speichert der Scanner den gescannten Inhalt als Bild. Die OCR-Software scannt das Buch und erkennt den Unterschied zwischen Zeichen und Bildern sowie zwischen den Zeichen selbst, so dass aus Büchern gescannte Dokumente aus Text und nicht aus einem Bild des Textes bestehen. Dadurch kann die PDF-Software den gescannten Text durchsuchen und kommentieren.

Ubuntu OCR-Pakete

In der Ubuntu-Distribution von Linux sind viele OCR-Pakete verfügbar. Sie können Pakete wie Tessaract und Cuneiform entweder über das Ubuntu-Repository oder andere OCR-Softwarepakete installieren. Beachten Sie, dass OCR-Programme wie Tessaract und CuneiForm keine grafischen Benutzeroberflächen (GUIs) enthalten. OCRFeeder verfügt zwar über eine grafische Benutzeroberfläche, es fehlt jedoch die Genauigkeit der Tessaract- und CuneiForm-OCR-Programme.

Tessarakt und Keilschrift

Tessaract wurde 1985 von HP Labs entwickelt und 2005 als Open Source-Code veröffentlicht. Tessaract erkennt Layout und Design (z. B. mehrspaltige Dokumente) und Zeichen aus etwa 40 Sprachen. CuneiForm wurde von Cognitive Technologies entwickelt und bietet sowohl Windows- als auch Linux-Versionen. CuneiForm hat keine grafische Schnittstellenkomponente, kann jedoch in anderen GUIs wie OCRFeeder ausgeführt werden. Tessaract verwendet unkomprimierte TIFF-Dateien als Eingabe und wird wie im folgenden Beispiel von der Befehlszeile aus ausgeführt:

$> tessaract testpdf.tif output.txt

OCRFeeder

OCRFeeder erledigt die OCR-Aufgaben nicht selbst, sondern setzt dazu sogenannte OCR-Engines ein. Dies bedeutet, dass Sie OCRFeeder für die Verwendung von Tessaract, CuneiForm oder anderen OCR-Programmen aktivieren können. Auf diese Weise können Sie ein OCR-Programm über das Ubuntu-Repository installieren. Anschließend können Sie OCRFeeder auf die gleiche Art und Weise installieren, um dieses OCR-Programm zu lokalisieren und seine Befehle über die grafische Benutzeroberfläche von OCRFeeder auszuführen.

Empfohlen
  • Geschäft: Was muss ein Subunternehmer tun, um ein Pfandrecht einzureichen?

    Was muss ein Subunternehmer tun, um ein Pfandrecht einzureichen?

    Um Auftragnehmern, Unterauftragnehmern, Zulieferern und Lieferanten von Materialien eine rechtliche Methode zu bieten, um die Bezahlung ihrer Dienstleistungen für Bauprojekte zu garantieren, gestatten sie die gesetzlichen Bestimmungen, Pfandrechte gegen Hausbesitzer zu hinterlegen. Da Bauunternehmer und andere Personen, die Baudienstleistungen erbringen, nicht einfach die Rückgabe ihrer Dienstleistungen verlangen können, wenn Hausbesitzer sie nicht bezahlen, erhalten sie nach Landesgesetzen einzigartige Pfandrechte, die als Mechanikerpfandrecht bekannt sind, um ihnen zu helfen, die Zahlung für
  • Geschäft: So dehnen Sie ein Bild horizontal mit CSS

    So dehnen Sie ein Bild horizontal mit CSS

    Eine Möglichkeit, einem Bild neues digitales Leben einzuhauchen, ist die Änderung seiner Breite. Sie können dies mit einem Bildeditor tun, aber CSS kann die Arbeit oft schneller erledigen. Erfahren Sie, wie Sie einem Bild eine CSS-Referenz hinzufügen, und Sie können es horizontal auf jede gewünschte Breite strecken. Mit
  • Geschäft: Produktivitätsprojekte auf dem iPad

    Produktivitätsprojekte auf dem iPad

    Seit seiner Veröffentlichung im Jahr 2010 ist das iPad nicht nur als Computerplattform, sondern auch als Business-Tool gewachsen. Dank der zahlreichen Produktivitätssoftware für iPads können Geschäftsbenutzer Dokumente und Tabellenkalkulationen bearbeiten, Präsentationen halten, mit dem Büro und Kunden auf der ganzen Welt in Kontakt bleiben und sogar ältere Anwendungen ausführen. Office
  • Geschäft: Wie eröffne ich ein Versicherungsgeschäft?

    Wie eröffne ich ein Versicherungsgeschäft?

    Laut Financial Web.com gibt es Schritte, die ein Unternehmer vor der Eröffnung eines Versicherungsunternehmens oder der Gründung einer Versicherungsvermittlungsagentur ergreifen muss. Dazu gehören unter anderem: der Besuch einer Versicherungsschule; und lizensiert zu werden. Unabhängig von Ihrem Hintergrund und Ihrer Erfahrung müssen Sie einige Schritte durchführen, um ein gesetzeskonformer und persönlich geschützter Anbieter von Versicherungsinformationen zu werden. 1 Best
  • Geschäft: So öffnen Sie eine .B6T-Datei

    So öffnen Sie eine .B6T-Datei

    Eine Datei mit der Dateiendung B6T ist eine VS0 Software BlindWrite-Datei. Die BlindWrite-Datei enthält eine exakte Kopie einer CD oder DVD, da B6T-Dateien ein Image der CD oder DVD sind. BlindWrite wird zum Erstellen von Installations- und Spiele-Images verwendet. Von BlindWrite erstellte Disk-Images können auch in Dateien mit den Dateierweiterungen „B00“ und „B6I“ enthalten sein. Öffnen S
  • Geschäft: So erhalten Sie eine Ohio Vendor's License

    So erhalten Sie eine Ohio Vendor's License

    Mit der Lizenz eines Ohio-Händlers können Sie Produkte oder Dienstleistungen verkaufen, die Ihren Kunden steuerpflichtig sind. Sie benötigen eine gültige Erlaubnis, um die Verkäufe zu tätigen, da Sie für die Transaktionen Umsatzsteuer erheben und Zahlungen an den Staat überweisen müssen. Als Verkäufer fungieren Sie als Vermittler, der die Steuer für den Staat erhebt und diese Beträge durch monatliche Einlagen der von Ihnen erhobenen Steuern überweist. Wenn Sie ni
  • Geschäft: Verhütung von Arbeitsrisiken

    Verhütung von Arbeitsrisiken

    Der Arbeitsplatz ist voller potenzieller Gefahren, die den Mitarbeitern Schaden zufügen und Organisationen gesetzlich für Schäden haftbar machen können. Um Verletzungen des Personals zu vermeiden und einen reibungslosen Betrieb zu gewährleisten, verwenden Unternehmen Risikopräventionsprogramme. Obwo
  • Geschäft: So öffnen Sie UDS-Dateien

    So öffnen Sie UDS-Dateien

    Eine Datei mit der UDS-Dateierweiterung ist wahrscheinlich eine Uniform Data System-Datei für FIM System ("FIMWare") - Software von Uniform Data System. FIM System ist eine Verwaltungsanwendung für das Gesundheitswesen, mit der Krankenschwestern und andere medizinische Fachkräfte die Gesundheitsergebnisse verwalten können Patienten: Die Anwendung FIM System ermöglicht es dem Arzt, Rehabilitationsdaten in UDS-Dateien aufzuzeichnen und zu verfolgen.Die
  • Geschäft: Drei Farbverläufe in After Effects

    Drei Farbverläufe in After Effects

    In Adobe After Effects können Sie komplexe Farbeffekte, wie z. B. Farbverläufe, definieren, indem Sie Farben und Deckkraftstufen nach Ihren Wünschen anpassen und diese dann auf Formen in Ihren Animationen anwenden. Sie definieren Farbverläufe, indem Sie Farbstopps auswählen. Verwenden Sie für einen dreifarbigen Farbverlauf drei Farbstopps, die entlang des Bereichs des Farbverlaufs platziert werden. In A