NormCap - Text in Bildern kopieren und weiterverwenden

Sonstige kleine aber nützliche Software
Benutzeravatar
Rocki
Beiträge: 576
Registriert: Fr 16. Jul 2021, 01:58
Wohnort: Schweiz
Has thanked: 842 times
Been thanked: 236 times

NormCap - Text in Bildern kopieren und weiterverwenden

#5467

Beitrag von Rocki »

Gelegentlich möchte man von einem Bild einen Text daraus als bearbeitbaren Text haben. Man hat z.B. Pop-up-Fenster oder eine Titelleiste, deren Text man kopieren möchte. Oder man sieht auf Bildern auf einer Website ein Plakat oder eine Tafel, deren Text man haben möchte, ohne ihn abschreiben zu müssen. Oder man hat in einem Museum Begleittexte zu Ausstellungs-Objekten fotografiert und möchte jetzt diese Texte verwenden können.

Das alles lässt sich gut und einfach mit NormCap machen, zu beziehen auf https://github.com/dynobo/normcap/

Das Programm gibt es als AppImage oder Python-Programm, und es wird dort auch erklärt, wie man das Python-Programm unter Linux installiert und startet (sogar eine Liste von ähnlichen Programmen wird präsentiert): Zuerst die Abhängigkeiten installieren, dann das Python-Programm.

Code: Alles auswählen

# Install dependencies (Ubuntu/Debian)
sudo apt install build-essential tesseract-ocr tesseract-ocr-eng libtesseract-dev libleptonica-dev wl-clipboard

Code: Alles auswählen

## Install dependencies (Arch)
sudo pacman -S tesseract tesseract-data-eng wl-clipboard

Code: Alles auswählen

## Install dependencies (Fedora)
sudo dnf install tesseract wl-clipboard

Code: Alles auswählen

## Install dependencies (openSUSE)
sudo zypper install python3-devel tesseract-ocr tesseract-ocr-devel wl-clipboard

Code: Alles auswählen

# Install normcap
pip install normcap

Code: Alles auswählen

# Run
./normcap
Ausserdem zeigt ein animiertes GIF-Bild, wie man das Programm benützt. Hier eine kurze Textanweisung:

1) Das Programm starten und warten, bis man einen roten Rahmen überall am Monitorrand sieht. Der Cursor verwandelt sich in ein Kreuz.
2) Man kann um den Text auf dem Bild einen Rahmen ziehen (mit der linken gedrückten Maustaste links oben anfangen und loslassen, wenn man den ganzen Text "eingefangen" hat).
3) In der rechten oberen Ecke des Monitors wird darauf mit einem Pop-up angezeigt, wie viele Wörter man ausgewählt hat. Und der Text befindet sich jetzt in der Zwischenablage, sodass man ihn in ein Textprogramm oder einen Texteditor einfügen kann.

In der Taskleiste befindet sich ab jetzt bis zum Herunterfahren des Computers ein Symbol für dieses Programm. Klickt man es mit der gedrückten linken Maustaste an, zeigt das Menü die beiden Punkte "Capture" und "Exit". Darüber kann man also weitere Textkopien erzeugen oder das Programm schliessen.

Ein Beispiel:
Technik-Museum Speyer - Erklärung zu Diesellok  V200
Technik-Museum Speyer - Erklärung zu Diesellok V200

Das Ergebnis von NormCap (unbearbeitet von mir):
Krauss-Maffei Diesellokomotive V200
Baujahr: 1959 Leistung: 2x 1000 PS Höchstgeschw. 140 km/h
Technik Museen Sinsheim Speyer
x
DE
Die erste von Krauss-Maffei gebaute V 200 Diesellokomoti- ve wurde 1953 auf der MUnchner Verkehrsausstellung vor- gestellt. Gemäß den Auflagen der Deutschen Bahn konnten Motoren von drei Herstellerfirmen eingebaut werden, die auch untereinander frei austauschbar waren. Es handelte sich um 12-Zylinder V Dieselmotoren der Firmen Maybach, Mercedes-Benz und MAN.
EN
The first V 200 diesel locomotive built by Krauss-Maffei was presented at the Munich Transport Exhibition in 1953. In accordance with the requirements of Deutsche Bahn, en- gines from three manufacturers could be installed, which were also freely interchangeable. These were 12-cylinder V diesel engines from Maybach, Mercedes-Benz and MAN.
©
Wer nichts weiss, muss alles glauben. – Marie von Ebner-Eschenbach
Wer alles weiss, hat keine Ahnung. – Horst Evers

Link:
BBcode:
HTML:
Hide post links
Show post links
Benutzeravatar
xyz
Beiträge: 107
Registriert: Fr 10. Mär 2023, 16:41
Been thanked: 29 times

Re: NormCap - Text in Bildern kopieren und weiterverwenden

#5468

Beitrag von xyz »

gimagereader ist auch ein gutes gui zum verwenden des ocr tesseract
zudem befindet es sich zb bei debian im offiziellen repository
https://github.com/manisandro/gImageReader
btw i use linux-bibel oesterreich

Link:
BBcode:
HTML:
Hide post links
Show post links
Benutzeravatar
Rocki
Beiträge: 576
Registriert: Fr 16. Jul 2021, 01:58
Wohnort: Schweiz
Has thanked: 842 times
Been thanked: 236 times

Re: NormCap - Text in Bildern kopieren und weiterverwenden

#5469

Beitrag von Rocki »

Danke für den Tipp. Wenn du Zeit hättest, gImageReader hier vorzustellen, würde ich das begrüssen, dann sieht man die Unterschiede. Mir ist es zu kompliziert, ich habe den Zugang dazu nie gefunden. NormCap ist aus meiner Perspektive sehr unkompliziert. Das schätze ich daran ungemein. Du kannst z.B. aus dem Bild oben einfach schnell den Text rauskopieren, ohne das Bild zuerst abzuspeichern. Das geht wirklich schnell.
Wer nichts weiss, muss alles glauben. – Marie von Ebner-Eschenbach
Wer alles weiss, hat keine Ahnung. – Horst Evers

Link:
BBcode:
HTML:
Hide post links
Show post links
neloCR
Beiträge: 47
Registriert: Mo 9. Aug 2021, 20:14
Has thanked: 57 times
Been thanked: 22 times

Re: NormCap - Text in Bildern kopieren und weiterverwenden

#5492

Beitrag von neloCR »

Danke für die Vorstellung.
Praktisch, wenn Anwendungen Meldungsfenster in Englisch ausspucken und man kein Englisch kann.
Mit Normcap den Text einfangen und in einen Online-Übersetzer geben - Problem gelöst.

Link:
BBcode:
HTML:
Hide post links
Show post links
Benutzeravatar
Rocki
Beiträge: 576
Registriert: Fr 16. Jul 2021, 01:58
Wohnort: Schweiz
Has thanked: 842 times
Been thanked: 236 times

Re: NormCap - Text in Bildern kopieren und weiterverwenden

#5495

Beitrag von Rocki »

Die Einstellungen von NormCap

Es gibt auch noch Einstellungen, das muss ich hinzufügen, und zwar sind diese zugänglich, sobald man einen Text kopieren will, wenn also der rote Rand am Monitorrand erscheint. Zusammen mit diesem Rand taucht auch ein kleines rotes Zahnrad in der rechten oberen Monitor-Ecke auf. Man klickt es mit der linken gedrückten Maustaste an:
Die Einstellungen von NormCap
Die Einstellungen von NormCap
Show notification - das Pop-up-Fensterchen anzeigen, damit man weiss, ob die Erfassung funktionierte
Keep in system tray - das NormCap-Symbol (Stab mit drei Sternchen) in der Leiste anzeigen bis zum Runterfahren
parse - strukturiert darstellen. Das ist nützlich, wenn man die Auswahl auf zwei oder mehr Textspalten ausdehnt, die werden dann untereinander dargestellt, wenn man sie in einen Texteditor reinkopiert.
raw - unbearbeitet, fortlaufend darstellen. Das ist nützlich, wenn man den Text einer Spalte in z.B. LibreOffice Writer einfügt, man erhält dann keine ungewollten Zeilenende-Zeichen.
Languages - Man kann die Sprachen des Textes im Bild angeben mit einem Häkchen (verschwindet das Einstellungsfenster, einfach nochmals das rote Zahnrädchen anklicken).
add/remove - Man kann auch Sprachen hinzufügen (noch nicht ausgereifte Funktion):
Weitere Sprachen installieren
Weitere Sprachen installieren
Bei diesem Fenster ruhig auch mal View tessdata folder in file manager ... ganz rechts unten anklicken und dort die Readme-Datei. Dort gibts verschiedene Links, die einem helfen können, die Qualität zu verbessern, wenn das nötig ist.
about - Website, FAQs, Source Code, Releases, Report a problem

Kleiner Tipp zum Schluss: Abwedeln/Nachbelichten, Kontrast verstärken (z.B. in Gimp) kann helfen, das Resultat zu verbessern, oder die Ansicht des Bildes inkl. Schrift vergrössern und dann NormCap "ansetzen".
Wer nichts weiss, muss alles glauben. – Marie von Ebner-Eschenbach
Wer alles weiss, hat keine Ahnung. – Horst Evers

Link:
BBcode:
HTML:
Hide post links
Show post links
Benutzeravatar
Rocki
Beiträge: 576
Registriert: Fr 16. Jul 2021, 01:58
Wohnort: Schweiz
Has thanked: 842 times
Been thanked: 236 times

Re: NormCap - Text in Bildern kopieren und weiterverwenden

#5534

Beitrag von Rocki »

Hier ein Link zu gImageReader - eine Präsentation von zebolon. Danke dir.
Wer nichts weiss, muss alles glauben. – Marie von Ebner-Eschenbach
Wer alles weiss, hat keine Ahnung. – Horst Evers

Link:
BBcode:
HTML:
Hide post links
Show post links
Benutzeravatar
Rocki
Beiträge: 576
Registriert: Fr 16. Jul 2021, 01:58
Wohnort: Schweiz
Has thanked: 842 times
Been thanked: 236 times

Re: NormCap - Text in Bildern kopieren und weiterverwenden

#5620

Beitrag von Rocki »

Textshot

Es gibt das dem Programm NormCap ähnliche Terminal-Programm Textshot. Seine Screenshot-Texte erscheinen auch im Terminal und gehen gleichzeitig in die Zwischenablage. Und Textshot kann sogar Screenshots in Intervallen (automatisch) produzieren, die dann im Terminal untereinander erscheinen. Benutzt man die Intervall-Funktion, ist ein Programm wie Clipit oder Diodon von Vorteil, sonst verliert man den Text der Zwischenablage bei jedem neuen Screenshot (wenigstens aber nicht den identischen Text im Terminal). Leider hat man keinen sichtbaren, bleibenden Auswahlrahmen - wie bei solchen Programmen üblich.

Mehr zum Programm Textshot hier: https://github.com/ianzhao05/textshot Die Installation mit pip (die Installation von Tesseract mit den richtigen Sprachen ist Voraussetzung und ebenso, dass Tesseract von der Kommandozeile aus ansprechbar ist - mehr dazu dort, wo der Link hinführt):

Code: Alles auswählen

pip install textshot
Der Gebrauch auf der Kommandozeile:

Code: Alles auswählen

textshot "deu+eng"
Der Befehl mit Intervall-Option:

Code: Alles auswählen

textshot --interval 200
oder

Code: Alles auswählen

textshot "deu+eng" --interval 200
wobei Englisch Standardeinstellung ist und bei einem rein englischen Text "eng" (mit Anführungszeichen) nicht gesetzt werden muss, "deu" aber bei einem rein deutschen Text schon. Die Option 200 = 200 Millisekunden - 1000 = 1 Sekunde.

Man kann Textshot direkt starten, ohne das Terminal zu öffnen, wenn man eine Tastenkombi anlegt - unter Xfce so:
EinstellungenTastaturTastenkürzel für Anwendungen → Add usw. Unter Xfce kann man auch das Programmmenü öffnen und textshot schreiben und Enter drücken.

Ein Vergleich der Ergebnisse von NormCap und Textshot, wenn ich den Text aus der Zwischenablage in LibreOffice Writer hineinkopiere:

NormCap - Screenshot mit der Einstellung Raw
NormCap - Screenshot mit der Einstellung Raw

NormCap - Screenshot mit der Einstellung Parse
NormCap - Screenshot mit der Einstellung Parse

Textshot - Screenshot
Textshot - Screenshot

Textshot-Text in LibreOffice Writer enthält Absatz-Ende-Zeichen (sichtbar bei der Einstellung sichtbar) an jedem Zeilenende. Das ist unter Umständen sehr störend. Möchte man viele Texte so aus Bildern oder aus gescannten PDF-Seiten "herausholen" und etwa in Writer weiterbearbeiten, kann es viel Arbeit bedeuten, die meisten dieser Absatz-Ende-Zeichen wieder zu entfernen. Ideal wäre es, die Einstellung Parse von NormCap mit der Intervall-Funktion von Textshot zu kombinieren. Andernfalls wäre für viele Seiten hintereinander - etwa ein Buch - das Programm OCRmyPDF (mit der sidecar-Option eine zusätzliche Textdatei erzeugend) eine gute Wahl, aber auch dieses Programm setzt solche Absatz-Ende-Zeichen.
Wer nichts weiss, muss alles glauben. – Marie von Ebner-Eschenbach
Wer alles weiss, hat keine Ahnung. – Horst Evers

Link:
BBcode:
HTML:
Hide post links
Show post links
Antworten Vorheriges ThemaNächstes Thema

Create an account or sign in to join the discussion

You need to be a member in order to post a reply

Create an account

Not a member? register to join our community
Members can start their own topics & subscribe to topics
It’s free and only takes a minute

Registrieren

Sign in