• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

[gelöst]Gescannten Text markieren, kopieren...

Hallo Gurus,

wie kann ich das verwirklichen?

Daß ich ein sog. OCR-Programm brauche, Zb "cuneiform" weiß ich mittlerweile, aber wo finde ich so etwas als rpm, das ich unter 11.3 (sorry, aber 12.x ist mir bis jetzt ein Graus) problemlos installieren kann, ohne Mecker, wie
libMagick++.so.1, libMagickCore.so.1, libMagickWand.so.1 is needed by cuneiform-0.6-5.1.i586
zu bekommen?
Zypper findet diese libs (plugins?) nicht, ebenso wenig wie "tesseract" auf das im Linupedia unter OCR hingewiesen wird.

Danke für verständliche Lösungsansätze!
 
Sorry, aber ich steh auf dem Schlauch, denn der Link
zerum schrieb:
führt mich flugs zu einem Download-Angebot von 12.2
und das
wüßte ich nicht wie ich das auf meinen PC bringen sollte..... :???:

Spielwurm schrieb:
OCR steht im Scanner-Forum.
Die Botschaft hör ich wohl, allein, was soll ich mit ihr anfangen...danach googeln brachte mich keinen Schritt weiter.... :???:
 
Hi, ich denke, Spielwurm meinte diese Forensektion im Linux Club.
http://www.linux-club.de/viewforum.php?f=60

Cuneiform steht scheinbar erst ab openSuse 11.4 zur Verfügung.

Gruß Ganymed
 
cuneiform habe ich nun zwei gefunden, cuneiform-0.6-5.1.i586.rpm und cuneiform-1.1.0-2.1.i586.rpm
aber bei beiden ich stolpere immer noch über:
Code:
rpm --test -hiv cuneiform-1.1.0-2.1.i586.rpm
warning: cuneiform-1.1.0-2.1.i586.rpm: Header V3 DSA/SHA1 Signature, key ID fd09be7d: NOKEY
error: Failed dependencies:
        libMagick++.so.4 is needed by cuneiform-1.1.0-2.1.i586
Der hilflose Versuch libMagick++.so.3 nach libMagick++.so.4 zu kopieren brachte natürlich keinen Erfolg.
libMagick++4-6.6.5.8-8.9.1.i586.rpm das ich hier fand scheitert an den drei schon genannten dependencies.

Muß ich mir wirklich jedes einzelne rpm raussuchen und dann vielleicht über weitere dependencies stolpern, oder kann man das zb via Zypper in einem Aufwasch incl. aller deps installieren, wenn man die richtige Quelle kennt?
 
Ich bin mir nicht sicher aber libMagick und seine Abhängigkeiten müßten Packman-Pakete sein. Da wirst Du aber für eine 11.x suse nichts mehr finden.
 
gm2601 schrieb:
Muß ich mir wirklich jedes einzelne rpm raussuchen und dann vielleicht über weitere dependencies stolpern
Du willst es zwar nicht hören, aber solange Du Dir einbildest, eine seit fast einem Jahr nicht mehr unterstützte Version mit für diese Version nicht vorgesehenen Paketen aufzupfropfen, mußt Du das tun. Und irgendwann hast Du dann einen instabilen Zustand Deines Systems erreicht. Wenn Du bei 11.3 bleiben willst, dann begnüge Dich mit den dafür vorgesehenen Paketen, und dann mußt Du eben auf bestimmte Dinge (vor allem aus dem Multimedia-Sektor) verzichten.

P. S. gocr gibt es auch für 11.3.
 
josef-wien schrieb:
Du willst es zwar nicht hören, ....
Ich kann Dir da nicht im geringsten widersprechen :D
aber dafür:
P. S. gocr gibt es auch für 11.3.
herzlichen Dank, denn das habe ich gefunden, und Du wirst staunen, das ließ sich, ebenso wie danach das ocrgui, problemlos installieren.
Leider liegt mir das Dokument, dem mein momentanes Interesse galt, nicht im geforderten
-i name - input image file (pnm,pgm,pbm,ppm,pcx,...)
Format, sondern als eingescanntes "Urteil.pdf" vor, was natürlich entsprechend angemosert wird. Ich stehe also wieder "zurück auf Los".

PS: Dein Rüffel mag ja in Deiner IT-Welt berechtigt sein, aber es gibt noch andere Welten, so bin ich nunmehr bereits 10 Jahre aus dem Berufsleben raus und eben NICHT mit IT aufgewachsen. Es wäre nett, wenn .... <laß einfach Deiner Fantasie freien Lauf> ...

Ich danke allen, die Interesse für mein Problem zeigten.....
dafuer.gif
 
Danke!
Daß Gimp weit mehr kann, als ich ihm entlocken kann, war mit klar, nun kenne ich einer weitere Möglichkeit.

Leider ist das Ergebnis aller Versuche mit PNM, PGM, PBM, PPM, or PCX, von denen ich keine Ahnung habe, dermaßen bescheiden, daß ich wohl auf diese Methode verzichten werde, denn sinngemäßes wie wörtliches Zitieren sind ja auch kein Hexenwerk. Vielleicht wäre noch eine Verbesserung durch, mir nichts sagende, Parameter der man-page möglich, aber dafür fehlt mir der Forschertrieb.
 
Schau Dir mal YAGF an. Das Programm kann pdf in jpg umwandeln, welches wiederum cuneiform und tesseract bearbeiten können.

Gruss H.
 
Vielen Dank für den Tip, aber alles was ich dazu fand waren Sources und ich habe, neben der Standardinstallation keinerlei Development-SW geladen.
Mir fehlt auch irgendwie der Glaube, daß die Ergebnisse frappierend besser sein könnten als mit gorc, das ich zwischenzeitlich unter 12.2 am laufen habe.
Es bleibt also bei "aufgegeben", denn in der Zeit bis ich alles gewandelt und dann korrigiert habe, kann ich Zitate auch abtippen.
 
Vielen Dank für die URL.
Den dortigen "Hinweis zum Scanergebnis" kann ich wohl vernachlässigen, da ich die Datei nicht selbst gescannt, sondern als PDF bekommen habe.
Nun ist Tesseract-Gui instsalliert und es startet von Platte 2 (12.2) prima, will aber mit datei.ext gefüttert werden und nicht mit PDF. :???:
(ich habe auf meiner Platte eine einzige uralte Datei mit dieser Endung gefunden, aber das ist eine aus Zeiten des Midnight Commanders)
Ich muß gestehen, daß mir datei.ext nichts sagt und kann somit auch nicht beurteilen, wie groß der Schritt von meiner datei.pdf zu datei.txt ist.
Copy & paste aus Okular ist soweit klar, aber der Ausschnitt bleibt doch eine Bilddatei, die ich nicht in ein einfaches textfile übernehmen kann. :???:
 
datei.ext an der Stelle ist ein Platzhalter und steht beim Scannen z.B. für "Zeitungsausschnitt.jpg" oder "screenshot015.png" ...

Bei meiner Version von Okular gibt es unter "Extras" einen Punkt "Textauswahl". Wenn ich den anklicke , kann ich danach ganz normal Text markieren, dann mit der rechten Maustaste "Text kopieren" und in meinen Editor einfügen. Was der Editor anzeigt, ist purer Text ...
 
DAS kann ich mit beiden Okularversionen (Unter 12.2. Version 0.14.3) auch, ABER nur, wenn es ein "Standard"-PDF ist und kein eingescanntes, denn bei dem bekomme ich die Auswahl "Text (nnn Buchstaben) in die Zwischenablage kopieren" NICHT, sondern nur "Bild (bbb x hhh Pixel) in die Zwischenablage kopieren" .... und damit zurück auf Los. :(

Auch wenn mir "file datei.pdf" für scan.pdf wie für doku.pdf "PDF document, version 1.4" bestätigt, so ist doch offenbar pdf != pdf.
 
halo44 schrieb:
Schau Dir mal YAGF an. Das Programm kann pdf in jpg umwandeln, welches wiederum cuneiform und tesseract bearbeiten können.

Gruss H.
Danke, für diesen erfolgreichen Tip, das macht mir 12.2 wieder ein Stückchen erträglicher.
Vermutlich war beim ersten Versuch das eingescannte Dokument qualitativ fragwürdig und somit das Ergebnis auch.
 
Oben