• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

Gelöst Dateigroesse pdf Datensatz von Scans

Hallo zusammen,

Folgendes mache ich seit x Jahren mit Dokumenten um sie digital zu archivieren:
  • Scannen mit 1-bit s/w, Format .png mit 300 dpi, das ergibt grad mal um die 100 kiB fuer eine A4 Seite ... eng und klein bedruckt vll 150 kiB
  • Dann oeffne ich eine extra dafuer vorbereitete Libre Office Writer Leerdatei wo Null Rand eingestellt ist,
  • Ich gebe dieser Datei mit mehrmals Ctrl-Enter so viele Seiten wie ich brauche
  • Ich fuege die Scans ein
  • Dann wandeln in pdf
Der Effekt ist eine Datei, durch die man durchblaettern kann, die absolut jedeR nutzen kann auf egal was fuer einem Geraet (ausser vll einem Toaster :ROFLMAO:)
Dabei ist mir zuletzt aergerlich aufgestossen, dass die Dateigroesse bei Export sehr gross geworden ist, grade bekomme ich 2.6 MiB fuer vier Seiten.
Jetzt habe ich alle moeglichen Optionen durchprobiert was alles nichts geholfen hat, es blieb so gross.
Dann habe ich noch Print ausprobiert, Print to file, und dort pdf. Das ergab dann eine vernuenftige Dateigroesse von ca. 550 kiB

Jetzt die 1 Mi€ Frage: Warum ist das so?

Ein schnell mal subjektiver Vergleich ergab nicht den Eindruck, dass die print Version z. B. an der Aufloesung sparen wuerde.
Im LO Draw kann ich bei beiden die einzelnen Scans heraus extrahieren, auch da keine Abstriche bei der 'sparsameren' Version


LG & TIA ... Wolfi
 
Warum das mit LibreOffice so groß wird, kann ich nicht sagen. Sowas wundert mich auch immer.

Alternativ gäbe es noch die Möglichkeit, ohne LibreOffice die pngs mit "convert" aus ImageMagick zu pdf zu wandeln, und dann mit "pdftk" zu einem pdf zusammenzufügen.
Ich hätte gerade ein Perl-Skript vorbereitet, das den Vorgang auch noch automatisiert (für alle pngs in einem Verzeichnis). Wärst Du an so einem Skript interessiert? Wie gesagt, ImageMagick müßte installiert sein, sowie "pdftk".
 
Danke, passt schon fuer mich so weit, ich weiss ja jetzt wie man es kleiner bekommt.
Wenn Du die Ursache auch nicht benennen kannst sind wir immerhin schon zu zweit :D
Ich bin mir allerdings relativ sicher, dass ich 'frueher' auch mit 'Export', wenn man so will, 'vernuenftige' Dateigroessen herausbekommen habe und nicht diese ueberdimensionierten Datensaetze.

LG ... Wolfi ;)
 
Hallo wolfi_z,

stelle unter Datei > Exportieren als > Als PDF exportieren unter "JPEG-Komprimierung Qualität" und "Bildauflösung verringern" Werte ein, die zum Einen eine kleine Datei ergeben und zum Anderen eine für Dich passende Qualität ergeben.

Grüße Bigkater
 
Naja das hab ich natuerlich durchprobiert in allen Variationen, blieb immer gleich gross.
Ich mahne und erinnere
(...) Jetzt habe ich alle moeglichen Optionen durchprobiert was alles nichts geholfen hat, es blieb so gross. (...)
JPEG Komprimierung ist AFAIK irrelevant wenn ich 1 bit monochrom Ausgangsdaten habe, deswegen hat mich das auch nicht wirklich gewundert.
Wie gesagt, 'Problem' war vier mal 120 kiB Scan ergibt 2.6 MiB pdf (bei Export - bei print to ist alles in Ordnung)

Da stimmt bei Export irgendwas nicht :oops:
 
Und auch wie gesagt: Du könntest einfach alle pngs in ein Verzeichnis kopieren, mein Skript dazukopieren, es ausführen, und hättest Dein fertig zusammengefügtes pdf in ca. einer Sekunde, auch wenn es sich um Hunderte von pngs handelte.
Kein Hochfahren von LibreOffice, kein Erzeugen eines geeigneten LibreOffice-Dokuments, kein umständliches Einfügen der pngs von Hand. Einfach das Skript ausführen, und "Bam!". :)
Warum interessiert Dich das nicht?
 
Hallo,
ich benutze dazu den pdfarranger: Man kann mehrere Bilder zusammenfassen und als PDF speichern.
btw.: ocrmypdf (Kommandozeilenprogramm) bietet mit der Option O<1...3> die Möglichkeit, PDF-Dateien mit einer Textlayer zu versehen und zu verkleinern (Intern als JPG)
 
Nun ja, ich muss nicht das gesamte Uni-Archiv scannen sondern nur so bissl Papierkram fuer Steuer und Abrechnungen usw. ;)
Dazu kommt, dass tatsaechlich auch zusehends mehr Sachen direkt als pdf zum Download daher kommen und gar nicht mehr in Papier, meine Umfaenge sind also alles in allem ueberschaubar.
Ich brauche lediglich eine 'deppensichere' intuitive Vorgehensweise per GUI, weil ich evtl. notwendige Befehle bis zum naechsten Mal definitiv wieder vergessen haben werde :ROFLMAO:

So, und seltsam fand ich die teils absurde Dateigroesse. Das hatte mich irritiert.
 

susejunky

Moderator
Teammitglied
  • Scannen mit 1-bit s/w, Format .png mit 300 dpi, das ergibt grad mal um die 100 kiB fuer eine A4 Seite ... eng und klein bedruckt vll 150 kiB
  • Dann oeffne ich eine extra dafuer vorbereitete Libre Office Writer Leerdatei wo Null Rand eingestellt ist,
  • Ich gebe dieser Datei mit mehrmals Ctrl-Enter so viele Seiten wie ich brauche
  • Ich fuege die Scans ein
  • Dann wandeln in pdf
Hast Du schon einmal xsane versucht? Das ermöglicht Dir (mit GUI) direkt beim Scannen mehrseitige PDF-Dateien zu erstellen.
 
Hmm. Ich scanne ja mit xsane. Es wird dann aber immer eine png Datei pro Seite ... Gut, muss ich mal schauen ob das geht.

Also: Es ist kein Kalashnikov-Scanner - normales Flachbett. Jede Seite einzeln einlegen o_O
Ich hatte mal so ein Office Jet Scanner-Printer-Kopierer-Fax Multigeraet, aber da hat konstant mind. eine der Funktionen eben nicht funktioniert und nach ca. dreimal reklamieren & umtauschen hab ich es verschenkt
:cautious:

LG ... Wolfi ;)
 

susejunky

Moderator
Teammitglied
Hmm. Ich scanne ja mit xsane. Es wird dann aber immer eine png Datei pro Seite
Der verfügbare Funktionsumfang von xsane variiert abhängig vom verwendeten sane-backend (d.h. der verwendeten Hardware).

Ich habe xsane bislang mit zwei Flachbettscannern (VOBIS, Canon; beide genesys-backend, beide ohne Blatteinzug) verwendet und ich konnte damit stets unterschiedliche Formate (tiff, png, pdf, ...) und auch mehrseitige PDF-Dateien erzeugen, so wie hier beschrieben.
 
xsane erzeugt nach meinen Erfahrungen auch nur übergroße PDFs. Ich öffne die von xsane erstellten PDF nach dem Scan ebenfalls in LibreOffice und drucke diese dann erneut als PDF um Dateien mit halbwegs normaler Größe zu erhalten.
 
Hi
Nutze zwar kein Suse mehr (ich mint) aber die beiden Programme die ich dafür benutze gibts anscheinend auch für Suse als RPM.
Gsan2pdf
RPM resource gscan2pdf

Naps2
Download - NAPS2

Ich benutze das Hauptsächlich um Abrechnungen mit der Pflegeversicherung und dem Pflegediest zu erledigen (meist mehr als 10 Seiten)
Da die Programme prima sind , hab ich natürlich nun auch viele Verträge und Bücher damit gescannt .

Probier doch einfach mal . Ging für sowas um längen besser als mit XSANE oder SKANLITE

MfG soyo
 
Die Frage war nach der Vermeidung nutzlos grosser pdfs
Dieses Thema ist abgegrast, somit kann der Thread zugemacht werden.
Vielen Dank ;)
 
Oben