Frage Extrahieren eingebetteter Bilder aus einem PDF


Bevor ich Ubuntu benutze, habe ich den Nitro PDF Reader benutzt, um automatisch Bilder aus PDF-Dateien zu extrahieren. Gibt es einen PDF-Reader für Linux, der das macht?

Ich möchte in der Lage sein, Bilder schneller / einfacher zu extrahieren als bei der Aufnahme eines Schnappschusses.


138
2018-06-12 22:36


Ursprung


Können Sie sich daran erinnern, wie gut NitroPDF mit Vektorbildern umgehen kann? Kann pdfimages Besser / schlechter als NitroPDF? - Léo Léopold Hertz 준영
Mögliches Duplikat von Kommandozeilenwerkzeug zum Massenextrahieren von Bildern aus einer PDF? - funky-future
@ funky-future Offensichtlich sind die beiden Fragen Duplikate, aber Ihr doppeltes Ziel hat nur zwei Antworten und eine dieser beiden Antworten ist eine Spam-Antwort, also sollte die Richtung der Duplizierung umgekehrt werden, um diese Frage vor dem Hammerschlag zu bewahren. - karel


Antworten:


Benutzen pdfimages

pdfimages ist ein PDF-Bildauszugswerkzeug, das die Bilder in einer PDF-Datei in das PPM-, PBM-, JPEG- oder JPEG 2000-Dateiformat speichert.

Es ist ein Teil der poppler-utils Paket, das Sie installieren müssen.

Verwendung:  pdfimages [options] <PDF-file> <image-root>

Beispiel: Im Folgenden werden alle Bilder aus einer PDF-Datei extrahiert und im JPEG-Format gespeichert.

pdfimages -j in.pdf /tmp/out

Speichert Bilder aus einer PDF-Datei in.pdf in Dateien /tmp/out-000.jpg (oder /tmp/out-000.pbm; siehe unten), /tmp/out-001.jpg, etc.


Die pdf Bilder Man Seite erklärt:

-j:  Normally, all images are written as PBM (for monochrome images) or PPM for
     non-monochrome images) files. With this option,  images in DCT format are
     saved as JPEG files. All non-DCT images are saved in PBM/PPM format as usual.

169
2018-06-12 23:06



Wäre schön, eine Lösung zu haben, die Bilder in ihrem nativen Format extrahiert. Das erneute Kodieren von JPEGs ist nicht wirklich ideal. - Christian
@Christian von man page -all Write JPEG, JPEG2000, JBIG2, and CCITT images in their native format. CMYK files are written as TIFF files. All other images are written as PNG files. This is equivalent to specifying the options -png -tiff -j -jp2 -jbig2 -ccitt. - wil93
Bitte beachten Sie, dass die -all switch wird nur in den letzten revisionen von poppler-utils unterstützt. Zum Beispiel, wenn Sie noch am 12.04 sind, können Sie nicht auf diese Option zugreifen - Glutanimate
Wenn Sie nicht verwenden können -all gehen Sie für die PNM-Formate. Sie sind verlustfrei und Sie können die Bilder z. nach PNG. - Tomasz Gandor
@Christian, benutzen $ pdfimages -list <PDF-file> Überprüfen Sie das Originalformat in der Spalte "enc", sodass Sie das Bild nicht erneut in ein anderes Format codieren müssen. - Jose Barakat


Ich benutze dafür oft Inkscape. Lade die Seite und lösche alle anderen Sachen. Der Vorteil ist, dass Sie Vektorbilder in SVG erhalten und sie nach Belieben verändern können.


18
2017-09-11 13:12



Einige PDF-Dateien können nur mit dem internen Inkscape-Import ordnungsgemäß importiert werden (poppler / cairo import oder pdfimage kann nicht ordnungsgemäß analysiert werden). Kopieren Sie das Bild nach dem Import in eine neue Datei und passen Sie die Größe der Seite an die Auswahl an graphicdesign.stackexchange.com/a/21638/95041 - sdaffa23fdsf


Sie können auch pdfmod versuchen. Es ist eine grafische Benutzeroberfläche (GUI), die Bilder extrahieren und andere grundlegende PDF-Manipulationen durchführen kann.


4
2018-06-13 17:18



Hmm, scheint mir etwas buggy. Ein PDF mit hauptsächlich violetten Bildern eingefügt und grünliche Bilder erhalten. - DBX12


Ich habe eine zweispaltige PDF-Datei mit eingebetteten Bildern, die mit LaTeX erstellt wurden, wobei die Originalbilder als EPS bereitgestellt wurden. Ich habe versucht, die vorgeschlagene Lösung basierend auf pdfimages, aber leider gab es keine Bilder zurück. Ich versuchte dann, Inkscape zu verwenden, aber die SVG-Bilder, die es erzeugte, waren verzerrt und ich hatte kein Glück, sie als EPS entweder zu exportieren.

Die Software, die für uns funktionierte, war die MasterPdfEditor.

Hier ist das Verfahren

  • Öffnen Sie Ihre Datei mit dem Master PDF Editor
  • Benutze die Bearbeitungswerkzeug (Alt + 1), um das Bild auszuwählen, das Sie extrahieren möchten
  • Kopiere die Figur (Strg + C)
  • Klicken Sie auf den umgebenden gestrichelten Rahmen um das Bild und überprüfen Sie die rechte Seitenleiste (Objektinspektor) und klicken Sie auf "Geomerty". Dort können Sie die Größe Ihrer Auswahl sehen
  • Erstelle eine neue Datei (Strg + N). Sie werden aufgefordert, die Seitengröße anzugeben. Geben Sie die genaue Größe Ihres Bildes an und erstellen Sie die neue Datei
  • Jetzt ist es etwas knifflig: füge das Bild ein (Strg + V). Das Bild wird möglicherweise nicht in der neuen Datei angezeigt. Bewege sie mit den Pfeilen, bis du sie verfolgen kannst.
  • Verwenden Sie die Pfeile, um das Bild auf der neuen Seite zu zentrieren
  • Als PDF speichern

Das Ergebnis ist von sehr hoher Qualität, aber die Software ist nicht kostenlos. Es gibt eine Demo-Version, die "erlaubt, alle Funktionen auszuprobieren", aber mit "dem Hinzufügen eines Wasserzeichens in der Ausgabedatei". Um ehrlich zu sein, habe ich im produzierten PDF kein Wasserzeichen bemerkt.


4
2018-04-12 16:50



Das ist Ask Ubuntu ... Wir mögen Open Source hier und Ihre Lösung ist eine Closed-Source-kommerzielle Lösung ... Wie ist das besser als die bereits uploged Antworten? (-1 in der Zwischenzeit) - Fabby
@Fabby Vielen Dank für das Feedback. Ich wusste es nicht. Gibt es eine solche Regel auf askubuntu.com? Sobald Sie jedoch öffnen Ubuntu-Softwarezentrumerhalten Sie Vorschläge für unfreie Anwendungen. - Pantelis Sopasakis
Nein, es gibt keine "Regel" und deshalb habe ich nicht dafür gestimmt, diese Antwort zu löschen, aber es gibt bessere Werkzeuge, die frei sind (wie im Freibier) und Redefreiheit), das ist nur eine Meinung. - Fabby
+1. Ich habe die ImageMagick-Befehlszeile verwendet, aber dies ist eine interessante Lösung für jemanden, der nach einer GUI sucht. - rpmcruz
Es funktioniert für manche Leute, das ist gut genug. Sei kein Nazi .... Ich weiß nicht wer "wir" sind. Sie können nur für sich selbst sprechen. +1 für die Antwort - sdaffa23fdsf


Ich benutze pdfimages, das ist ein Kommandozeilen-Tool und es funktioniert gut für mich. Es ist sehr einfach zu bedienen und Sie können die Option --help verwenden, um mehr über seine Verwendung zu erfahren. Ich benutze Ubuntu und es ist vorinstalliert. Wenn Ihre PDF-Dateien verschlüsselt oder passwortgeschützt sind, gibt es Optionen dafür, so dass dieses Tool großartig funktioniert. Du kannst lesen Mehr über pdfimages Hier 


2
2017-07-24 01:39



Bitte lesen Sie andere Antworten, bevor Sie Ihre einsenden. Beachten Sie, dass es andere gibt, die dies abdecken. - edwin
Ok, tut mir leid :) Ich dachte mir, dass ich meine veröffentlichen soll, weil es einige Informationen über passwortgeschützte PDF-Dateien gibt und ich erkläre, dass dieses Tool diese Optionen hat, und ich habe einen Link gepostet, der ein Tutorial zu diesem Tool ist. - jetbird13
Wenn Sie genug Reputation haben, können Sie die Antworten anderer kommentieren oder sie aufwerten. - edwin


Wenn Sie ein zugeschnittenes Bild im PDF / EPS-Format benötigen, extrahieren Sie eine Seite mit dem Bild mit pdfmod(wie von To Do vorgeschlagen).

Dann mit pdfcrop Sie können es richtig ausschneiden, indem Sie die Ränder durch Ausprobieren einstellen:

pdfcrop --margins "-15 -50 0 -140" extracted_page.pdf

2
2018-06-12 14:17





Bei PDF-Bildern kann das extrahierte Bild aus zwei oder mehr Teilen bestehen. Eine einfache Möglichkeit, sie wieder zusammenzusetzen, ohne sich um extrahierte Formate kümmern zu müssen, besteht darin, die Teile in LibreOffice Draw zu importieren, mit dem Bildbeschneidungsdialog zu beschneiden, die Teile zu positionieren, die Seitengröße anzupassen und in das von Ihnen bevorzugte Format zu exportieren.


1
2018-01-06 23:54





Wenn Sie ein Bild aus einer PDF-Datei mit einem PDF-Viewer zuschneiden möchten, können Sie okular versuchen. Es kann alles (Texte oder Bilder) im PNG- oder JPEG-Format zuschneiden. Wenn Sie Bilder im PNG-Format aus einer PDF extrahieren möchten, können Sie dies mit einem minimalen Befehl mit pdftohtml tun. Es konvertiert PDF in HTML und Bilder. Hier finden Sie ein Beispiel - https://www.youtube.com/watch?v=CG1rf7k3xo8 . Wenn Sie viele Bilder aus einem PDF extrahieren möchten, empfehle ich Ihnen, dies zu versuchen.


1
2017-07-06 15:09