Hvordan trekke ut og lagre bilder fra en PDF-fil i Linux

Hvordan trekke ut og lagre bilder fra en PDF-fil i Linux
Hvordan trekke ut og lagre bilder fra en PDF-fil i Linux

Video: Hvordan trekke ut og lagre bilder fra en PDF-fil i Linux

Video: Hvordan trekke ut og lagre bilder fra en PDF-fil i Linux
Video: MacBook Pro 2011: How to Fix the Defective GPU and Install Monterey - YouTube 2024, April
Anonim
Du kan enkelt konvertere PDF-filer til redigerbar tekst i Linux ved hjelp av "pdftotext" kommandolinjeverktøyet. Men hvis det er noen bilder i den opprinnelige PDF-filen, blir de ikke hentet ut. For å trekke ut bilder fra en PDF-fil, kan du bruke et annet kommandolinjeverktøy kalt "pdfimages".
Du kan enkelt konvertere PDF-filer til redigerbar tekst i Linux ved hjelp av "pdftotext" kommandolinjeverktøyet. Men hvis det er noen bilder i den opprinnelige PDF-filen, blir de ikke hentet ut. For å trekke ut bilder fra en PDF-fil, kan du bruke et annet kommandolinjeverktøy kalt "pdfimages".

MERK: Når vi sier å skrive noe i denne artikkelen, og det er anførselstegn rundt teksten, skriv IKKE anførselstegnene, med mindre vi angir noe annet.

"Pdfimages" -verktøyet er en del av poppler-utils-pakken. Du kan sjekke om det er installert på systemet ditt, og installer det hvis det er nødvendig, ved hjelp av trinnene som er beskrevet i denne artikkelen.

For å trekke ut bilder fra en PDF-fil ved hjelp av pdfimages, trykk "Ctrl + Alt + T" for å åpne et Terminal-vindu. Skriv inn følgende kommando ved spørringen.

pdfimages /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

MERK: For alle kommandoene som vises i denne artikkelen, erstatt den første banen i kommandoen og PDF-filnavnet til banen og filnavnet for den opprinnelige PDF-filen. Den andre banen skal være banen til rotmappen der du vil lagre de utviste bildene. Ordet "bilde" på slutten av den andre stien representerer hva du vil forord ditt filnavn med. Filnavnene til bildene er nummerert automatisk (000, 001, 002, 003, etc.). Hvis du vil legge til tekst i begynnelsen av hvert bilde, skriv inn teksten på slutten av den andre banen. I vårt eksempel starter hvert bildefilnavn med "bilde", for eksempel image-001.ppm, image-002.ppm, etc. Et dash legges mellom teksten du angir og nummeret.

Standardbildformatet er PPM (bærbar pixmap) for ikke-svart-hvitt-bilder, eller PBM (bærbar bitmap) for monokrome bilder. Disse formatene er utformet slik at de enkelt kan byttes mellom plattformer.
Standardbildformatet er PPM (bærbar pixmap) for ikke-svart-hvitt-bilder, eller PBM (bærbar bitmap) for monokrome bilder. Disse formatene er utformet slik at de enkelt kan byttes mellom plattformer.

MERK: Du kan få to bildefiler for hvert bilde i PDF-filen. Det andre bildet for hvert bilde er tomt, så du kan se hvilke bilder som inneholder bildene fra filen ved miniatyrbildet på filen i Filbehandling.

For å opprette.jpg bildefiler, legg til alternativet "-j" til kommandoen, som vist nedenfor.
For å opprette.jpg bildefiler, legg til alternativet "-j" til kommandoen, som vist nedenfor.

pdfimages -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

MERK: Du kan også endre standardutdata til PNG ved hjelp av alternativet "-png" eller TIFF ved hjelp av "-tiff" -alternativet.

Hovedbildefilen for hvert bilde lagres som en.jpg-fil. Det andre blanke bildet er fortsatt en.ppm eller.pbm-fil.
Hovedbildefilen for hvert bilde lagres som en.jpg-fil. Det andre blanke bildet er fortsatt en.ppm eller.pbm-fil.
Hvis du bare vil konvertere bilder på og etter en bestemt side, bruk alternativet "-f" med et tall for å indikere den første siden som skal konverteres, som vist i eksempelkommandoen nedenfor.
Hvis du bare vil konvertere bilder på og etter en bestemt side, bruk alternativet "-f" med et tall for å indikere den første siden som skal konverteres, som vist i eksempelkommandoen nedenfor.

pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

MERK: Vi kombinerte "-j" -alternativet med "-f" -alternativet, slik at vi ville få.jpg-bilder og gjorde det samme med alternativet "-l" også nevnt nedenfor.

For å konvertere alle bilder før og på en bestemt side, bruk "-l" (et lite "L", ikke tallet "1") med et tall for å indikere den siste siden som skal konverteres, som vist nedenfor.
For å konvertere alle bilder før og på en bestemt side, bruk "-l" (et lite "L", ikke tallet "1") med et tall for å indikere den siste siden som skal konverteres, som vist nedenfor.

pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

MERK: Du kan bruke alternativene "-f" og "-l" sammen for å konvertere bilder i et bestemt sidevalg i midten av dokumentet.

Hvis det er et eierpassord på PDF-filen, bruk alternativet "-opw" og passordet i enkelt anførselstegn, som vist nedenfor. Hvis passordet i PDF-filen er et brukerpassord, bruk alternativet "-upw" i stedet med passordet.
Hvis det er et eierpassord på PDF-filen, bruk alternativet "-opw" og passordet i enkelt anførselstegn, som vist nedenfor. Hvis passordet i PDF-filen er et brukerpassord, bruk alternativet "-upw" i stedet med passordet.

MERK: Pass på at det er enkelt anførselstegn rundt passordet ditt i kommandoen.

pdfimages -opw ‘password’ -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

Anbefalt: