Начална » как да » Как да извлечете и запазите изображения от PDF файл в Linux

    Как да извлечете и запазите изображения от PDF файл в Linux

    Можете лесно да конвертирате PDF файлове в редактируем текст в Linux с помощта на инструмента за командния ред "pdftotext". Ако обаче в оригиналния PDF файл има изображения, те не се извличат. За да извлечете изображения от PDF файл, можете да използвате друг инструмент от командния ред, наречен "pdfimages".

    ЗАБЕЛЕЖКА: Когато казваме да напишете нещо в тази статия и има цитати около текста, НЕ въведете кавичките, освен ако не посочите друго.

    Инструментът "pdfimages" е част от пакета poppler-utils. Можете да проверите дали е инсталиран на вашата система и да го инсталирате, ако е необходимо, като използвате стъпките, описани в тази статия.

    За да извлечете изображения от PDF файл, използвайки pdfimages, натиснете „Ctrl + Alt + T“, за да отворите прозорец на терминала. Въведете следната команда в реда.

    pdfimages /home/lori/Documents/SampleWithImages.pdf / начало / lori / Документи / Извлечени изображения / изображение

    ЗАБЕЛЕЖКА: За всички команди, показани в тази статия, заменете първия път в командата и името на PDF файла към пътя и името на файла за оригиналния PDF файл. Вторият път трябва да бъде пътят до главната папка, в която искате да запишете извлечените изображения. Думата "image" в края на втория път представлява каквото искате да зададете предварително името на файла. Имената на файловете се номерират автоматично (000, 001, 002, 003 и т.н.). Ако искате да добавите текст към началото на всяко изображение, въведете този текст в края на втория път. В нашия пример всяко име на изображението започва с „image“, като image-001.ppm, image-002.ppm и т.н. Между зададения от вас текст и номера се добавя тире..

    Форматът на изображение по подразбиране е PPM (преносим пиксел) за немонохромни изображения или PBM (преносимо растерно изображение) за монохромни изображения. Тези формати са проектирани така, че лесно да се обменят между платформите.

    ЗАБЕЛЕЖКА: Можете да получите два файла с изображения за всяко изображение във вашия PDF файл. Второто изображение за всяко изображение е празно, така че ще можете да определите кои изображения съдържат изображенията от файла от миниатюрата на файла в файловия мениджър.

    За да създадете .jpg файлове с изображения, добавете опцията “-j” към командата, както е показано по-долу.

    pdfimages -j /home/lori/Documents/SampleWithImages.pdf / начало / lori / Документи / Извлечени изображения / изображение

    ЗАБЕЛЕЖКА: Можете също да промените изхода по подразбиране в PNG, като използвате опцията “-png” или TIFF, като използвате опцията “-tiff”.

    Основният файл с изображение за всяко изображение се запазва като .jpg файл. Вторият празен образ все още е .ppm или .pbm файл.

    Ако искате само да конвертирате изображения на и след дадена страница, използвайте опцията “-f” с номер, за да посочите първата страница за преобразуване, както е показано в примерната команда по-долу.

    pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf / начало / lori / Документи / Извличане на изображения / изображение

    ЗАБЕЛЕЖКА: Комбинирахме опцията “-j” с опцията “-f”, за да получим .jpg изображения и направихме същото с опцията “-l”, спомената по-долу,.

    За да конвертирате всички изображения преди и на дадена страница, използвайте опцията „-l“ (малка буква „L“, а не цифра „1“) с номер, който да укаже последната страница за конвертиране, както е показано по-долу.

    pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf / начало / lori / Документи / ИзвлечениСнимки / изображение

    ЗАБЕЛЕЖКА: Можете да използвате опциите “-f” и “-l” заедно, за да конвертирате изображения в определен диапазон от страници в средата на документа.

    Ако има парола на собственика на PDF файла, използвайте опцията “-opw” и паролата в единични кавички, както е показано по-долу. Ако паролата на PDF файла е потребителска парола, използвайте опцията “-upw” вместо паролата.

    ЗАБЕЛЕЖКА: Уверете се, че в командата има единични кавички около паролата.

    pdfimages -opw 'password' -j /home/lori/Documents/SampleWithImages.pdf / начало / lori / Документи / ИзвлечениСнимки / изображение

    За повече информация относно използването на командата pdfimages въведете "pdfimages" в прозореца на терминала и натиснете "Enter". Използването на командите се показва със списък от налични опции за използване в командата.