Как да извличате изображения, текст и вградени файлове от Word, Excel и PowerPoint документи
Да кажем, че някой ви е изпратил Word документ с много изображения и искате да запазите тези изображения на твърдия ви диск. Можете да извличате изображения от документ на Microsoft Office с прост трик.
Ако имате Word (.docx), Excel (.xlsx), или PowerPoint (.pptx) файл с вградени изображения или други файлове, можете да ги извлечете (както и текста на документа), без да е необходимо да ги записвате поотделно , И най-доброто от всички, не се нуждаете от допълнителен софтуер. Файловите формати, базирани на Office XML - docx, xlsx и pptx - всъщност са компресирани архиви, които можете да отворите като всеки нормален .zip файл с Windows. От там можете да извличате изображения, текст и други вградени файлове. Можете да използвате вградената поддръжка на .zip в Windows или приложение, като например 7-Zip, ако предпочитате.
Ако трябва да извлечете файлове от по-стар офисен документ - като .doc, .xls или .ppt файл - можете да го направите с малък брой свободен софтуер. Ще уточним този процес в края на това ръководство.
Извличане на съдържанието на по-нов Office файл (.docx, .xlsx или .pptx)
За да получите достъп до вътрешното съдържание на документ на Office, базиран на XML, отворете File Explorer (или Windows Explorer в Windows 7), отидете до файла, от който искате да извлечете съдържанието, и изберете файла.
Натиснете “F2”, за да преименувате файла и да промените разширението (.docx, .xlsx или .pptx) на “.zip”. Оставете основната част от името на файла. Натиснете „Enter“, когато сте готови.
Следният диалогов прозорец показва предупреждение за промяна на разширението на името на файла. Кликнете върху „Да“.
Windows автоматично разпознава файла като компресиран файл. За да извлечете съдържанието на файла, щракнете с десния бутон върху файла и изберете “Extract All” от изскачащото меню.
В диалоговия прозорец "Избери дестинация и извличане на файлове", пътят, където ще се извлича съдържанието на .zip файла, се показва в полето за редактиране "Файловете ще бъдат извлечени в тази папка". По подразбиране, папка със същото име като името на файла (без разширението на файла) се създава в същата папка като .zip файла. За да извлечете файловете в друга папка, кликнете върху „Преглед“.
Придвижете се до мястото, където искате да бъде извлечено съдържанието на .zip файла, щракнете върху "Нова папка", за да създадете нова папка, ако е необходимо. Кликнете върху „Избиране на папка“.
За да отворите прозорец File Explorer (или Windows Explorer) с папката, съдържаща извлечените файлове, които показват, след като са извлечени, поставете отметка в квадратчето „Покажи извлечените файлове при завършване“, така че в полето има отметка. Кликнете върху „Извличане“.
Как да получите достъп до извлечените изображения
В извлеченото съдържание е включена папка с име „word“, ако вашият оригинален файл е документ на Word (или „xl“ за документ от Excel или „ppt“ за PowerPoint документ). Кликнете два пъти върху папката „word“, за да я отворите.
Кликнете два пъти върху папката „media“.
Всички изображения от оригиналния файл са в папката „media“. Извлечените файлове са оригиналните изображения, използвани от документа. Вътре в документа може да има настройка за преоразмеряване или други свойства, но извлечените файлове са суровите изображения, без тези свойства да се прилагат.
Как да получите достъп до извлечения текст
Ако нямате инсталиран Office на вашия компютър и трябва да извлечете текст от Word (или Excel или PowerPoint) файл, можете да получите достъп до извлечения текст в файла “document.xml” в папката “word”..
Можете да отворите този файл в текстов редактор, като Notepad или WordPad, но е по-лесно да се чете в специален XML редактор, като например безплатната програма, XML Notepad. Целият текст от файла е наличен в парчета от обикновен текст, независимо от стила и / или форматирането, приложени в самия документ. Разбира се, ако ще изтеглите свободен софтуер, за да видите този текст, можете да изтеглите LibreOffice, който може да чете документи на Microsoft Office.
Как да извлечете вградени OLE обекти или прикачени файлове
За достъп до вградени файлове в документ на Word, когато нямате достъп до Word, първо отворете Word файла в WordPad (който е вграден в Windows). Може да забележите, че някои от вградените икони на файлове не се показват, но все още са там. Някои от вградените файлове може да имат частични имена на файлове. WordPad не поддържа всички функции на Word, така че част от съдържанието може да се покаже неправилно. Но трябва да имате достъп до файловете.
Ако щракнете с десния бутон на мишката върху един от вградените файлове в нашия примерен Word файл, една от опциите е „Open PDF Object“. Това отваря PDF файла в програмата за четене на PDF файлове по подразбиране на вашия компютър. От там можете да запишете PDF файла на вашия твърд диск.
Ако WordPad не разполага с опция за отваряне на файла, отбележете типа му тук. Например, вторият ни файл в този документ е .mp3 файл.
След това се върнете в папката „Файлове от [Document]“ и кликнете два пъти върху папката „embeddings“ в папката „word“.
За съжаление, типовете файлове не са запазени в имената на файловете. Вместо това всички те имат разширение “.bin”. Ако знаете какви типове файлове са вградени във файла, вероятно ще можете да изведете кой файл е кой по размера на файла. В нашия пример имахме PDF файл и MP3 файл, вградени в нашия документ. Тъй като MP3 файлът е най-вероятно по-голям от PDF файла, можем да разберем кой файл е кой, като погледнем размерите на файловете и след това ги преименуваме с правилните разширения. По-долу преименуваме MP3 файла.
Имайте предвид, че не всички файлове непременно ще се отворят, използвайки този процес - например, нашият PDF файл се отваря правилно от WordPad, но не можахме да го отворим, като преименуваме своя .bin файл.
След като извлечете съдържанието на компресирания файл, можете да върнете разширението на оригиналния файл обратно към .docx, .xlsx или .pptx. Файлът ще остане непокътнат и може да бъде отворен нормално в съответната програма.
Извличане на изображения от по-стари документи на Office (.doc, .xls или .ppt)
Ако трябва да извлечете изображения от документ на Office 2003 (или по-ранен), има безплатен инструмент наречен съветник за извличане на изображения на Office, който прави тази задача лесна. Тази програма също ви позволява да извличате изображения от множество документи (от един и същи или различни видове) наведнъж. Изтеглете програмата и я инсталирайте (има и преносима версия, ако предпочитате да не я инсталирате).
Стартирайте програмата и се появява екранът Добре дошли. Кликнете върху „Напред“.
Първо, трябва да изберете файла, от който искате да извлечете изображенията. На екрана за въвеждане и извеждане щракнете върху бутона „Преглед“ (икона на папка) вдясно от полето за редактиране на документ.
Придвижете се до папката, съдържаща желания документ, изберете я и кликнете върху „Отвори“.
Папката, която съдържа избрания файл, автоматично става папка Output. За да създадете подпапка в папката, наречена същата като избрания файл, поставете отметка в квадратчето „Създаване на папка тук“, за да има отметка в полето. След това кликнете върху „Напред“.
На екрана Ready to Start (Старт на готовност) кликнете върху „Start“ (Старт), за да започнете да извличате изображенията.
Следният екран показва, докато процесите на извличане.
На екрана Завършени щракнете върху “Щракнете тук, за да отворите папката на дестинацията”, за да видите получените файлове с изображения.
Тъй като избрахме да създадем подпапка, получаваме папка, съдържаща файловете с изображения, извлечени от файла.
Ще видите всички изображения като номерирани файлове.
Можете също така да извличате изображения от множество файлове наведнъж. За да направите това, на екрана за въвеждане и извеждане щракнете върху квадратчето „Режим на партида“, за да има отметка в полето.
Показва се екранът Партиден вход и изход. Кликнете върху „Добавяне на файлове“.
В диалоговия прозорец Отваряне отидете в папката, съдържаща някой от файловете, от които искате да извлечете изображения, изберете файловете с помощта на клавиша “Shift” или “Ctrl”, за да изберете няколко файла, и щракнете върху “Отвори”..
Можете да добавяте файлове от друга папка, като отново кликнете върху „Добавяне на файлове“, като отидете в папката в диалоговия прозорец „Отвори“, изберете желаните файлове и кликнете върху „Отвори“.
След като добавите всички файлове, от които искате да извлечете изображения, можете да създадете отделна папка за всеки документ в същата папка като всеки документ, в който файловете с изображения ще бъдат запазени, като кликнете върху „Създаване на папка за поставете отметка в квадратчето за всеки документ ”, така че в полето има отметка.
Можете също да зададете папката "Изход" да бъде "Същата като входната папка на всеки файл" или въведете или изберете персонализирана папка, като използвате полето за редактиране и бутона "Преглед" под тази опция. Щракнете върху “Next”, след като сте избрали желаните опции.
Кликнете върху „Start“ (Старт) на екрана Ready to Start (Готов за старт).
Следният екран показва прогреса на извличането.
Броят извлечени изображения се показва на екрана Готово. Кликнете върху „Close“ (Затвори), за да затворите съветника за извличане на изображения на Office.
Ако изберете да създадете отделна папка за всеки документ, ще видите папки със същите имена като файловете, съдържащи изображенията, независимо от изходните папки, които сте посочили.
Отново получаваме всички изображения като номерирани файлове за всеки документ.
Сега можете да преименувате изображенията, да ги премествате и да ги използвате в собствените си документи. Просто се уверете, че имате право да ги използвате законно.