Когда-то давно были задачи по наполнению новосозданного сайта текстами. Несмотря на то, что я просил заказчика предоставить тексты отдельно, а картинки разложить по папкам, тексты я получил с картинками внутри, наверное, заказчик решил, что там будет проще и быстрее, да и файлов меньше. Но к сожалению, при добавлении скопированного из документа текста в админку CMS WordPress, картинки в админку не переносятся. Что как бы логично, потому что у картинок должен быть указан какой-то урл, а в данной ситуации, это не может быть внешний урл, а внутренний не может быть, потому как картинки не загружены в библиотеку медиафайлов. Лучшее решение – запросить картинки у заказчика, но допустим, мы не можем это сделать, тогда надо получить (достать, выкачать, вырезать, высунуть) картинки из имеющегося файла.
Как получить картинки из документа Word формата .doc, .rtf или .docx
- Файл должен быть в формате .docx – если файл в другом формате (например, .doc или .rtf), то достаточно просто пересохранить его в .docx (открыть документ и выбрать “Сохранить как” или CTRL+SHift+S).
- Сделайте копию файла (на всякий случай) и работайте с копией.
- Разрешение .docx нужно заменить на .zip, например, был файл about.docx, а должен получиться about.zip
- Открываем полученный zip-архив любым архиватором, на ОС Windows можно даже встроенным архиватором открыть, и распаковываем данный архив, по итогу получим папку about (в моем примере)
- Открываем полученную из архива папку, заходим в директорию word затем заходим в директорию media и наблюдаем там все картинки из документа.
- Картинки имеют названия в формате image1.png, image2.png – рекомендую дать им какие-то осмысленные имена, и можно использовать.
- После получения картинок, удаляем весь мусор: архив, папку с файлами.
Текста много, а делать это всё 5 секунд.
Один комментарий к “Как получить картинки из документа Word формата .doc, .rtf или .docx”
Сергей
Сайт классный. Внес в закладки.
По поводу картинок – можно сохранять не как zip архив, а просто Файл – сохранить как – Веб-страница (не путать с веб-страница в одном файле). В результате будет ненужный для наших целей htm файл и папка с нужными нам картинками.