Як вирізати текст з djvu

Як вирізати текст з djvu


Книги у форматі djvu зустрічаються в електронних бібліотеках досить часто. Як правило, вони займають невеликий обсяг, в них збережені шрифти та ілюстрації оригіналу. Головним недоліком цього формату є те, що текст сторінки копіюється до буфера як зображення. Щоб його редагувати, потрібно використовувати інші програми.

Вам знадобиться

  • - комп 'ютер з програмами Djvu OCR, Djvu Solo, Djvu Viewer;
  • - ABBYY FineReader:
  • - Adobe Photoshop.

Інструкція

1. Скопіювати окрему сторінку з книги у форматі djvu дозволяє практично будь-яка програма, яка читає файли даного виду. Всі вони мають схожий інтерфейс і приблизно однакові функції. Зайдіть у верхнє меню і знайдіть вкладку Selection. Там ви побачите рядок Select Region. Виберіть її.

2. Знайдіть потрібну сторінку Це можна зробити у вікні верхнього меню. Якщо сторінка знаходиться недалеко від початку або кінця книги, можна скористатися стрілками. Виділіть на ній потрібний фрагмент за допомогою рамки, яка з 'явилася перед вами. Клацніть правою клавішею миші. Перед вами з 'явиться спадне меню, яке пропонує або зберегти сторінку, або скопіювати. Виберіть друге.

3. Відкрийте Adobe Photoshop або, наприклад, перегляд зображень, що має функцію створення нового файлу. Створіть файл і вставте в нього те, що у вас в буфері. Збережіть зображення як jpg або tiff. При необхідності опрацюйте його. У форматі djvu нерідко зберігають дуже старі книги, з незвичайними і не завжди чіткими шрифтами. Крім того, там зберігаються всі позначки, які були в оригіналі. Вони можуть перешкодити розпізнанню тексту. Приберіть зайве сміття. Переведіть зображення в чорно-біле і встановіть баланс яскравості та контрастності. У деяких випадках потрібно збільшити роздільну здатність одночасно з розмірами.

4. Відкрийте зображення в ABBYY FceReader. Чим пізніша версія цієї програми у вас варта - тим краще. Знайдіть функцію "Розпізнати" ". Якщо програма зробить це, збережіть файл у потрібному вам форматі - наприклад, у doc.

5. Djvu OCR дозволяє розділити на сторінки відразу всю книгу. Відкрийте програму і виберіть параметр Djvu Decoder. Перед вами з 'явиться віконце. Знайдіть функцію Djvu File List. Натисніть кнопку Add. Вкажіть, де знаходиться книга у цьому форматі, яку ви бажаєте перетворити. Виберіть Output Directory. Знайдіть кнопку Browse. Виберіть теку для збережених сторінок. Назва теки напишіть латиницею. Натисніть Process.

6. Запустіть ABBYY FceReader. Можна відкрити як одну сторінку, так і все відразу - це значно скоротить час. Натисніть кнопку "Розпізнати". Збережіть сторінки окремими файлами або виділіть всі та зробіть з них один документ.