Програма для редагування сканованих документів: яка краще?
У ході роботи з документацією та базами даних виникає чимало суттєвих проблем. І мова йде не про масу помилок, які можна знайти в документах, що вимагають через це створення нового файлу з виправленнями, але і в простій людській ліні. В принципі, лінь завжди була двигуном прогресу, оскільки людям завжди хочеться все зробити швидше, щоб позбутися зайвих турбот, а щоб відпочивати було можна якомога більше, слід робити роботу ще й якісно. У цьому випадку питання стосується того, що багато документів для повного занесення в яку-небудь базу даних або загальний реєстр вимагають набору тексту по-новому, а це починає не просто втомлювати, але й набридати. Для такого випадку існує сканер і програма для редагування сканованих документів.
Що робить сканер?
В цілому, сканер - це пристрій, який переносить текст з надрукованого документа (газета, журнал, книга і т. Д.) На комп`ютер, робить він це у вигляді зображення. У деяких пристроях є спеціальні програми, які контролюють процес сканування, при цьому існує можливість вибрати навіть формат, в який перетворюється исходник. У стандартному випадку це фактично просто знімок якогось документа, редагування якого неможливо в силу того, що символи не можуть бути розпізнані.
Що можна зробити потім
Ви зможете вільно управляти отриманим документом, редагуючи і видозмінюючи весь чи частину тексту загалом, лише у разі, якщо використовується спеціалізована програма для редагування відсканованих документів. Ці утиліти займаються розпізнаванням зображення і переведенням їх в текст, який можна обробляти і редагувати. Існує безліч програм подібного роду, і кожна з них має свої нюанси.
Старий добрий ABBYY FineReader
Мабуть, найпоширеніша програма для редагування відсканованих документів з гордою назвою ABBYY FineReader - це цілий пакет редакторів, який дозволяє проводити всілякі маніпуляції з відсканованим зображенням. Високий результат роботи досягається за рахунок того, що програма може розпізнати документ будь-якої якості (навіть якщо ви просто зробили фото на камеру мобільного телефону), а також через можливість розпізнавання багаторівневих файлів, які містять таблиці, малюнки та інші дрібні деталі. При цьому в ході розпізнавання можна задати мову, що допомагає ABBYY FineReader вибрати правильні символи порівняння, завдяки чому програма видає текст з найменшою кількістю похибок.
Крім іншого, даний редактор відмінно справляється з документами формату PDF. Таким чином, якщо у вас є файл такого формату, то редагування сканованих документів PDF буде проходити швидко і без зайвих зусиль. Сам зовнішній інтерфейс інтуїтивно зрозумілий і не вимагає додаткових навичок, така доступність для користувача будь-якого рівня і вплинула на його популяризацію. Та й після розпізнавання ви можете порівняти отриманий результат і відкоригувати огріхи, допущені програмою, прямо в меню редактора. Сам же результат зберігається як окремий документ, який ви можете змінювати, як вам заманеться.
Хитрощі роботи з PDF-форматом
Редагування сканованих документів - справа монотонне, а якщо ісходником служить PDF-файл, то тут є свої хитрощі. Справа в тому, що редактор виду FineReader вельми гарний у цій справі, але його вартість часто відштовхує користувача і змушує шукати аналоги. Тому є ряд окремих утиліт, які дозволяють виробляти вузькоспеціалізовану роботу, націлену на файли PDF-формату.
PDFill PDF Tools
PDFill PDF Tools - безкоштовна програма для редагування сканованих документів з розширенням PDF. Вона містить ряд додаткових опцій, таких як об`єднання або роз`єднання документів, редагування або повне видалення вмісту, перетворення PDF-файлу в зображення і навпаки. Також тут можна створювати списки, редагувати вбудовані зображення, вирівнювати текст і багато інших настройки, які звичні будь-якому користувачеві пакету Microsoft Word або його аналогів. Дана програма абсолютно безкоштовна і призначена для будь-якого рівня користування (приватного, корпоративного і т. Д.). Інтерфейс тут, звичайно, не самий доброзичливий, але набір функцій і отладок все це заповнює з лишком. Ось тільки російськомовного меню поки немає, тому, якщо з англійським не склалося, доведеться повозитися зі словником.
Free PDF Editor
Ще одна безкоштовна утиліта, яка дозволяє редагувати PDF-файли. Тут більш зрозумілий і зручний інтерфейс. Та й програма підтримується багатьма операційними системами, єдиний мінус полягає в тому, що готовий документ відредагувати можна. Зате можна сканувати прямо в цю програму, і вже тоді працювати повним ходом. Правда, доведеться повозитися зі створенням віртуального принтера, оскільки інакше така програма для редагування сканованих документів попросту не буде працювати.
OCR-редактор
Якщо ж повернуться до початку і вести мову про безкоштовні аналогах FineReader, то існує програма для редагування документів doc під назвою OCR Form. Досить корисна утиліта, особливо якщо вам доводиться працювати з декількома мовами (в наявності підтримка понад 20-ти найпоширеніших мов). Вона відмінно справляється з поліграфією або документами поганої якості, але що стосується рукописного тексту, то тут все не так гладко. Звичайно, розпізнати такий текст OCR може, але от якість цього розпізнавання поки залишає бажати кращого. Що ж стосується зовнішнього вигляду, то тут йому можуть позаздрити багато редакторів - все гранично просто: відкриваєте файл і бажаєте сканувати, потім зберігаєте в потрібному форматі - і справа з кінцем. Популярність утиліта заробила завдяки можливості самонавчання, так званої адаптивної системі розпізнавання, що дозволять здійснювати розпізнавання все краще і краще при кожному новому запиті.
Ще одна з сімейства OCR
Редагування сканованих документів - копітка заняття, тому не дивно, що для хорошого результату деякі користувачі шукають інші методи. У таких випадках є можливість скористатися ще однією утилітою - SimpleOCR. З назви зрозуміло, що це додаток, який схоже на попереднє - OCR, але в більш спрощеному і досконалому вигляді. Тут для вас є можливість ручного додавання слів за рахунок вбудованого редактора, можливість редагування тексту прямо у вікні утиліти, а також робота з цілими пакетами даних (можна завантажити відразу кілька файлів, які будуть розпізнаватися). Але зовнішній вигляд може злегка збити з пантелику, тут вже доведеться трохи почитати про саму програму і принципи її роботи. В іншому випадку замість відмінного редактора ви можете отримати марну програму для редагування сканованих документів, яка займає простір на вашому комп`ютері.
А якщо документ - картинка?
Іноді, коли ви проводите редагування сканованих документів jpg-формату, є необхідність виділити не текст, а саме картинку (схему, таблицю, графік та інше). А тут вже питання зовсім іншою. Адже при розпізнаванні тексту завдання ставиться зовсім по-іншому. Тепер потрібно не просто розпізнати зображення, а ще й привести його в естетичний вигляд. Наприклад, якщо відсканувати схему з книги, то буде видно відбитки чорнила з інших аркушів. Щоб позбутися від цих «перешкод», слід вдатися до допомоги графічно редакторів.
Одним з таких може бути старий добрий Paint, але у світі, де править технологічний прогрес, первинні позиції в цьому питанні віддають старому доброму Photoshop`у, оскільки це і швидше, і зручніше. Редагування сканованих документів в "Фотошопі" дозволяє позбавлятися від плям і «бруду», змінювати кольори малюнків, варіювати їх контрастність і яскравість за допомогою наборів всіляких фільтрів. До того ж уроків до того, як зробити ту чи іншу операцію, предостатньо, тому не потрібно бути «генієм" Фотошопа "», достатньо просто захотіти.
Існує ще маса інших редакторів, якими ви можете скористатися, також прекрасними аналогами можуть бути і онлайн-утиліти, які дозволяють розпізнавати сканований текст, навіть не займаючись підбором якого-небудь іншого спеціалізованого програмного забезпечення. В цілому, будь-яка програма для редагування сканованих документів має право на життя і на те, щоб ви її оцінили.