Как бумажный архив переносится в электронный вид

Работа любого учреждения сопровождается составлением множества документов. В последние годы они стали электронными – именно в таком виде их использует, например, медицинская информационная система. Но зачастую одной только современной документации недостаточно – приходится обращаться к старым архивам. Сегодня многие из них по-прежнему представляют собой целую гору бумаг. Чтобы сделать архив электронным, потребуется последовательно выполнить несколько различных видов работ.

Сканирование

Для того, чтобы появилась возможность отобразить на экране компьютера какой-либо бумажный документ, его достаточно сфотографировать цифровой камерой. Она создает растровую картинку, то есть матрицу, составленную из пикселей различного цвета. Ту же самую задачу гораздо более эффективно решают сканеры. Именно их и используют на первом этапе преобразования архива в электронную форму.

Непосредственно при выполнении сканирования или сразу после его завершения можно осуществить первичную обработку полученных изображений – изменить их яркость и контрастность, очистить картинку от «шумов», возникших вследствие износа бумаги или её загрязнения. Полученные результаты необходимо сохранить в полном объёме – не исключено, что они когда-нибудь еще потребуются.

Обработка текстовой информации

Первичное изображение документа, полученное после сканирования, не всегда является оптимальной электронной формой. В частности, нет никакого смысла хранить тексты в виде картинки. Их необходимо преобразовать в более удобный формат, который используется в CRM для клиники или в обычных офисных приложениях.

Для достижения этой цели применяются программы распознавания текстов. Они дают в целом неплохие результаты, однако возникновение ошибок всё-таки не исключено - к примеру, буква «с» в бумажной документации иногда определяется как «е».

Таким образом, полученные тексты приходится выверять и корректировать. Это кропотливая и не самая интересная работа, но обойтись без неё не удастся. Кроме того, рекомендуется устранять «неоднозначности», характерные для бумажных документов. Часто встречаются, например, альтернативные варианты написания одного и того же адреса. Это не всегда имеет большое значение, но порой именно такие мелкие неточности становятся причиной серьёзных проблем.

Обработка графической информации

Обычные иллюстрации, рентгеновские снимки и различные фотографии можно сохранять в электронном архиве сразу после сканирования бумажного носителя. В подобных случаях растровый формат оптимален. В то же время для графиков или кардиограмм может потребоваться дополнительное преобразование картинки. Цель этой операции – получение данных в векторном формате. Другими словами, каждая кривая записывается в виде набора координат точек, между которыми при отображении проводятся отрезки.

Это преобразование часто оказывается более сложным, чем распознавание текста. Для его выполнения используются особые программы, причем значительную часть работы всё равно придется делать вручную.

Хранение данных

Электронный архив можно разместить на жестких дисках специализированного сервера. Такое решение позволяет получить быстрый доступ к любому из документов. Но этого недостаточно – необходимо также обеспечить сохранность информации и резервное копирование данных. К сожалению, «вечных» носителей пока не существует – рано или поздно архив придется полностью перезаписать. Имеется также возможность хранения данных в «облаке». Это намного проще и часто дешевле, чем использование собственных серверов и резервных носителей. Тем не менее при таком подходе всегда есть риск того, что компания, обеспечивающая работу «облака», по каким-то причинам перестанет существовать или откажется от своих обязательств.