3
Банк данных «Подвиг народа» — сделано в Зеленограде 22.02.2012 ZELENOGRAD.RU
Зеленоград, основанный чуть более полувека назад, и Великую Отечественную войну, обычно связывают через битву под Москвой, которая шла на месте будущего города семьдесят лет назад. Но мы нашли ещё одну связь — современную. Это зеленоградская корпорация «Элар», которая реализует проект общедоступного электронного банка документов «Подвиг народа в Великой Отечественной войне». В студии Zelenograd.ru технический руководитель проекта Виктор Тумаркин.

— Виктор Иосифович, почему ваша компания занялась реализацией проекта по созданию банка документов «Подвиг народа»?

— У нашей компании был уже накоплен очень большой опыт по обработке бумажных архивных документов, переводу их в электронный вид. Самым известным проектом в этой области можно назвать создание обобщенного банка данных «Мемориал» о погибших и пропавших без вести в Великой Отечественной войне. Накопленный опыт, позволил начать дальнейшую работу по оцифровке наших военных архивов, и, в частности, документов, связанных с награждениями, оперативными документами, картами периода Великой Отечественной войны. Все это и вылилось в банк данных «Подвиг народа».

Банк данных ещё создаётся. Сейчас прошло несколько этапов работы, практически загружены все наградные дела периода Великой Отечественной войны, которые хранятся в Центральном архиве Министерства Обороны (ЦАМО), но впереди еще и наградные документы других архивов, в частности Военно-морского архива, и, мы надеемся, оперативные дела и карты. Этот проект еще в развитии, но уже то, что удалось загрузить, получило очень большой отклик, показало, насколько это нужно. Этим пользуются, шлют огромное количество писем. Министерство обороны совершенно правильно сделало, создав этот проект.

— О каком объеме документов идет речь: может количестве или в физических объемах: коробки, мешки?..

— Если брать только наградной материал с 1941 по 1945 год — Великая Отечественная война, война с Японией и три указа наград за ранения в Великой Отечественной войне, которые были выпушены с пятидесятые годы — это порядка 37 тысяч архивных дел. Если брать количество оцифрованных страницах — это где-то 23,5 миллиона. По отдельным награждениям это немногим более 12 миллионов конкретных награждений.

— Я пытаюсь представить физический объем этих 37 тысяч дел?

— Каждое архивное дело — это толстая папка, где-то порядка четырехсот листов, где-то больше, где-то меньше. То есть там один или несколько приказов, или наградные материалы к этим приказам. Существуют также оперативные материалы, карты, с ними другая ситуация, но поскольку основной загруженный массив — наградной, больше имеет смысла говорить о нем, хотя и об оперативных документах стоит поговорить.

— Все-таки попытаюсь представить объем — 37 тысяч папок, каждая толщиной несколько сантиметров, что это: железнодорожный состав, колонна грузовиков? Я хочу визуально представить какой объем бумаги физически прошел через вашу компанию?

— Кто-то посчитал, что пришлось переворошить порядка ста тонн документов. А если говорить о технологии, эти же дела приходилось расшивать для обработки.

— Раз уж мы заговорили непосредственно о технологии, как это все происходит: вам привозят коробку с документами, они поступают к вам в помещение. Что происходит с ними дальше?

— Дальше происходит следующее: они расшиваются, чтобы можно было качественно их сканировать, после чего идет сканирование всех листов документов. И после этого отсканированный массив поступает на обработку. Бытует мнение, что перевод документов в электронный вид — это автоматическое распознавание. Для документов военных лет это нереально — качество документов никакого автоматизма не допускает.

— Наверное, там много и рукописных документов?

— Документы разные. Есть и плохая машинопись, есть и много рукописных, например, наградные листы, наградные документы. Поэтому сделать индексную базу данных, то есть именно тот набор полей, по которым организуется поиск — работа вручную. На основании нашего большого опыта создана специальная технология обработки. Поэтому такие короткие сроки, ведь работа началась весной 2010 года — не прошло и двух лет. Для этого нужна практически конвейерная работа. И у нас действительно конвейер по своей технологии, потому что отдельные операторы отвечают за ввод отдельных частей информации. Это не то, что сидит человек и всё, что он видит на листе, переводит в электронный вид.

Часть и не надо переводить — она остается на бумаге, их можно посмотреть и так. Специфика наших банков данных именно в том, что это не только база данных, но и сами документы. То есть в интернете можно увидеть архивные материалы, непосредственно те документы, которые были созданы во время войны. Основное, что интересно и востребовано в этих материалах, это не только то, кто и чем был награжден, но и за что. То есть описание того, за что человек представляется к награждению и в конечном итоге награждается. Эти свидетельства военного периода вызвали живой интерес. К нам начали приходить письма с практически одинаковым содержанием. Смысл приблизительно следующий: «Он нам никогда не рассказывал за что получал свои награды. И мы только теперь узнаем, каким героем он был на войне, что он совершил, он об этом говорить не любил и отмалчивался». Таких писем с таким содержанием практически слово в слово мы получаем очень много, от разных людей: и от рабочих из разных городов, и такое же письмо слово в слово прислал писатель, который подписался «Григорий Шалвович Чхартишвили (Борис Акунин)». У всех одни и те же слова: «Он не любил рассказывать, мы не знали, за что он получил награды». Теперь это становится общим достоянием.

— То есть вы какую-то часть документов, необходимую для поиска, индексируете, а все остальное остается картинкой, и я уже нахожу нужный документ, связанный со своим родственником, дедом, прадедом и уже смотрю оригинальный документ, читаю, разбирая не совсем иногда хороший почерк, что именно он сделал.

— Совершенно верно, вы смотрите документы: приказ или указ о награждении и наградной лист. У части документов уже в приказе индивидуальная информация — наградные листы не требуются, но это два основных документа. В наградном листе, кроме данных о человеке и информации о подвиге, есть еще очень интересная вещь: там говорится, что человек представляется к награде каким-либо орденом, но это еще не значит, что этот орден ему присвоят. Мы часто получаем письма, в которых люди указывают на ошибку: «Наградной лист на Орден Красного Знамени, а у вас написано, что он получил Орден Отечественной войны I степени». Как правило, это не ошибка, потому что в процессе утверждения награда может несколько раз поменяться. Что интересно, меняется она как в сторону повышения, так и в сторону понижения. Понять логику трудно, но факт в том, что человек представляется к одной награде, а вот чем он награжден, видно из приказа.

— Получается, дело всегда рассматривалось по существу. Смотрели, что написано в представлении на награду и принимали решение?

— Мы не специалисты и не можем сказать, как это было, какие другие факторы воздействовали. Но очень много ситуаций, когда в процессе согласования (а их было несколько) присвоение зачеркивается и вписывается другая награда, которая потом и попадает в приказ.

— Вы говорили о конвейере. Но конвейер подразумевает работу с элементами в хорошем состоянии. Здесь может быть другая ситуация: документ может быть порван, ветхий и так далее. Насколько ваш конвейер сбоил, насколько часто возникали проблемные ситуации?

— Конвейер работает не с документом. Потому что документ сканируется, и дальше вся работа уже идет с образами документов. С самим документом дело идет так: дело расшивается, документы сканируются, дело сшивается, разумеется проверяется. О проверке пойдет отдельный разговор, это очень существенная часть работы, но после сканирования работа с самим документом заканчивается. Дальше идет работа с образами.

— Я зашел на ваш сайт, пытался им воспользоваться, но довольно много ожидаемых вещей не нашёл. Например, пытался найти информацию о боевых действиях под Зеленоградом, в районе деревень Крюково и Матушкино. Вводил названия операций, место, время. И ничего не нашел. Почему? Не весь массив документов попал в этот проект? Скажем, если речь идет о картах, о схемах. Или еще не все загружено?

— Что касается оперативных документов, то это самое начало работы. С весны 2010 года было обработано очень небольшое количество, как наградных документов, так и оперативных. Вопрос о продолжении работы над проектом был связан в первую очередь с реакцией на созданный ресурс. Реакция показала, что наиболее востребованы все-таки оказались наградные дела, поэтому дальше в 2010, 2011, 2012 года работа пошла только с наградными делами с тем, чтобы максимально обработать их, а оперативные дела остались в том небольшом объеме, в котором были изначально. Но мы надеемся, что эта работа будет продолжаться. В далекой перспективе, если все получится так, как задумано, мы планируем связать документы оперативных действий с описаниями подвигов, которые есть в наградных делах. То есть мы читаем описание подвига, узнаём за что награждении и можем перейти к оперативным делам, которые описывают именно это событие.

Это, конечно, дело будущего. Потому что для этого надо и обработать оперативные дела, и связать. Сейчас, когда обрабатывались наградные дела, они обрабатывались не по всей информации. В качестве индексной выбирались основные поля, которые нужны для идентификации человека, для нахождения его награды. Но это не все поля. Процесс трудоемкий, связан со значительными финансовыми и временными затратами. Поэтому развитие проекта в том виде, о котором мы с вами говорили — это дело будущего. А пока по оперативным делам загружена небольшая часть документов, связанные с самым началом войны и документы, связанные с Берлинской операцией — конец войны.

— Остается ли сейчас информация ограниченного доступа или вся секретность с этих документов уже снята?

— Секретность с документов снята, но сложности, связанные с законом о персональных данных, другие моменты, связанные с армией, они остаются. Именно поэтому в наградных листах закрыты адреса проживания. Казалось бы, прошло семьдесят лет, но адреса закрыты. Это создает определенные неудобства, потому что не всегда можно без адреса при распространенных именах опознать человека. Но это было жесткое требование Министерства обороны. Писем приходит много: «Почему? Мы не можем без адреса определить». Это, конечно, вызывает определенную сложность. Но надо сказать, что проблема не только наша, неслучайно даже на Западе таких банков данных с документами особо нет. Потому что в разных странах существуют свои законы, определенные ограничения на эту тему. В некоторых странах про мертвых можно всё, а про живых нет. А зачастую в документах сложно отличать мертвых от живых.

— Эти ограничения касаются каждого отдельного документа. Но можно ли сказать, что дела по какой-то операции, по какому-то боевому соединению в целом не попали в ваш банк?

— Есть определенные воинские подразделения, которые Министерство обороны не выставляет в общий доступ.

— Вы уже упомянули о контроле ошибок, а я хотел с другой стороны подойти к этому вопросу. Насколько тесно вы работаете с историками, с архивистами, насколько вам помогают со стороны Министерства обороны, потому что у вас есть техническая компетенция, но должна быть задействована целая масса специалистов.

— Не совсем так. Наша задача — перенести информацию из документа в электронный вид и выставить на всеобщее обозрение. А потом уже и граждане, и историки могут сами разбираться, анализировать информацию. У нас на данный момент нет задачи анализа. Наша задача — как можно точнее перенести информацию. Поэтому какие-то моменты мы уточняли непосредственно в самом архиве у специалистов, какие-то вещи нам подсказывают пользователи. Приходят сообщение об ошибке. Зачастую оказывается, что и пользователи ошибаются, но иногда бывают ошибки. Хотя ошибки в документах, которых достаточно, мы не исправляем, мы говорим у нас банк архивных документов.

Понимаете, если в архиве так написано, мы должны так и перенести. Другое дело, когда рукописный почерк, который прочитать можно по-разному, а пользователь подсказывает, что это прочтено неправильно. Как правило, родственники об этом сообщают — мы исправляем.

Отдельный момент с военкоматами, которые время от времени указывают в документах неверно. Мы взяли справочник районов, из них военкоматы на то время: на время начала войны, на время изменений административно-территориального деления в сорок третьем году и позже. Это все мы учитываем, чтобы наиболее точно ввести информацию.

Ну и конечно несколько степеней проверки. Это и проверка непосредственно операторами, и двойной ввод, и проверка оператором верификации за оператором ввода, и потом проверка по базе данных на соответствие полей друг другу. Я не могу сказать, что после этого ошибок не остается вообще, такого не бывает. Но наша задача — свести их к минимуму. Мы стремимся к тому, чтобы ошибок не было вообще, но наши ошибки обработки, о которых сообщают пользователи, мы исправляем.

— Мне кажется, по эффективности работы для тех же историков, электронный архив даже с некоторым количеством ошибок лучше, чем бумажный архив?

— Конечно, потому что работа с электронным архивом дает пользователю возможность самому искать, самому вносить изменения в поисковый запрос и находить требуемую информацию, несмотря на ошибки. Пользователи говорят, что «вот фамилия здесь написана не такая, а вот такая». Но при этом находят.

— Действительно, может быть проблема не с фамилиями, а с именами: в документах так, а в семье его называли немножко иначе. Поэтому как раз такими последовательными приближениями можно найти нужную информацию. У меня с базой «Мемориал» было именно так.

— С базой «Мемориал» отдельный разговор — там как раз это очень важно, потому что много искажений в самих документах. Например, были писари, которые могли неправильно написать целые страницы — отчества с мягким знаком. Но зачастую и не знаешь — это ошибка или так в документах написано. Когда вся страница такая, понимаешь, что это писарь, а когда это единичное явление, то так сказать нельзя — известно много случаев, когда неграмотный писарь делал человеку паспорт.

— Уже есть база «Подвиг народа» — информация о наградах, есть база «Мемориал» — это погибшие и пропавшие без вести. Какая еще информация о войне, какие еще типы документов остаются в архивах необработанными, на которые даже проекта еще нет?

— Огромное количество документов, касающихся войны! Да что там говорить, в том же Центральном архиве министерства обороны до сих пор не автоматизированы описи дел — вот болевая точка. Чтобы найти какую-либо информацию надо много всего листать. Просто так найти какой-то документ в архиве — достаточно тяжелый труд.

Могу для примера сказать даже про награды. Когда мы с вами говорили, что награды обработаны, я забыл уточнить, что обработаны далеко не все награды. Обработаны так называемые номерные награды: ордена и две медали — медаль «За отвагу» и медаль «За боевые заслуги». Во время войны было еще большое количество медалей. Медали «за оборону»: Москвы, Ленинграда, Кавказа, Севастополя, Одессы и так далее; медали «за освобождение» и «за взятие»: за Варшаву, за Будапешт, за Прагу и так далее; медаль за победу над Германией, медаль за победу над Японией. Эти медали номеров не имели, мы их называем безномерные награды и они пока не обрабатывались. Обработка их связана с определенными сложностями. Если для номерных наград в архиве имеются компактные фонды, которые мы взяли и обработали, то таких компактных фондов на безномерные награды нет. Сами приказы надо искать в делах отдельных армий, фронтов, подразделений. А как искать без электронных описей дел? Пролистывать все? Это дичайшая и тяжелая работа. Тоже самое с «Мемориалом» — обработаны основные фонды потерь — солдатские, сержантские и офицерские — но есть огромное количество дел отдельных частей. И в них также содержится информация о потерях. Она большей частью попала в эти фонды, но что-то осталось вне. А как это найти? Там огромное количество частей, по каждой части огромное количество документов: и оперативные, и финансовые, и организационные… Как выбрать из них, связанные с потерями? Поэтому это большая головная боль — обработка самих описей открытых военных архивов, чтобы нормально обработать их материалы.

— Если говорить вообще о массиве архивных материалов по Великой Отечественной войне, то какую долю документов вы уже обработали?

— Это крошечная часть того, что хранится только в ЦАМО, не говоря уже про другие архивы.

— Вы упомянули о номерных наградах, но на сайте я не нашел поиска по номеру, хотя знаю, что есть проблема, когда находят останки, находят награду с номером и тогда по награде можно установить личность погибшего. Будет такая возможность?

— Мы обрабатываем документы наградные — то есть документы о присвоении награды. В них нет данных по номеру. Номера появляются в документах о вручении наград. А в приказе о награждении, в представлении на награждении — там просто нет номеров, поэтому и искать мы не можем.

— Возвращаясь к технологии и возвращаясь в Зеленоград. Насколько зеленоградский филиал «Элара» был задействован в этой работе? Каков наш вклад в это большое и нужное дело?

— Очень большой. Зеленоградский филиал предварительно набил руку на обработке «Мемориала», а когда начался «Подвиг народа», то при сканировании через него прошло чуть больше половины всех дел — порядка 19 тысяч. Что касается индексирования, обработки, там может быть небольшой объем, немногим более полумиллиона награждений, но начальный. То есть отладка технологии для этого массива была здесь. Сложность в том, что надо было соединить приказ с наградным листом. Они зачастую идут не в том порядке и надо к отдельной сточке приказа привязать конкретный наградной лист на это награждении. А иногда приказы очень большие и приказ в одном томе, а наградные листы в совершенно других томах. Это тоже надо пытаться соединить. Где-то есть ссылки — тогда соединяется, а где-то нет — тогда приходится делать две записи: одна на наградной лист, а другая на приказ. В документах нигде нельзя было найти ссылку, где лежат наградные листы конкретно к этому приказу. Возможно, со временем это будет объединено, но пока это в данном случае вводилось отдельно. Кроме того, на Героев Советского Союза наградные листы почему-то были выбраны из тех мест, где они лежали и были созданы отдельные 60 дел, где были собраны наградные листы только Героев Советского Союза.

Еще я хотел бы сказать об одном важном моменте, который надо понимать. Мы ввели в базу данных то, что имеется в ЦАМО и то, что нам дали — мы это и отсканировали. Когда спрашивают: а все ли награждения? Что я могу ответить? Всё, что нам дали, всё мы и обработали. Я вполне могу допустить, что каких-то награждений по каким-то неведомым нам причинам там может не оказаться.

— Я напомню адрес сайта общедоступного банка электронных документов «Подвиг народа в Великой Отечественной войне» — www.podvignaroda.mil.ru, который уже работает и им можно пользоваться, несмотря на то, что наполнение документами продолжается. Создает его зеленоградская корпорация «Элар».

Станьте нашим подписчиком, чтобы мы могли делать больше интересных материалов по этой теме


E-mail
Реклама
Реклама
Обсуждение
Кто Это
22 февраля 2012
Элару респект.
Андрей ***
22 февраля 2012
Каждый зеленоградец должен посмотреть киргизский мультфильм "Сильные духом крепче стены", про героев-панфиловцев, к 65-летию Победы.
Все-таки каждый зеленоградец должен в первую очередь знать, что каноническая версия подвига героев-панфиловцев - вымысел.

А в этой базе данных - реальные герои. Очень интересно читать описания подвигов. Там часто такое, что понятно почему ветераны не хотели вспоминать.
Добавить комментарий
+ Прикрепить файлФайл не выбран