24 февраля 2012

Живая история

Живая история

Виктор Тумаркин, руководитель центра проектирования информационных ресурсов корпорации ЭЛАР — о возможностях, которые дают пользователям электронные банки документов открытого доступа ОБД Мемориал и "Подвиг народа", а также о механизмах, благодаря которым эти возможности появились.

Виктор Тумаркин Была осуществлена и продолжается большая и сложная работа. Нужно было не просто отсканировать документы, что тоже не просто, учитывая объёмы массива, ветхость и ценность оригиналов, но и ввести с электронных образов информацию, которая становится поисковой.

Виктор Иосифович, оформление запроса в архив, чтобы узнать информацию о человеке, являлось стандартной процедурой для всех, кто пытался узнать о судьбе участников Великой Отечественной войны. Часто такой способ поиска не давал результата. Что изменилось, когда был создан ОБД Мемориал?

Русскоязычные пользователи Интернета могут самостоятельно искать и анализировать архивные документы времён Великой Отечественной войны, что позволяет прояс­нить судьбы участников военных действий, найти места их захоронений. При обращении в архив, как правило, указываются фамилия, имя, отчество, дата и место рождения человека. Работники архивов искали соответствующие данные по картотекам и могли их не найти из-за того, что в документе, например, неверно отражена буква в фамилии или отчестве. Наши современники могут это предположить, вбив в поисковые поля разные варианты написания, найти необходимые данные и увидеть документ.

ОБД Мемориал является не просто базой данных, но электронным банком реальных документов, хранящихся в различных архивах. А то, что информация объединена из разных источников, даёт возможность оперативно находить сведения, не прибегая к запросам в несколько инстанций. Электронные копии документов находятся в открытом доступе, и значит, люди могут самостоятельно искать и проводить исследования.

Очень важно, что в этот банк были внесены также данные трофейных карточек советских военнопленных, поскольку очень многие участники войны, о которых в первичных донесениях писали как о пропавших без вести, на самом деле погибли в плену. В ОБД Мемориал загружено также более тысячи томов печатной Книги Памяти, а это ещё 10 миллионов записей. Ведь нередко в архивных документах вовсе отсутствуют данные о воевавших, а в Книгах Памяти они есть. Именно доступность информации из нескольких источников и возможность её самостоятельно анализировать позволили прояснить сотни тысяч судеб. Мы получаем много откликов, в которых говорится, что люди не могли в течение десятилетий найти сведения о своих родственниках, а на сайте обнаружили за 20 минут.

Пользователь ОБД Мемориал видит интернет‑страницу, и ему сложно представить, какие технологии были применены исполнителями проекта, чтобы он мог искать сведения и знакомиться с документами. Расскажите об этом.

Была осуществлена и продолжается большая и сложная работа. Нужно было не просто отсканировать документы, что тоже не просто, учитывая объёмы массива, ветхость и ценность оригиналов, но и ввести с электронных образов информацию, которая становится поисковой. Автоматическое распознавание невозможно произвести с любого документа — выцветшая ветхая бумага, неразборчивый почерк делают это нереальным. Поэтому была разработана специальная технология, при которой одни операторы отвечали за ввод определенных полей, другие — за другую часть документа. Трудоёмкость процесса касается не только ввода, но и проверки информации. Ведь в рукописных записях бывает трудно распознать буквы и слоги: "п" или "н", "лю" или "мо", "ме" или "ли" и так далее. Но опытные операторы обработали огромный объём — только за 2007 год было создано 20 миллионов записей на основе информации из фондов по безвозвратным потерям из Центрального Архива Минобороны. Дальнейшая работа шла по наполнению документами из других архивов и иных фондов ЦА МО.

Кроме того, есть неформализованные документы, в которых актуальную информа­цию надо отыскивать и анализировать. Напри­мер, справки уточняющего характера. Обра­ба­тывались также документы на немецком, финском, румынском, венгерском языках — карточки военнопленных, списки.

Обрабатывать документы для "Подвига народа" было технологически легче?

В настоящее время обработан массив доку­ментов в наградном отделе ЦА МО. Это Указы Президиума Верховного Совета СССР, Приказы Командующих фронтов о награждении за воинские заслуги во время Великой Отечественной войны с указанием наград и списков награжденных. В сопроводительных документах к ним — списки представленных к награждению и наградные листы с личной информацией и описаниями боевых подвигов, за которые награждения произведены. Сложности возникают при совмещении наградного листа с приказом, потому что документы зачастую лежат в разных местах, не в том порядке или вовсе не совпадают. Есть наградные листы на людей, фамилии которых отсутствуют в приказе, и в таком случае вводится запись "Представлен к награде". Ещё один нюанс: в наградном листе указана одна награда, но при согласовании несколькими инстанциями она могла измениться, да ещё не единожды. Таких расхождений встречается очень много.

Кроме того, "Подвиг народа" содержит в небольшом количестве и другую информацию: боевые приказы, распоряжения и доне­се­ния, журналы боевых действий, директивы, доклады, планы операций, разведывательные бюллетени, оперативные сводки, карты, схемы и другие документы, имеющие историческую значимость. Важнейшими и особо ценными документами являются историчес­кие карты военных действий, обработка которых обеспечит в дальнейшем географическую привязку событий войны, действий частей и соединений.

То есть по базе документов "Подвиг народа" помимо факта награждения можно узнать, за что именно воевавший получил орден или медаль?

В документах встречаются и общие формулировки, например, "за проявленный героизм", "за проявленное мужество и стойкость", но преимущественно описаны конкретные боевые эпизоды. Эта информация, кстати, вычленяется из документов (наградных листов, приказов), и пользователь сразу может увидеть запись с описанием подвига. Именно поэтому портал "Подвиг народа" стал настолько популярен — более пятнадцати тысяч посещений каждый день. Документы "рассказывают" о подвигах, о том, как проводились награждения, как они оформлялись, наконец, о боевом пути красноармейцев.

По информации с этого сайта можно восстановить боевой путь участника войны — время, подразделения, места сражений и обстоятельства службы. Это живая история. Та история, которая, казалось бы, уходит вместе с участниками войны. Ведь недаром большинство приходящих к нам писем содержит одну и ту же повторяющуюся фразу: "Он об этом никогда не рассказывал".

Рубрика: Проекты