Новости

Анастасия Ракова рассказала об использовании нейросетей для распознавания архивных документов

mos.ru
Анастасия Ракова рассказала об использовании нейросетей для распознавания архивных документов

Заммэра Москвы по вопросам социального развития Анастасия Ракова поделилась итогами работы сервиса «Поиск по архивам», который помогает изучать историю семьи по рукописным текстам.

«Поиск по архивам» — это запущенный в начале 2023 года сервис Яндекса, который помогает искать историю своих семей.быстро находить упоминания людей, населенных пунктов и событий в расшифрованных нейросетью рукописных документах XVIII-XX веков.

Он помогает людям искать историю своих семей, историкам, социологам, демографам и журналистам – находить информацию об исторических событиях и личностях.

Как уточнила вице-мэр, нейросеть «Поиска по архивам» обучилась распознаванию рукописных текстов на основе ресурса «Моя семья», который содержит оцифрованные метрические книги сведений о рождении, браке и смерти москвичей и жителей Московской губернии.

Сервис «Поиск по архивам» хранит расшифрованные архивные дела, в которых содержится информация о людях, родившихся в России до 1917 года. В нем также содержится более 3,6 миллиона оцифрованных страниц периодических изданий. Нейросеть Яндекса распознала более 60 тысяч рукописных и печатных текстов середины XVIII - начала XX веков, в сумме это более 10 миллионов страниц или 492 миллиона строк.

Технология расшифровки в «Поиске по архивам» основана на оптическом распознавании символов. Нейросеть узнает утратившие актуальность знаки (например, исчезнувшие из алфавита буквы), учитывает особенности почерка и за несколько секунд преобразует трудночитаемые записи в печатный текст. Для работы с версткой газетных страниц нейросеть научили распознавать текст на огромных полосах, набранный мелким шрифтом на низкоплотной бумаге.

Последние новости