BRIEFLY.
Яндекс улучшил функцию поиска по архивам с помощью новой модели распознавания документов
1 мин чтения
Briefly Editorial Team

Яндекс улучшил функцию поиска по архивам с помощью новой модели распознавания документов

Коротко (TL;DR)

  • Яндекс представил обновленную функцию поиска по архивам
  • Новая модель распознавания документов Alice AI VLM позволяет структурировать информацию и выделять роли участников события

Почему это важно

Обновленная функция поиска по архивам позволяет пользователям быстрее находить данные о предках и структурировать информацию

Технические детали

Команда Яндекса улучшила функцию поиска по архивам, внедрив новую модель распознавания документов Alice AI VLM. Теперь сервис не только распознаёт текст архивного файла, но и структурирует информацию, выделяя роли участников события и связи между людьми. Это позволяет пользователям сразу видеть имя нужного человека и быстрее находить данные о предках.

Контекст и предыстория

Сервис Яндекса «Поиск по архивам» помогает быстро находить упоминания о людях, населённых пунктах и событиях в рукописных документах XVIII–XX веков. В базе сервиса доступно более 20 млн страниц исторических документов из архивов различных регионов России, а также информация из более чем 200 дореволюционных и советских газет и справочников.

Влияние на индустрию

Обновлённый сервис работает на основе мультимодальной модели Яндекса Alice AI VLM, которая обладает глубоким пониманием русского языка и изображений. Как отметили разработчики, благодаря этому удалось достичь высокой точности поиска — в среднем 90,5%, а для записей о рождении — до 92,7%. Новая модель позволяет настраивать фильтры по событиям и ролям, например, «родившийся», «отец», «мать» для документов о рождении или «жених», «невеста», «свидетель» для свидетельств о браке.