BRIEFLY.
Яндекс покращив функцію пошуку в архівах за допомогою нової моделі розпізнавання документів
1 хв читання
Briefly Editorial Team

Яндекс покращив функцію пошуку в архівах за допомогою нової моделі розпізнавання документів

Коротко (TL;DR)

  • Яндекс представив оновлену функцію пошуку в архівах
  • Нова модель розпізнавання документів Alice AI VLM дозволяє структурувати інформацію та виділяти ролі учасників подій

Чому це важливо

Оновлена функція пошуку в архівах дозволяє користувачам швидше знаходити дані про предків та структурувати інформацію

Технічні деталі

Команда Яндекса покращила функцію пошуку в архівах, впровадивши нову модель розпізнавання документів Alice AI VLM. Тепер сервіс не тільки розпізнає текст архівного файлу, але й структурує інформацію, виділяючи ролі учасників подій та зв'язки між людьми. Це дозволяє користувачам одразу бачити ім'я потрібної людини та швидше знаходити дані про предків.

Контекст і передісторія

Сервіс Яндекса «Пошук в архівах» допомагає швидко знаходити згадки про людей, населені пункти та події в рукописних документах XVIII–XX століть. У базі сервісу доступно понад 20 млн сторінок історичних документів з архівів різних регіонів Росії, а також інформація з понад 200 дореволюційних та радянських газет і довідників.

Вплив на галузь

Оновлений сервіс працює на основі мультимодальної моделі Яндекса Alice AI VLM, яка володіє глибоким розумінням російської мови та зображень. Як зазначили розробники, завдяки цьому вдалося досягти високої точності пошуку — у середньому 90,5%, а для записів про народження — до 92,7%. Нова модель дозволяє налаштовувати фільтри за подіями та ролями, наприклад, «народився», «батько», «мати» для документів про народження або «жених», «наречена», «свідок» для свідчень про шлюб.