В новых источниках в «Поиске по архивам» можно найти биографические факты, которые раньше были доступны только в бумажном виде. Например, памятные книжки содержат списки ключевых персон губерний с их должностями. Из адресных книг можно узнать, где они жили, а из торгово-промышленных справочников - каким делом занимались. Историков, искусствоведов и других специалистов может также заинтересовать реклама прошлых веков, размещенная в таких документах. Кроме того, в справочниках содержится информация о регионах, ранее не представленных в «Поиске по архивам», например: о Санкт-Петербурге, Орловской, Воронежской и Калужской губерниях.
Благодаря сотрудничеству с Национальной электронной библиотекой и Российской государственной библиотекой ранее в «Поиске по архивам» впервые появились периодические издания: полные архивы «Советского спорта» и «Вечерней Москвы». В дальнейшем оцифрованных справочников станет еще больше: нейросети Яндекса продолжат распознавать подобные документы и другие книги.
Технология расшифровки в «Поиске по архивам» основана на оптическом распознавании символов. Нейросеть узнает утратившие актуальность знаки (например, исчезнувшие из алфавита буквы), учитывает особенности почерка и за несколько секунд преобразует трудночитаемые записи в печатный текст. Для работы с вёрсткой газетных страниц нейросеть специально адаптировали: она научилась распознавать текст на огромных полосах, набранный мелким шрифтом на бумаге низкой плотности.