В открытый доступ выложен ИИ, расшифровывающий обрывки древних текстов. Фото

- КиТ :: Будь в СЕТИ!

Технологии ИИ стали использовать для восстановления полного текста надписей на древнегреческом, которые уцелели лишь фрагментарно. Система также позволяет датировать и определять место происхождения текста. Правда, только с относительной точностью.

От фрагментов к целому

DeepMind, подразделение компании Alphabet, занимающееся решениями в области искусственного интеллекта (ИИ), разработало новую систему, которая позволяет не только восстанавливать древние тексты по фрагментам, но также приблизительно датировать их и определять место происхождения.

В частности, речь идет о древнегреческих надписях, нанесенных на неорганические поверхности (камень, металл), что исключает использование радиоуглеродного метода для их датирования. «Для решения этих задач эпиграфы ищут текстовые и контекстные параллели в похожих надписях. Однако для человека чрезвычайно сложно объять всю существующую релевантную информацию, чтобы выявить подлежащие паттерны», - говорит Теа Зоммершильд (Thea Sommerschield), историк и эксперт в области машинного обучения, которая участвовала в разработке новой системы.

Именно тут приходит на помощь машинное обучение. Программа, разработанная в DeepMind при участии Зоммершильд, Ithaca («Итака») базируется на модели машинного обучения, натренированной на 78608 надписях, сделанных на древнегреческом языке. Как и все такие модели, она ищет регулярные структуры (паттерны) в имеющемся у нее массиве данных, кодирует эту информацию в сложные математические модели и на их основании предлагает возможные варианты по восстановлению полного текста по имеющимся фрагментам, а также вероятное время создания надписи и ее источник.



Пример работы Ithaca

Ithaca и ее исходный код опубликованы в общем доступе на сайте ithaca.deepmind.com, поэтому воспользоваться ею могут попытаться все желающие.

Относительная точность

Создатели Ithaca указывают, что ее точность в реставрации фрагментированных текстов составляет около 62%. Она также позволяет определить примерный географический источник надписи с точностью порядка 71% и время создания с разбросом в 30 лет.

Система не может работать полностью автономно. Предлагаемые ею варианты основываются на данных, собранных с помощью традиционных археологических методов. «Ithaca - это вспомогательный инструмент для историков», - отметила Зоммершильд. На то, чтобы быть полноценным ИИ-историком, эта программа претендовать не может».

Зоммершильд также отметила, что одной из ключевых черт Ithaca является ее гибкость: программу можно успешно применять для работы не только с древнегреческими текстами, но и с любыми другими при наличии нужного объема данных для обучения ИИ. Это открывает дополнительные возможности для историков.

«62% точности - это немало, но и не слишком много, - говорит Алексей Водясов, технический директор компании SEQ. - Возможно, в будущем удастся повысить точность расшифровки, но для этого нужна модель с максимально возможным объемом исходных данных. При этом количество сохранившихся надписей на древних языках отнюдь не бесконечно, а значит, существуют и предельные значения точности этих моделей».

ПодпискаБудь в СЕТИ! Новости социальных сетей - всегда актуальное
 
Группы: ВК | OK | Tg