В настоящее время некоторые нейросетевые сервисы «Яндекса» уже позволяют принимать вводные данные разных видов, но процесс происходит с преобразованием их из одного вида в другой. Как поясняет сооснователь Just AI Кирилл Петров, мультимодальные модели позволяют учитывать весь контент, причем без задержек.
По словам Владимира Кравцева из Axenix, MVP SpeechGPT может появиться в ближайшие месяцы, «». Эксперт полагает, что SpeechGPT будет прежде всего встраиваться в «».
В свою очередь в Сбербанке сообщили, что обучают GigaChat вести мультимодальные диалоги, а в области мультимодальных моделей содействовали разработке модели OmniFusion от Института искусственного интеллекта AIRI.
:
Подробнееполитикой конфиденциальности
Что такое ICT.Moscow?ICT.Moscow - открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.