искусственный интеллект

- КиТ :: Будь в СЕТИ!

Технологии машинного перевода, несмотря на все усилия ученых и разработчиков, по-прежнему далеки от совершенства. Если перевод отдельных слов, как правило, вопросов не вызывает, то с предложениями ситуация все еще очень сложная. Но в MIT сделали важный шаг на пути решения этой проблемы.

Новые подходы для известной проблемы

Группа ученых из MIT, работающая над исследованиями в области обработки естественного языка (Natural language processing, NLP), в начале февраля 2021 г. представила новое решение, которое должно помочь в вопросе адекватного перевода предложений с одного языка на другой без нарушения смысла. В основе программно-аппаратной системы, которая получила название SpAtten лежит специальный компьютер и особый алгоритм обработки языка. Вместо того, чтобы переводить каждое слово в предложении, присваивая им одинаковую важность, SpAtten концентрируется на ключевых словах, что позволяет выявить положительную или отрицательную коннотацию или спрогнозировать, какие слова должны быть следующими.

Ученые ожидают, что методика на базе ИИ позволит добиться более высокого качества перевода при меньших требованиях к вычислительным ресурсам. «Наша система похожа на то, как человеческий мозг обрабатывает язык, — говорит Ханруи Ван, автор статьи и аспирант кафедры электротехники и компьютерных наук. — Люди читают очень быстро и сосредотачиваются только на ключевых словах. Именно эта идея лежит в основе SpAtten».

Архитектура, лежащая в основе SpAtten, обеспечивает высокую степень параллельной обработки данных, что позволяет анализировать множество слов одновременно

Идея применять для переводов NLP не нова, ее начали активно использовать примерно 5-6 лет назад, в том числе для таких платформ как Google BERT и OpenAI GPT-3. Ключевым нововведением механизма, предложенного в MIT, является избирательность — он может делать выводы о том, какие слова или фразы в предложении являются наиболее важными, на основе сравнения со словосочетаниями, с которыми алгоритм ранее сталкивался на этапе обучения. Но, с технической точки зрения, подход требует очень больших вычислительных ресурсов, более того, процессоры общего назначения, которые используются в массовых компьютерах, не обеспечат здесь оптимальную производительность. И проблема будет усугубляться по мере усложнения моделей NLP, особенно для длинных предложений.

Отсекая лишнее

Система SpAtten призвана хотя бы отчасти решить этот вопрос. Исследователи разработали специальный алгоритм на основе таких методов, как «каскадное отсечение» (cascade pruning) и «прогрессивное квантование» (progressive quantization), которые обеспечивают более эффективную обработку данных меньшими усилиями. Архитектура вычислительной системы, лежащей в основе SpAtten, обеспечивает высокую степень параллельной обработки данных, что позволяет анализировать множество слов одновременно. В целом программные и аппаратные компоненты системы подобраны таким образом, чтобы исключить ненужные или неэффективные манипуляции с данными, сосредоточившись только на задачах, необходимых для достижения цели пользователя.

Пока что исследователи разработали только симуляцию аппаратной конструкции SpAtten, которая работает на процессорах общего назначения (специализированный физический чип еще не создан), но согласно полученным результатам, решение дает многократное преимущество в скорости и качестве перевода по сравнению с другими, доступными на рынке.

«Развитие систем перевода на базе ИИ – это наглядный пример того, как меняются роль и возможности человека. Мы используем одну из систем ИИ-переводов у себя в компании уже больше трех лет. Все эти годы система обучается, наши сотрудники поправляют ее, указывают на ошибки. В этом смысле их роль изменилась, задачи стали немного другими. Но также изменились бизнес-процессы, в которых система задействована, — говорит генеральный директор SAS Россия/СНГ Александр Тихонов. – Идея применять возможности искусственного интеллекта для переводов возникла очень давно, но в этой области по-прежнему очень много работы, и в нее вовлечены лингвисты, математики, бизнес-консультанты, специалисты по бизнес-процессам и дата саентисты. Это базовая задача из области коммуникаций и межкультурного взаимодействия, от качества решения которой зависит очень многое, к примеру, дальнейшее развитие голосовых помощников и космических шаттлов, открытия в области истории и этнографии, возможность реализации новых бизнес-моделей и общаться с людьми из любых стран без переводчиков».

Исследователи считают, что SpAtten может быть полезен коммерческим компаниям, которые используют в работе модели NLP. В дальнейшем, планируется перенести успешный опыт в сферу интернета вещей и персональных устройств, поскольку, как отмечает Ханруи Ван: «В будущем многочисленные устройства IoT будут взаимодействовать с людьми посредством голоса и естественных языков».

Другие статьи

Как Kia применяет искусственный интеллект

Технологии искусственного интеллекта глубоко проникли в производственные процессы многих мировых компаний, включая крупнейших автопроизводителей. Возможности ИИ используются в том числе для повышения качества продукции и уровня удовлетворенности клиентов. Как это выглядит в практической плоскости, можно рассмотреть на примере сотрудничества Kia Motors America и компании SAS.

Читать полностью

Испорченные модели: как за один день потерять весь капитал с помощью искусственного интеллекта

В новый год с новым Ops-ом. Вслед за DevOps и DataOps пришел ModelOps. Если вы ещё не слышали об этой методологии, самое время познакомиться с этим термином. Скоро он прочно осядет среди основных ИТ-трендов.

Читать полностью

Как аналитика и ИИ меняют будущее: 8 трендов на 2021 год

Пандемия создала новую реальность, к которой все мы должны были адаптироваться. Бизнесу пришлось переосмыслить рабочие процессы и осознать важность и преимущества цифровой трансформации. Причем, на базе технологий перестраивалось не только взаимодействие с клиентами, но и внутренние бизнес-процессы организаций. В этом смысле 2020 г. принес обществу новые возможности, и многие из них связаны с данными, аналитикой и искусственным интеллектом.

Читать полностью Новости

Новые технологии помогают понять смысл предложений при переводе

Технологии машинного перевода, несмотря на все усилия ученых и разработчиков, по-прежнему далеки от совершенства. Если перевод отдельных слов, как правило, вопросов не вызывает, то с предложениями ситуация все еще очень сложная. Но в MIT сделали важный шаг на пути решения этой проблемы.

29/03

Читать полностью

В США оценили позиции стран-конкурентов в гонке ИИ

США пока лидируют в сфере создания технологий искусственного интеллекта. Китай быстро догоняет Штаты, а Европейский Союз увеличивает отставание от обоих лидеров в сфере ИИ. Таковы выводы нового отчета ITIF.

19/03

Читать полностью

Топ-10 стран с самым сильным потенциалом в области ИИ

Сегодня искусственный интеллект способен распознавать лица, управлять автомобилями, улучшать качество работы в Интернете и укреплять бизнес в различных отраслях, неудивительно, что многие страны сосредотачивают свои усилия на внедрении ИИ для реализации программ устойчивого развития. Но и среди них есть 10 государств, которые на общем фоне выделяются своими амбициозными планами.

02/02

Читать полностью

Четыре ключевых тренда ИИ в 2021 году

Технологии искусственного интеллекта проникают все глубже в повседневную жизнь, осваивая новые сферы применения и это, очевидно, лишь начало большого пути. Какие же перспективные направления будут наиболее актуальны уже в нынешнем году, особенно с учетом влияния пандемии?

01/02

Читать полностью

Как большие данные меняют бизнес

За последние несколько лет большие данные стали важным инструментом развития бизнеса. Сегодня практически любая компания хранит огромные массивы информации, которые благодаря технологиям глубокого анализа превращаются в ценный актив, открывающий новые возможности для продвижения товаров и услуг. Вот лишь несколько примеров того, как большие данные способны сегодня изменить бизнес в лучшую сторону.

ПодпискаБудь в СЕТИ! Новости социальных сетей - всегда актуальное
 
Группы: ВК | OK | Tg