«Яндекс.справочник» ускорил модерацию данных с помощью машинного обучения

- КиТ :: Будь в СЕТИ!

«Яндекс.справочник» ускорил модерацию данных до нескольких минут с помощью машинного обучения.

«Справочник» — база данных об организациях, в ней указаны адреса, часы работы, контактные телефоны и так далее. Ежедневно пользователи присылают тысячи правок, каждую из которых сервис должен проверить — разработчики рассказали, как они ускорили этот процесс с нескольких дней до пары часов, а в некоторых случаях и минут.

Модерация необходима по двум причинам: без нее могут появиться случайные ошибки или намеренные искажения (например, конкуренты вводят неверные данные или вандалы добавляют мат в описания компаний). Для того, чтобы ее ускорить, разработчики используют автоматический классификатор правок — «Автомодератор», обученный на примерах хороших и плохих правок.

При проверке данных «Автомодератор» учитывает разные факторы, в том числе историю правок, и либо сам принимает решение насчет правки, либо отдает на перепроверку человеку. В спорных ситуациях машина может проверить сайт организации или даже позвонить за уточнениями.

Данные «Справочника» используются другими сервисами, в том числе «Поиском», «Такси», «Алисой», «Картами» и определителем номера, поэтому актуальность данных очень важна, рассказали разработчики «Яндекса».

«Автомодератор» работает в режиме реального времени и в некоторых случаях вносит изменения за несколько минут. В тех ситуациях, когда машина еще не справляется с работой, задачами занимаются операторы колл-центров или толокеры (пользователи сервиса «Яндекс.толока») сверяют данные «вживую». Однако эти методы более трудоемкие и долгие.

ПодпискаБудь в СЕТИ! Новости социальных сетей - всегда актуальное
 
Группы: ВК | OK | Tg