Из академии в ИТ: зачем ученому работать в технологической компании

- КиТ :: Будь в СЕТИ!

Услышав слово «исследователь», люди обычно представляют себе университет, академические статьи и лекции. Но сегодня серьёзная наука всё чаще рождается в индустрии. В крупных ИТ-компаниях работают целые команды исследователей, которые применяют научные методы для решения практических задач - от A/B-тестирования до развития машинного обучения и искусственного интеллекта. Эдвард Бахитов защитил кандидатскую по экономике в Университете Пенсильвании и вскоре после этого присоединился к исследовательской группе в Meta*. CNews поговорили с ним о том, как устроена наука в индустрии, зачем ИТ-компаниям нужны исследователи и как научные идеи становятся частью больших продуктов.

CNews: Ваш профессиональный путь начался в академии. Почему вы выбрали именно экономику и как постепенно пришли к машинному обучению и анализу данных?

Эдвард Бахитов: Хотя экономика и машинное обучение могут показаться разными дисциплинами, на практике они тесно связаны. Современная прикладная экономика опирается на анализ данных и требует глубокой статистической подготовки, особенно в области эконометрики - науки о выявлении причинно-следственных связей в экономических данных.

По мере того как стали доступны большие объёмы данных, включая неструктурированные форматы вроде текста, изображений и видео, роль машинного обучения в анализе экономических процессов значительно возросла. Меня заинтересовало, можно ли объединить подходы из этих двух миров - использовать гибкость и масштабируемость машинного обучения для решения задач, традиционно решаемых при помощи эконометрики.

Так я пришёл к causal machine learning - направлению, которое использует инструменты машинного обучения для извлечения причинно-следственных связей. Сегодня этот подход активно развивается как в академии, так и в индустрии, особенно в технологических компаниях, где точное понимание эффектов и воздействий критично для принятия решений.

CNews: Что вас заинтересовало в причинно-следственном анализе? Можете простыми словами объяснить, в чем отличие данного подхода от анализа корреляций в данных?

Эдвард Бахитов: Понимание причинно-следственных связей - ключ к принятию обоснованных решений в любой прикладной области. Простая корреляция может указывать на связь между событиями, но не объясняет, что именно вызывает эффект. Если полагаться только на корреляцию, можно легко принять неверное решение. Например, рост продаж может совпасть с увеличением рекламных расходов, но это вовсе не означает, что реклама действительно сработала - возможно, сыграли роль сезонность или другие внешние факторы.

Методы причинно-следственного анализа позволяют выявить именно те факторы, которые действительно влияют на результат. Для меня как для экономиста это всегда было в центре внимания: только поняв, что именно вызывает изменения, можно оценить эффективность конкретной меры - будь то экономическая реформа, рекламная кампания или программа по снижению безработицы. В этом и заключается практическая ценность причинно-следственного анализа: он позволяет принимать решения, основанные на механизмах, а не на случайных совпадениях.

CNews: Можете рассказать об исследовательском проекте, который вы считаете наиболее ценным с точки зрения практического применения?

Эдвард Бахитов: Одним из наиболее значимых проектов с практической точки зрения я считаю работу над статьёй . В ней мы разработали новый алгоритм в области causalmachine learning, который объединяет силу современных бустинговых моделей с классическим методом инструментальных переменных. Данный подход позволяет получать более надёжные оценки причинно-следственных связей в тех случаях, когда нельзя провести прямой эксперимент (А/В тест), а классические методы машинного обучения дают неточные результаты из-за скрытых факторов.

Алгоритм не только устойчив к множеству нарушений классических предпосылок, но и хорошо масштабируется, что делает его применимым к большим и даже неструктурированным данным - например, тексту или изображениям. Благодаря этому он может быть полезен в самых разных областях - от оценки воздействия образовательных программ до оптимизации рекламных механизмов в онлайн-сервисах. Работа была представлена на конференции , а также на ведущих воркшопах по причинно-следственному анализу при , и .

CNews: Вы перешли из академии в большую ИТ-компанию. В чём наиболее ощутимая разница между между научной деятельность в академии и индустрии?

Эдвард Бахитов: Самое заметное изменение - это смена приоритетов. В академии главной целью является публикация: исследование должно быть теоретически выверенным, обладать новизной и быть признанным научным сообществом. Это требует значительного времени и часто означает, что ты вынужден постоянно возвращаться к одному и тому же проекту, вносить правки, отвечать рецензентам. В индустрии, напротив, основной фокус - на скорости и прикладной ценности. Цель - создать решение, которое можно внедрить в продукт и которое начнёт приносить пользу как можно быстрее.

Это не значит, что качество и глубина отходят на второй план, но на первый выходит масштабируемость, вычислительная эффективность и интеграция в существующую систему. Вместо долгого цикла «исследование - публикация» ты получаешь возможность быстро проверять гипотезы, видеть результат своей работы в продукте и сразу переходить к следующей задаче. Такая динамика мне ближе: она поддерживает высокую мотивацию и создаёт ощущение постоянного прогресса.

CNews: Какие навыки, приобретённые в аспирантуре, оказались особенно полезными в индустрии? А чему, наоборот, пришлось учиться с нуля?

Эдвард Бахитов: Один из самых полезных навыков, который я перенёс из аспирантуры в индустрию, - это умение правильно формулировать исследовательские задачи. В прикладной среде задачи чаще всего приходят в виде общего запроса или идеи, и важнейшая часть работы исследователя - суметь интерпретировать их на языке формальных гипотез и математических моделей. Как только задача чётко определена - с понятной метрикой и доступными данными, - становится гораздо проще подобрать подходящий метод и трезво оценить его применимость.

Что касается новых навыков, которые мне пришлось освоить с нуля, то, в первую очередь, это коммуникация. В индустрии вы постоянно взаимодействуете с людьми из разных функциональных команд - продукт-менеджерами, инженерами, аналитиками - и важно уметь доносить сложные технические идеи в доступной и лаконичной форме. Особенно это актуально, когда необходимо обосновать выбор методологии или объяснить ограничения подхода, не перегружая деталями. Этот навык, на мой взгляд, критически важен для успешной карьеры в технологической компании, и он требует постоянной практики.

CNews: Чем занимается исследователь в крупной ИТ-компании вроде Meta*? Как выбираются задачи, над которыми вы работаете?

Эдвард Бахитов: Исследователь в крупной ИТ-компании работает на пересечении науки и продукта. Основная задача - разрабатывать и внедрять новые научные методы, которые позволяют принимать более обоснованные решения и, в конечном счёте, улучшают пользовательский опыт или бизнес-показатели.

Работа начинается с понимания бизнес-проблемы: важно не просто предложить интересную с научной точки зрения идею, а убедиться, что она релевантна для компании и имеет потенциал быть внедрённой. Поэтому исследователь участвует на всех этапах - от формулировки задачи и выбора подхода до построения прототипа и сопровождения интеграции в продукт. Это требует не только технической экспертизы, но и навыков коммуникации с продуктовыми и инженерными командами.

Выбор проектов определяется в первую очередь приоритетами бизнеса. При этом важно находить баланс между задачами, дающими возможность для научной разработки, и практическими проектами, приносящими быструю пользу продукту. Именно такой подход, на мой взгляд, является залогом успешной исследовательской карьеры в индустрии.

CNews: Вы принимали участие в разработке новых методологий для A/B-тестирования. Можете кратко объяснить, что это за инструмент и зачем он нужен ИТ-компаниям?

Эдвард Бахитов: A/B-тест - это метод экспериментальной оценки, при котором пользователей случайным образом делят на две группы: одна получает новое изменение (например, новую функцию или дизайн), а другая - остаётся с текущей версией. Сравнивая поведение этих групп, можно понять, действительно ли нововведение улучшает ключевые метрики, например, увеличивает вовлечённость или продажи. Это один из самых надёжных способов выявления причинно-следственных связей в продукте.

A/B-тесты особенно популярны в ИТ-компаниях, потому что они одновременно просты в объяснении и масштабируемы. В отличие от более сложных методов причинно-следственного анализа, A/B-тест легко донести до продуктовой команды, и для него можно построить мощную внутреннюю инфраструктуру, которая позволяет параллельно запускать сотни или даже тысячи экспериментов. Это делает A/B-тестирование ключевым инструментом принятия решений в больших технологических компаниях.

CNews: Как ваши научные разработки помогли Meta* улучшить что-то на практике?

Эдвард Бахитов: Как уже упоминалось, взаимодействия между пользователями в социальной сети могут серьёзно повлиять на результаты эксперимента. Например, мы хотим проверить, помогает ли мотивационное уведомление людям чаще публиковать посты в Instagram. Один пользователь получил уведомление и стал активнее. Его друзья увидели новые посты в ленте и тоже начали чаще публиковать - хотя уведомления не получали. В такой ситуации трудно определить, работает ли сама функция или мы наблюдаем цепную реакцию. Это пример нарушения ключевой предпосылки A/B тестирования - стабильности эффекта воздействия (stable unit treatment value assumption, SUTVA).

Одной из моих центральных задач была разработка методов, которые учитывают такие эффекты взаимного влияния и позволяют получать более достоверные оценки. Один из ярких примеров - методология анализа экспериментов с биграфной интерференцией (bipartite experiments), где нарушаются классические предпосылки A/B тестов из-за связей между разными типами агентов, например, пользователями и рекламодателями. Также мы создали систему контроля вычислительных затрат при тестировании эффективности моделей ранжирования рекламы, что позволило оптимизировать ресурсы и повысить точность оценки моделей. Обе методологии нашли практическое применение и были внедрены в масштабируемые внутренние инструменты Meta*.

CNews: Как вам кажется, есть ли в индустрии место для фундаментальных исследований, или всё подчинено прикладным задачам и бизнес-метрикам?

Эдвард Бахитов: Да, безусловно, в индустрии есть пространство для фундаментальных исследований - особенно в таких областях, как машинное обучение и искусственный интеллект. Более того, именно технологические компании сегодня зачастую становятся ключевыми драйверами теоретических инноваций. Мы видим, как исследователи из крупных ИТ-компаний регулярно публикуются в ведущих научных конференциях, таких как и других - причём речь идёт не только о прикладных разработках, но и о работах с фундаментальным вкладом в понимание архитектур, свойств и предельных возможностей моделей.

Важно различать два аспекта научного прогресса в индустрии: с одной стороны - это практическая оптимизация и внедрение существующих методов в реальные продукты, где приоритет отдается бизнес-метрикам; с другой - разработка новых теоретических идей и алгоритмов, которые могут задать направление всей области на годы вперёд. И компании, обладающие масштабом, инфраструктурой и данными, как правило, имеют уникальные возможности для работы на обоих уровнях.

Конечно, даже фундаментальные исследования в индустрии часто ориентированы на долгосрочную прикладную ценность. Но это не снижает их научной значимости - напротив, способность соединять теоретическую глубину с практическим контекстом делает такие исследования особенно влиятельными и востребованными.

CNews: Что бы вы порекомендовали молодым специалистам, которые хотят построить карьеру на стыке науки и индустрии?

Эдвард Бахитов: Если вы планируете строить исследовательскую карьеру в ИТ-компании, вы должны понимать, что вы работаете, прежде всего, на бизнес. Это значит, что основной критерий успешности вашей работы - это практическая ценность ваших решений, а не количество научных публикаций. Поэтому, как я уже говорил выше, при выборе проектов ориентируйтесь не только на научный интерес, но и на то, насколько ваше решение реально поможет продукту или бизнесу.

Кроме того, обязательно развивайте навыки программирования. Хорошее знание Python - это почти обязательное требование. Умение работать с библиотеками вроде pandas для анализа данных, seabornили plotly для визуализации, а также понимание основ объектно-ориентированного программирования помогут вам быстро создавать прототипы, проводить анализ и эффективно взаимодействовать с инженерами. Даже если вы не будете сами писать продакшен-код, вы должны уметь представить своё решение в виде понятного и воспроизводимого прототипа.

* Компания Meta признана в РФ экстремистской организацией и запрещена.

📧ПодпискаБудь в СЕТИ! Новости социальных сетей - всегда актуальное
 
Группы: ВК | OK | Tg