Как создать ИТ-ландшафт для аналитики данных на базе российских технологий?

- КиТ :: Будь в СЕТИ!

Культура принятия решений на основе данных и data-driven подход прочно вошли в бизнес-стратегию корпораций. Помимо насущных продуктовых или операционных задач перед каждой организацией возникают вопросы об их главном активе - данных. Как их монетизировать, защитить или расширить? Сегодня практически весь бизнес РФ озадачен обеспечением непрерывности процессов работы с данными. Всё осложнил уход западных вендоров, а также сопутствующие риски отключения их сервисов. CNews и «Ростелеком» разбирались, как в текущей повестке можно преобразовать подход к работе с данными для развития бизнеса.

«Ростелеком» сегодня - не только крупнейший телеком-оператор, обслуживающий масштабные сети связи и обеспечивающий бесперебойную передачу данных и информации. Это и агрегатор огромных массивов, требующих тщательного обслуживания и обработки для обеспечения высокого уровня сервиса и безопасности клиентов.

Опыт «Ростелекома» в использовании проприетарных продуктов за годы эксплуатации разрозненных хранилищ данных показал ряд ограничений. Во-первых, это выливается в огромные расходы. Во-вторых, порождает зависимость от вендоров. При этих составляющих возникли очевидные вопросы - как оптимизировать затраты, обеспечить независимость технологической платформы и развитие внутренних компетенций?

Для решения этих задач в 2018 г. «Ростелеком» запустил проект по созданию централизованного хранилища данных. При его реализации был выбран осознанный путь разработки собственных решений, построенных на базе продуктов с открытым исходным кодом. В частности, это коснулось доработки доступных сервисов экосистемы Hadoop, Greenplum и др., добавления в эти продукты ценных возможностей, и, в конечном счете, создания вокруг них собственных программных решений. Сегодня хранилище данных провайдера - это масштабный инфраструктурный проект по построению собственной платформы управления данными на базе технологии Open Source.

После перехода на собственные разработки экономия расходов «Ростелекома» при работе с данными по итогам 2019-2021 гг. составила более 1 млрд руб. Основной вклад в такую солидную сумму дал отказ от проприетарного ПО и сторонней поддержки ключевых компонент хранилища данных.

Понимание того, что накопленный опыт и наработки могут быть полезны не только внутри компании, но и ее корпоративным клиентам, привело к появлению платформы по работе с данными, а также облачным сервисам на ее основе. В дополнение к классическим IaaS-услугам это позволит заказчикам быстрее и проще анализировать любые массивы данных.

Сейчас перед многими компаниями остро стоит вопрос перехода на отечественный софт. В условиях жестких санкционных рисков и ограничений важным конкурентным преимуществом ИТ-платформы является ее полная импортонезависимость. Все компоненты платформы управления данными «Ростелекома» произведены в России, включены в реестр Минцифры и представляют собой полноценную альтернативу зарубежным аналогам. Кроме того, стоит отметить, что цена на платформу не привязана к валютному курсу, а стоимость лицензий не облагается НДС согласно российскому налоговому законодательству.

Платформа управления данными «Ростелекома» - это универсальный набор инструментов, предназначенный для хранения, обработки и управления корпоративными данными в организациях любого масштаба. Она также является ключевым элементом корпоративной архитектуры, необходимым для построения классического хранилища данных, подготовки отчетности, создания масштабных озер данных и реализации алгоритмов искусственного интеллекта.

Платформа состоит из отдельных компонентов - продуктов и сервисов, каждый из которых выполняет свою функцию по работе с данными и представляет собой конструктор. Его можно индивидуально собрать под каждую конкретную задачу оптимальным образом, т.е. взять только те инструменты и в том объеме, которые необходимы для ее решения.

Например, для построения линейно масштабируемого хранилища структурированных корпоративных данных понадобятся RT.Warehouse и RT.MDM. Для загрузки данных из множества географически распределенных источников данных будет полезен RT.DataLoader, а для потоковой обработки данных и построения систем обработки событий - RT.Streaming.

Описать потоки данных хранилища, преобразования, построить корпоративный глоссарий и единый каталог отчетности позволит RT.DataGovernance, а для построения озера данных неструктурированной информации пригодится RT.DataLake.

Эти и другие продукты платформы обеспечат решение разнородных задач по работе с данными любого формата и масштаба, а удобный инструмент развертывания и управления кластерами серверов обработки и хранения данных RT.ClusterManager сделает этот процесс максимально удобным, сократит время интеграции продуктов в инфраструктуру и программную среду клиента, обеспечит мониторинг их состояния и единую точку управления доступом.

Помимо продуктов для обработки и хранения данных платформа включает и готовые конечные сервисы. В том случае, если бизнес работает с адресной информацией, точность и корректность которой критически важна, то адресный сервис RT.Address выстроит эталонный обмен данными по характеристикам объектов недвижимости между ИС любой архитектуры. Для организаций, работающих с широкой сетью партнеров будет незаменим сервис RT.DataPort, представляющий в единой точке доступа информацию из различных федеральных источников (Росстат, Росреестр, ФНС, ЕФРСБ, МВД, ФССП и др.). Для визуализации данных могут быть использованы как наши продукты RTAnalytics и RT.DataVision, так и любые сторонние сервисы и приложения.

Специалисты DataOffice «Ростелекома» производят непрерывные анализ и доработку свежих и стабильных версий компонент открытых решений, и их тщательное тестирование. Это необходимо для обеспечения быстрой и стабильной работы в составе платформы. Клиенты же получают возможность напрямую влиять на разработку и развитие ПО.

В ближайших планах команды - запуск управляемых сервисов на базе продуктов платформы в облачной инфраструктуре «Ростелекома». Они будут сочетать гибкие возможности масштабирования, надежную инфраструктуру и защиту данных, а также высокий уровень поддержки. Также специалисты работают и над прикладными отраслевыми решениями, к которым испытывают интерес заказчики. Клиенты все чаще ожидают увидеть специфичные для их сферы деятельности продукты, алгоритмы и успешные кейсы внедрения.

Многие игроки рынка уже осознали важность работы с данными и грамотного подхода к их управлению для развития бизнеса. Однако возникают сложности в процессе реализации, например, отсутствует необходимая основа: нет полноценных хранилищ данных, опыта в сфере информационной инженерии, не сформировано понимание способов решения бизнес-задач на основе данных.

Те, кто уже прошел этот путь с привлечением иностранных консультантов и вендоров, осознают последствия реализовавшихся рисков и задумываются о корректировке дальнейшей ИТ-стратегии с расширением области применения отечественных решений. В этих условиях надежный технологический партнер, обладающий собственным стеком независящих от внешней конъюнктуры и курсовых колебаний решений, позволит запустить (или ускорить) необходимые процессы и создать технологическую основу для решения задач извлечения бизнес-ценности из данных.

ПодпискаБудь в СЕТИ! Новости социальных сетей - всегда актуальное
 
Группы: ВК | OK | Tg