Как подготовить стратегию по управлению данными

- КиТ :: Будь в СЕТИ!

Источник: ICL, 2021

Данные как пассив, как правило, не структурированы, неизвестного качества, получены в результате непрозрачных или сложных трансформаций, не связаны и не согласованы между собой, а за их хранение, использование и преображение отвечает узкий круг специалистов. При этом остальным сотрудникам компании данные недоступны или непонятны.

Данные как актив, напротив, структурированы, хорошо описаны, измерены, понятны, а главное — удобны для использования каждому участнику цифрового процесса. Они получены в результате прозрачных, открытых трансформаций, благодаря чему можно проследить весь путь от источника данных до получателя. Примером может служить использование системы класса Data Govermance, позволяющей бизнесу понять, какими активами данных он владеет, как эти данные связаны друг с другом, кто и как ими пользуется. Помимо этого, данные генерируют доход по прозрачной финансовой модели.

Одна из главных целей преобразования данных в актив — сделать так, чтобы данные были демократизированы, то есть доступны всем сотрудникам компании в соответствии с политиками безопасности.

Современные требования к работе с данными

Обеспечение комплексной безопасности данных. Имеется в виду не только информационная безопасность в виде защиты от кибератак и действий инсайдеров, а еще и обязательное соблюдение требований регулирующих органов, исполнение соответствующих законодательных актов и отраслевых стандартов. Облачно- или мультиоблачно-ориентированные решения. Это — возможность для данных быть более доступными, так как облачные решения позволяют распределять данные и ресурсы, управлять и работать с ними сразу из нескольких географических точек. Такой подход также повышает безопасность данных и гибкость всех систем компании. Ориентированность на open-source и/или продукты импортозамещения. Данное требование актуально, так как все больше компаний стали рассматривать в качестве альтернативы российские ИТ-решения, которые начинают пользоваться все большим доверием не только на нашем рынке, но и на мировой арене. Обеспечение процессов DataOps, AIOps, их встраивание в существующие DevSecOps процессы. Главная задача DevOps — предоставить бизнесу работающее ПО. Задача DataOps — предоставить бизнесу актуальные работающие данные. Задача цифровой трансформации — встроить DataOps в существующие DevOps-процессы или реализовать новые. Ключевые этапы трансформации конвейера данных

Типовой конвейер данных почти любого data-процесса состоит из следующих этапов: генерация идеи; ее проверка в песочнице в ограниченном объеме или на всем объеме данных сразу; моделирование, во время которого данные встраиваются в существующие модели; разработка новой модели данных и проверка достижения цели; обкатка на автоматических тестах; развертывание; встраивание в существующий конвейер данных и подготовка мониторинга для дальнейшей работы с данными.

Источник: ICL, 2021

Как эти этапы преобразуются, когда мы говорим о цифровой трансформации?

Если в старой парадигме источниками знаний у нас были документация, «головы» и компетенции сотрудников, то сейчас без таких продуктов, как Data Glossary (в том числе бизнес-глоссарий), который описывает и структурирует те данные, с которыми мы работаем, уже не обойтись.

Если раньше в моде были разрозненные инструменты моделирования бизнес-процессов, ПО и данных, то сейчас более перспективной представляется преобразование всех данных в централизованные и связанные модели. Также сформировался устойчивый тренд на активное использование внешних источников данных и их встраивание в существующие в организации модели, которые в дальнейшем используются в кейсах по монетизации данных.

Следующий тренд — переход от императивной разработки хранилищ данных к декларативной. В первом сценарии необходимо было задать последовательность действий для достижения результата, а хранилища вели себя так, как предписывали их создатели. Второй сценарий подразумевает использование принципиально другого подхода, благодаря которому любой конвейер данных можно описать в виде моделей, их связей, правил преобразования, а далее уже сам встроенный инструментарий будет генерировать код, осуществляющий конечные трансформации данных. Проще говоря, становится доступной возможность описать, что представляет собой проблема и каким должен быть ожидаемый результат, но без описания способа достижения этого результата. Ранее такой класс систем назывался DWA (Data Warehouse Automation), сейчас же, с развитием облачных технологий, появились инструменты, реализующие данную концепцию в виде Model-Driven среды с возможностью смены бэкенда хранилища данных при необходимости.

Помимо этого, предполагается переход от ручных мониторинга, тестирования, выгрузки и моделирования в MS Excel к использованию всех современных наработок Software Engineering — версионированию, ревью кода и так далее. Все, что является частью конвейера данных, выкладывается в единое хранилище — так называемый репозиторий (GIT). Также на данном этапе происходит реализация Near-production-песочниц, в которых можно быстро сгенерировать идею, сразу проверить ее на большом объеме данных, а если идея сработала, то «продуктивизировать» полученное решение. В идеальном сценарии протестировать идею может любой пользователь компании без вмешательства ИТ-специалистов.

Источник: ICL, 2021

Последний элемент трансформация конвейера данных — использование концепции «Data Pipeline as code». Она подразумевает исключение множества ручных шагов из процесса и обеспечение плавного, автоматизированного потока данных от одной фазы конвейера к другой, сопровождающегося достаточно зрелыми процессами и инструментами CI\CD. На этапе разработки также важно заложить возможность автоматического запуска тестов, проверки качества данных и их описания, автоматизированную установку и сборку всей сети данных в целостный конвейер.

Как определить зрелость системы управления данными в компании

Есть два способа определения зрелости компании — быстрый и точный. Они помогут понять, какие изменения необходимо вносить в процессы внутри компании.

Источник: ICL, 2021

Быстрый способ предполагает самооценку на основе общедоступных методик — их достаточно много, все они — зарубежные. Можно использовать, например, американскую методику CMMI (Capability Maturity Model Integration). В методиках уже собраны чек-листы, пройдя по каждому пункту которых, можно понять на какой стадии зрелости находится ваша компания. Такие методики также дают понять, какие процессы в компании эффективны, а какие нет.

Второй способ — точный. Это комплексный аудит с привлечением отраслевых экспертов либо компании-аудитора или компании-консультанта.

Как встроить стратегию управления данными в планы по цифровизации. Чек-лист мероприятий:

Провести оценку текущей зрелости вашей компании; сформировать стратегии бизнес-подразделений и ИТ-стратегию, стратегию цифровой трансформации; провести GAP-анализ, определить приоритетные для организации направления, исходя при этом из того, какие пробелы в конвейере данных были выявлены; сформировать поэтапные планы улучшения выявленных недостатков, получить ресурсную оценку по реализации планов; зафиксировать и защитить стратегию по управлению данными, или включить ее как блок в стратегию цифровой трансформации.

Конечным результатом этих преобразований станет формирование стратегии, учитывающей планы развития организации, а также плана действий и его ресурсных ограничений. В компании появится понимание, сколько сил и денег будет потрачено, к каким результатам это приведет. При этом реализация стратегии будет поддержана ключевыми стейкхолдерами со стороны руководства и бизнес-подразделений компании.

Соблюдая все эти шаги, можно встать на путь цифровой трансформации, перейдя, наконец, от бесконечного планирования к конечному результату.

📧ПодпискаБудь в СЕТИ! Новости социальных сетей - всегда актуальное
 
Группы: ВК | OK | Tg