Архитектор данных

Специалист, который анализирует информационную инфраструктуру компаний, прежде чем планировать и внедрять базы данных. Архитекторы данных разрабатывают и ведут корпоративную бизнес-модель, глоссарий и жизненный цикл данных (data lineage). Конкретные обязанности и требования к специалисту зависят от места работы и специфики деятельности компании.

Hard

Знание архитектурных принципов построения информационных систем и типовых паттернов. Лямбда-архитектура, каппа-архитектура, микросервисный подход — это обязательная база для архитектора данных.
Аналитический склад ума. В работе придётся постоянно анализировать процессы внутри компании и, в соответствии с ними, выстраивать корпоративную бизнес-модель данных.

Необходимые навыки

Soft

Разработка архитектуры DWH (КХД), модели данных, ETL-процессов
Теории алгоритмов, баз данных, основы реляционных баз, моделирование данных, язык программирования SQL.
Работы с реляционными и NoSql базами данных
Владение языками программирования. Обязательно знание SQL. Могут быть полезны Python и C#.
Понимание принципов работы с облачными платформами
Коммуникация. Архитекторы много и часто общаются с руководителями компании, пользователями данных и другими внутренними клиентами систем, которые он выстраивает.
Усидчивость и внимательность к деталям. Большую часть времени архитекторы проводят за компьютером, поэтому для них важно умение концентрироваться.

Работа с BI-инструментами и знание PowerBI, Tableau, Qlick
Виртуализация и контейнеризация — Docker, Kubernetes
Английский язык. Потребуется для изучения лучших практик, технических документаций и форумов.
В работе архитектора данных может быть полезно образование в сфере компьютерных наук и анализа данных, прикладной математики и информатики, бизнес-информатики или смежных областях. Но профильное образование, конечно, не является обязательным требованием для входа в профессию.

Где и сколько учиться

Design It! From programmer to software architect, Michael Keeling. 2017.

В этой книге автор объясняет, как системно подходить к архитектуре цифровых решений. Лейтмотив: перед стартом разработки поймите, чего хочет бизнес. Важно достаточно часто задавать вопрос «почему?», чтобы понимать, чего хочет заказчик. В начале автор знакомит с профессией, а после — разбирает, как эффективно развивать решения.

Полезные книги

37 Things One Architect Knows About IT Transformation. A Chief Architect's Journey, Gregor Hohpe. 2016.

Грегор Хоп рассматривает, какими навыками и качествами должен обладать архитектор цифровых решений.
Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems, Martin Kleppmann. 2017.

Настольная книга многих разработчиков и архитекторов, которая описывает основные идеи, алгоритмы и подходы к работе с данными.
Learning Domain-Driven Design: Aligning Software Architecture and Business Strategy, Vlad Khononov. 2021.

Автор просто и понятно описывает идею domain-driven-дизайна. В книге демонстрируются подходы к работе с доменами, монолитами, применение ключевых строительных блоков, событийная система и прочее.
Release It!. Design and Deploy production-ready software, Michael T. Nygard. 2018.

Когда-то автор работал разработчиком и не задумывался о продакшене, решая задачи с помощью кода. После смены специальности на менеджера поддержки Нигард в корне пересмотрел своё с отношение к рабочим процессам. В книге он описывает свой опыт, позволяющий улучшить качество решений на системном уровне.
Software Architecture in Practice, Len Bass, Paul Clements, Rick Kazman. 2012.

Книга Басса, Клементса и Казмана в основном рассматривает архитектуру как упорядоченный процесс. Авторы делают акцент на самой трудной части — переходе от функциональных требований к реализации с разбором конкретных техник.

Полезные сайты и ресурсы

Школа больших данных публикует информационно-аналитические статьи и новости о технологиях работы с Big Data, Machine Learning, Data Science, администрировании распределённых кластеров Hadoop, NoSQL, Kafka, Spark, а также реальные истории и лучшие практики в российских и зарубежных компаниях.
DATAVERSITY Education, LLC — цифровой издательский ресурс для профессионалов в сфере бизнеса и ИТ, посвященный использованию данных и управлению ими. Здесь есть записи вебинаров по таким темам, как управление данными, архитектура данных и расширенная аналитика.

Блоги и подкасты

YouTube-канал 365 Data Science — курсы по науке о данных, предназначенные для развития навыков от новичка до специалиста, готового к работе, независимо от текущего уровня, базового образования и опыта.

Бесплатные курсы

«Алгоритмы: теория и практика. Методы». Программа курса включает основные алгоритмические методы: жадные алгоритмы, «разделяй и властвуй», динамическое программирование. Помимо теоретических основ вас ждёт изучение тонкостей реализации рассмотренных алгоритмов на языках C++, Java и Python.
Intro to SQL: Querying and managing data. Базовый курс, который поможет разобраться, как использовать SQL для хранения, запроса и обработки данных.
«Обновления SQL Server». Курс от Microsoft, который поможет научиться повышать производительность и улучшать функциональность баз данных. Из уроков вы узнаете, как выполнять инвентаризацию развёртываний SQL Server с помощью набора средств оценки и планирования Microsoft.
«Создание и использование аналитических отчетов в Power BI». Этот курс познакомит вас с Power BI, научит использовать и создавать отчёты для бизнес-аналитики.