Важно: Данный раздел актуален для Платформы данных в Публичном облаке и On-Premise.
Настоящий документ включает описание системы «RT.ClusterManager» и её возможностей.
Наименование системы: RT.ClusterManager.
RT.ClusterManager – оркестратор, в котором установка, настройка и обновление кластеров производятся по нажатию кнопки в графическом интерфейсе. При этом все настройки сервисов происходят автоматически.
В настоящем документе использованы и определены следующие термины и сокращения:
Термин/Сокращение |
Определение |
---|---|
Кластер |
Набор служб, работающих на группе хостов. В RT.ClusterManager вы можете создать множество кластеров с различной конфигурацией и распределением компонентов по кластерам. Один кластер допускает только ограниченный набор компонентов. Поэтому, если вы создаете кластер из плагина RT.DataLake, то на него уже не будет возможности установить компонентов из плагина RT.Streaming (необходимо создавать отдельный кластер). |
Компонент | В данном случае это программное обеспечение, которое выполняет определенные функции. Примеры компонентов: Zookeeper, Hive, Spark, HDFS и так далее. |
Оркестратор | Сервисное программное обеспечение, установка которого выполняется на отдельный компьютер. Цель использования данной программы – учет и распределение задач исполнения процессов между активными роботами с определёнными параметрами, обеспечение взаимодействия внешних систем с исполнением процесса, а также учет и разграничение прав пользователей системы. |
ОС | Операционная система |
Плагин | (англ. plug-in, от plug in «подключать») — независимо компилируемый программный модуль, динамически подключаемый к основной программе и предназначенный для расширения и/или использования её возможностей. |
Провайдер | В данном случае это абстракция, предоставляющая хосты. Провайдером можно назвать группу, объединяющую собственные хосты для включения в заданный кластер. А также провайдер может включать хосты, предоставляемые в аренду сторонней организацией |
Сервис | В данном случае это часть компонента. Например, компонент HDFS имеет сервисы: Namenode, Datanode и т.д. Это способ декомпозиции компонентов, применяемой в среде Apache. |
Система | Система «RT.ClusterManager». |
Хост | (от англ. Host – «владелец, принимающий гостей») – любое устройство, предоставляющее сервисы формата «клиент-сервер» в режиме сервера по каким-либо интерфейсам и уникально определённое на этих интерфейсах. В более широком смысле под хостом могут понимать любой компьютер, подключённый к локальной или глобальной сети. |
RT.ClusterManager оптимален для упрощения развертывания и управления службами данных локально, а также в частных или общедоступных облаках.
В RT.ClusterManager реализована система плагинов для поддержки различных приложений или наборов услуг, для которых создается кластер. Плагины могут быть загружены в систему из Личного Кабинета (входят в состав поставляемого архива) или напрямую из репозитория (см. описание Nexus).
Существуют 2 разновидности плагинов:
Примеры плагинов провайдера:
В зависимости от установленных плагинов приложений, с помощью RT.ClusterManager можно создавать кластеры для работы с этими приложениями.
RT.ClusterManager в настоящее время может использовать следующие плагины приложений:
Набор инструментов потоковой обработки данных и управления ETL-процессами.
Включается в себя распределенный брокер сообщения Apache Kafka и проект для автоматизации потоков данных Apache NIFI.
Инструмент для эффективного управления процессами изменения, выгрузки и загрузки данных, позволяющий настроить потоковую или пакетную обработку данных из различных источников.
Решает задачи корпоративной шины обмена данными: способен получать и обрабатывать данные из многочисленных внешних систем, хранить их в течение нужного для бизнеса периода времени и возвращать потребителям с удобной для них нагрузкой.
Описание приложения можно найти на сайте Ростелеком.
Фреймворк для обработки и хранения данных с набором утилит и программ из Hadoop-экосистемы. Оптимален для организации хранения большого объема неструктурированных и слабоструктурированных данных с недорогой стоимостью.
Мощный и гибкий инструмент для организации эффективного корпоративного хранилища данных.
Отвечает высоким требованиям надежности, доступности и низкой стоимости хранения данных, предназначен для обработки данных любых объемов, основан на базе Apache Hadoop.
Описание приложения можно найти на сайте Ростелеком.
Массивно-параллельная БД для хранения структурированных данных.
Просто горизонтально масштабируется с помощью добавления дополнительных узлов. Надежность хранения за счет резервирования и зеркалирования.
Обеспечивает высокую степень производительности и отказоустойчивости благодаря гибкости горизонтального масштабирования, использованию в ядре продвинутого оптимизатора запросов и адаптации архитектуры для хранения и обработки больших массивов данных.
Описание приложения можно найти на сайте Ростелеком.
Аналитическая база данных для эффективной обработки больших набор данных. Высокая скорость выполнения аналитических функций, но урезанная версия языка запросов. Оптимальна для аналитики данных.
Аналитическая колоночная СУБД с открытым кодом для обработки широких датасетов.
Позволяет выполнять аналитические запросы в режиме реального времени на структурированных больших данных, используется для построения BI-решений и визуализации данных.
Описание приложения можно найти на сайте Ростелеком.
Управление корпоративным глоссарием, описание жизненного цикла данных организации, построение карты данных и единого реестра отчетов в качестве единой точки доступа к корпоративной отчетности.
Инструмент документирования данных.
Предназначен для повышения прозрачности данных и их доступности для бизнес-пользователей. RT.DataGovernance способствует более тесному сотрудничеству бизнес-подразделений и ИТ-специалистов, обеспечивая согласованность их работы.
Описание приложения можно найти на сайте Ростелеком.
Классический инструмент централизации и контроля целостности (согласованности) нормативно-справочной информации, обеспечения единых процессов гармонизации и ведения справочников.
Обеспечивает полный цикл жизни эталонных мастер-данных, позволяет организовать процессное управление согласованием и утверждением пользователями записей справочников.
Описание приложения можно найти на сайте Ростелеком.
RT.DataVision представляет собой современное корпоративное веб-приложение для бизнес-аналитики. Это быстрая, лёгкая, интуитивно понятная платформа, позволяющая пользователям с любым набором навыков легко исследовать и визуализировать свои данные, от простых круговых графиков до высокодетализированных геопространственных диаграмм deck.gl.
Описание приложения можно найти на сайте Ростелеком.
Для работы с облаками RT.ClusterManager использует специальный плагин VCD. Плагин поддерживает работу с облаками, управляемыми Vmware Vcloud Director с помощью технологии Terraform.
Terraform позволяет создавать облачную инфраструктуру с помощью конфигурационных файлов, в которых указываются требуемые ресурсы и их параметры.
Функциональность инфраструктуры:
RT.ClusterManager устанавливается с использованием пакета Docker в вашей операционной системе.
Для установки Docker вам потребуется поддерживаемые версии следующих операционных систем:
Минимальные требования к оборудованию для установки RT.ClusterManager и кластеров, развертываемых с его помощью представлены в таблице ниже.
Тип сервера |
Количество ядер центрального процессора |
Оперативная память |
Объем памяти на жестком диске |
---|---|---|---|
CM-server |
4 ядра |
8 Гб. |
120 Гб. |
Master-node |
4 ядра |
16 Гб. |
120 Гб. |
Slave-node |
5 ядер |
8 Гб. |
120 Гб. |
Kerberos-server |
1 ядро |
2 Гб. |
40 Гб. |
В базовой конфигурации кластеров используется:
Примечание: Для некоторых типов кластеров разбиение хостов на Master-node и Slave-node не используется. В частности, для серверов создаваемых с помощью плагина RT.Widestore используются хосты со следующей минимальной конфигурацией: ядер центрального процессора-4, ОЗУ-8Gb, HDD-120Gb.
Схема взаимодействия объектной модели и программного обеспечения RT.ClusterManager представлена на Рис. 1.
За создание и управление кластерами и сервисами отвечает Кластерный пакет, входящий в программное обеспечение RT.ClusterManager (на схеме помечены синим цветом).
За выполнение операций по настройке и мониторингу хостов и программного обеспечения компонентов отвечает инфраструктурный пакет программного обеспечения RT.ClusterManager (на схеме помечены зеленым цветом).
Плагины приложений обеспечивают возможность Системы расширять количество приложений или наборов услуг, для которых можно создавать кластеры.
Провайдер, объединяет в группу все хосты, используемые для конкретного кластера.
Кроме этого в состав программного обеспечения RT.ClusterManager входят функции поддержки ролевой модели разграничения доступа, мониторинга событий и хранения их логов для каждого кластера.
Объектами настройки, управления и мониторинга RT.ClusterManager являются:
При создании кластера должен быть выбран плагин, соответствующий необходимому приложению.
Плагин приложения или набора услуг с помощью которого создавался кластер включает набор от одного до нескольких компонентов, обеспечивающих работу данного кластера.
Компонент – это программное обеспечение, которое может содержать от одного до нескольких программных сервисов обеспечивающих работу данного компонента.
В свою очередь сервисы должны быть связаны с виртуальными или аппаратными хостами, на которых должно выполнятся программное обеспечение сервисов. В Системе, при помощи дополнительного системного плагина, реализована поддержка использования облачных хостов от различных провайдеров, которые также можно связывать с сервисами (см. п. 4.2).
Перед использованием хостов, в Системе создаётся провайдер, в который включаются все хосты, которые в дальнейшем будут использоваться для работы кластера. В системе нельзя использовать в одном кластере хосты, принадлежащие различным провайдерам. Но при этом, не существует ограничений для использования одного и того же провайдера в нескольких кластерах, созданных плагинами различных приложений (например, установка кластеров RT.Streaming и RT.DataLake на одни и те же хосты провайдера).
RT.ClusterManager работает как web-приложение функционально состоящее из следующих частей:
Серверная часть RT.ClusterManager состоит из программных пакетов (кластерного и инфраструктурного) которые и обеспечиваю его необходимую функциональность.
В RT.ClusterManager реализована поддержка плагинов приложений, которые содержат структуру, взаимосвязи и систему настроек для заданного типа создаваемых с помощью него кластеров.
RT.ClusterManager также использует системный плагин провайдера, который используется для обеспечения взаимосвязи хостов и сервисов кластеров, создаваемых с помощью кластерных плагинов. Участвует в создании провайдера.
Поддержка версионности плагинов обеспечивает параллельную работу кластеров созданных с помощью плагинов одного типа, но разных версий.