RT.DataVision+ — инструмент для подготовки, обработки и публикации данных. Он используется для загрузки файлов, объединения данных из разных источников, выполнения SQL-запросов и создания виртуальных датасетов. Эти датасеты затем применяются в RT.DataVision для построения отчётов и дашбордов.
RT.DataVision+ упрощает работу с данными: предоставляет единое место для их загрузки, проверки структуры, трансформации и сохранения в удобном виде для дальнейшего анализа.

RT.DataVision+ предназначен для упрощения процесса работы с данными:
Работа в RT.DataVision+ строится по последовательной схеме:
RT.DataVision+ обеспечивает этапы загрузка → подготовка → публикация датасета, а визуализация выполняется в RT.DataVision.
Интерфейс RT.DataVision+ состоит из вертикального левого меню для навигации и центральной рабочей области. Левая панель интерфейса содержит:

Наборы данных — основной раздел для работы с объектами данных. В нём отображается корневое пространство с перечнем всех доступных наборов данных. Содержит:

SQL-запросы — раздел для работы с SQL-редактором и сохранёнными скриптами. Используется для создания, выполнения и сохранения SQL-запросов, а также для доступа к источникам данных из редактора. Содержит:

Журнал запросов — раздел для просмотра истории выполненных SQL-запросов. Используется для анализа активности пользователей, отслеживания успешных и неуспешных запусков, а также повторного использования запросов. Содержит:

Для просмотра деталей конкретного запроса нажмите на идентификатор — откроется страница с полной информацией: текст SQL, параметры, статус выполнения, дата и время запуска, используемый движок и технические логи.
RT.DataVision+ использует два основных типа объектов: физические датасеты и виртуальные датасеты.

Это объекты, которые содержат реальные данные. К ним относятся:
загруженные локальные файлы (CSV, XLSX, Parquet);
внешние таблицы из источников (если они подключены напрямую).
Особенности:
содержат данные физически;
могут обновляться пользователем (перезагрузка файла);
отображаются в каталогах как базовые объекты;
от них строятся виртуальные датасеты.

Это логические объекты, которые не хранят данные. Они содержат только:
SQL-запрос;
схему результата;
параметры отображения.
Особенности:
данные не копируются;
при каждом обращении выполняется SQL;
являются основой для визуализаций и дашбордов.
| Характеристика | Физический датасет | Виртуальный датасет |
|---|---|---|
| Данные хранятся | Да | Нет |
| Основа | Файл или таблица | SQL-запрос |
| Можно обновлять | Файл можно перезагрузить | Обновляется автоматически при изменении SQL |
| Назначение | Базовый источник данных | Преобразование и анализ данных |
Физические датасеты располагаются в папках как «базовые объекты».
Виртуальные датасеты обычно хранятся:
в папках проекта,
либо в общих пространствах.
Оба типа можно перемещать между каталогами.
При изменении файла пересчитываются все виртуальные датасеты, построенные сверху.
При изменении SQL виртуального датасета пересчитаются графики и дашборды.
При удалении физического датасета перестанут работать все зависимые виртуальные.
В RT.DataVision+ используются:
Личное пространство, которое доступно только владельцу. Обычно используется для черновиков и экспериментов.
Проектные пространства, которые создаются под конкретный проект/отдел. Используются для совместной работы.
Общие пространства для финальных датасетов, доступных всей команде.
Для создания пространства:
Перейдите в раздел Наборы данных.
Нажмите кнопку
в блоке Пространства.


Новое пространство отобразится в списке пространств.
Рекомендации по структуре хранения:
- Физические датасеты — в папках вроде Источники или Необработанные данные.
- Промежуточные и подготовленные датасеты — в проектных пространствах.
- Финальные (проверенные) датасеты — в общих пространствах, с доступом только на чтение.
- Визуализации и дашборды — рядом с датасетами, на которых они основаны.
Для создания папки в пространстве:
.

Для удаления пространства:
Перейдите в раздел Наборы данных.
Выберите пространство, которое необходимо удалить, и нажмите Удалить в свойствах выбранного пространства.


Пространство удалится из списка пространств.
Источники данных — это внешние системы, из которых RT.DataVision+ получает информацию. К источникам относятся базы данных, файловые хранилища и Lakehouse-платформы.

Хранилища объектов — подключаются для работы с файлами (например, S3, MinIO, локальные загрузки). В них обычно хранятся физические датасеты в формате CSV, XLSX или Parquet.
Базы данных — подключаются напрямую для выполнения SQL-запросов. Примеры: PostgreSQL, MSSQL, ClickHouse, Oracle.
Описание добавления нового источника см. в разделе Подключение к новому источнику данных.
Примечание. RT.DataVision+ не копирует данные из подключённых источников. Все операции (SQL-запросы, фильтры, агрегаты) выполняются непосредственно на стороне источника.
Для удаления пространства:
Перейдите в раздел Наборы данных.
Выберите источник, который необходимо удалить, и нажмите Удалить в свойствах выбранного источника.


Источник удалится из списка источников.
Раздел описывает порядок подготовки исходных файлов и их загрузки в RT.DataVision+ через интерфейс платформы.
Соблюдение требований к структуре и формату данных позволяет избежать ошибок при импорте и упростить последующую работу с датасетами.
Массовая загрузка нескольких файлов не поддерживается. При необходимости загрузки нескольких файлов — выполните загрузку для каждого файла.
Перед загрузкой файлов убедитесь, что данные подготовлены корректно:
Заголовки столбцов:
sales_region, order_id).Структура данных:
YYYY-MM-DD),Разделители и кодировка:
,), точку с запятой (;) или табуляцию (\t).Размер и ограничения
Платформа поддерживает загрузку файлов в следующих форматах:
| Формат | Расширение | Особенности |
|---|---|---|
| CSV | .csv |
Стандартный табличный формат, рекомендуется для большинства случаев. |
| TSV | .tsv |
Аналог CSV с табуляцией в качестве разделителя. |
| JSON | .json |
Поддерживаются как записи с массивами, так и вложенные структуры. |
| Parquet | .parquet |
Оптимизированный бинарный формат, рекомендуется для больших объёмов данных. |
| Excel | .xls, .xlsx |
Импорт данных из первого листа таблицы. |
Для загрузки локального файла:
и выберите Загрузить файл в панели навигации слева.

Укажите Имя файла — понятное название без пробелов.
Нажмите Далее.
Укажите формат данных:

Внимание:
- RT.DataVision+ создаёт копию файла. Изменения в оригинале не повлияют на данные в RT.DataVision+.
- Загружаемый файл должен иметь простую плоскую структуру (таблицу без вложенных объектов или массивов). Файлы со сложной структурой (например, вложенные JSON'ы) не подойдут.
После загрузки файлов в RT.DataVision+ их необходимо обработать. Например, проверить, привести к нужной структуре, объединить, если требуется. Обработка возможна через SQL-запросы или low-code-интерфейс (UI) (см. раздел 5.3 Обработка данных в RT.DataVision+).
RT.DataVision+ хранит копию файла, поэтому при изменении оригинала необходимо:
Перезагрузить файл в RT.DataVision+.
Заменить/удалить старый файл.
Примечание. Чтобы обновление прошло корректно, загрузите файл с тем же именем и в тот же каталог, что и исходный. В противном случае дашборды и визуализации, использующие этот файл, перестанут работать.
Обновить представление или создать новое.
В RT.DV при необходимости — обновить датасет (особенно если структура изменилась).
Если нужные данные находятся в базе данных, хранилище или Lakehouse, то их можно подключить напрямую. Для этого:



При работе через подключение RT.DataVision+ не создаёт копию данных — запрос выполняется напрямую к источнику.
Для обработки загруженных файлов:
Перейдите в раздел SQL-запросы.
Найдите загруженный файл в каталоге (слева) и:
Перетащите его в поле редактора.
Или напишите SQL-запрос вида:
SELECT * FROM "путь_к_файлу"

Примечание. При загрузке CSV-файлов столбцы могут получить технические названия: A, B, C и т.д., рекомендуется переименовать.
Варианты обработки данных:
Объединить несколько файлов (JOIN по ключу):Выполняется через SQL:
SELECT *
FROM "путь_к_файлу_1" AS s
LEFT JOIN "путь_к_файлу_2" AS t
ON s.A = t.A
Или через кнопку Соединение в интерфейсе — выберите таблицы и поля для соединения.

Проверить и изменить типы данных. Типы (строка, число, дата) могут быть определены автоматически. Изменить можно через SQL-запрос:
CAST(field AS INTEGER)
Или через UI. Для этого нажмите на три точки у названия столбца и выберите Преобразовать тип данных.

Переименовать столбцы:
SELECT A AS region, B AS month FROM ...
Или через UI. Для этого нажмите на три точки у названия столбца и выберите Переименовать.

Очистить значения. Можно фильтровать пустые или ошибочные строки, обрезать пробелы. SQL-запрос:
SELECT * FROM ... WHERE sales IS NOT NULL
Создать вычисляемые поля . SQL-запрос:
sales * 1.1, CONCAT(region, '-', month)
Или через UI. Для этого нажмите кнопку Добавить столбец и укажите выражение для вычисляемого поля.

В примере ниже был использован JOIN для объединения двух загруженных файлов .csv sales и targets:

В конечном результате получается обработанный датасет, доступный в SQL-запросах и готовый к сохранению как представление:

Для сохранения обработанного датасета:


Для визуализации данных:
Подробные инструкции приведены в разделах:
После создания или загрузки датасета с ним можно выполнять различные операции. Для этого нажмите кнопку
справа от названия датасета и выберите нужное действие из меню.

| Действие | Описание |
|---|---|
| Запрос | Создаёт новый SQL-запрос на основе выбранного датасета. |
| Редактировать | Открывает SQL-редактор для изменения датасета. |
| Открыть панель сведений | Отображает информацию о структуре датасета, типах столбцов и прочее. |
| Экспортировать | Позволяет выгрузить данные в файл. |
| Анализ с помощью | Выгрузка датасета для работы во внешних инструментах анализа. |
| Переименовать | Изменяет имя датасета. |
| Переместить | Позволяет перенести датасет в другую папку или пространство. |
| Скопировать путь | Копирует системный путь до датасета для использования в SQL-запросах. |
| Настройки | Позволяет управлять параметрами доступа, типами данных и другими свойствами. |
| Удалить | Удаляет датасет. |
SQL-редактор используется для выполнения SQL-запросов, создания виртуальных датасетов и работы со скриптами. Редактор содержит две вкладки:
Вкладка Данные предназначена для выполнения SQL-запросов, которые возвращают табличный результат. На её основе создаются виртуальные датасеты.
Основные возможности:
Вкладка Данные используется при подготовке данных, объединении источников, фильтрации, расчётах и создании датасетов для визуализаций.
Вкладка Скрипты предназначена для хранения отдельных SQL-файлов, не связанных с конкретными датасетами. Скрипты служат для сохранения рабочих SQL-запросов и вспомогательного кода.
Назначение скриптов:
Скрипты доступны только в данном разделе и не отображаются в каталоге наборов данных.
Для создания скрипта:


Скрипт отобразиться на вкладке Скрипты и будет доступен для повторного запуска и редактирования. Скрипт хранит только SQL-код, он не создаёт объект данных в каталоге и не хранит схему/результат.
Отражения (рефлекции) — это механизм ускорения запросов в RT.DataVision+, основанный на создании материализованных копий данных. Отражения позволяют значительно повысить производительность при работе с крупными датасетами, особенно при частых повторяющихся запросах.
Система автоматически выбирает отражение при выполнении SQL-запроса и использует его, если структура отражения подходит под запрос. Результат выполнения запроса при этом не изменяется.
В RT.DataVision+ доступны два типа отражений:
Оба типа создаются на уровне конкретного датасета.
В интерфейсе отражения представлены в виде отдельной панели, содержащей две секции:

Необработанное отражение — это материализованная копия исходного датасета без дополнительных преобразований. Такой тип отражений используется для ускорения запросов, оперирующих деталями:
JOIN);Это универсальный тип отражения, подходящий для большинства задач, не связанных с агрегированием.
Необработанное отражение целесообразно использовать, если:
Для создания необработанного отражения:
на строке датасета.

.После сохранения система создаст материализованную копию данных. В интерфейсе отображаются размер отражения, его актуальность и история обновлений.
Агрегирующее отражение создаёт предварительно агрегированный набор данных. Такой тип отражения ускоряет запросы:
GROUP BY);SUM, AVG, COUNT, MIN, MAX);Агрегирующее отражение целесообразно использовать, если:
Перейдите в раздел Наборы данных и нажмите
на строке датасета.

Перейдите на вкладку Отражения.

В секции Агрегация отражений включите переключатель
.
В списке столбцов:
Нажмите Сохранить.
Датасет содержит информацию об автомобилях: марка, модель, город продажи, цена, пробег и другие поля. Для ускорения аналитических запросов, выполняющих группировки и расчёт агрегатов, можно создать агрегирующее отражение.
Измерения (группируемые поля):
brand — марка автомобиля;model — модель;city — город продажи.Эти поля используются для формирования групп, по которым строится аналитика.
Показатели (агрегируемые метрики):
price — стоимость автомобиля;mileage — пробег.Эти поля участвуют в вычислении усреднённых или суммарных значений.

После сохранения отражения система создаст предагрегированную таблицу, которая будет использоваться оптимизатором при запросах, где структура группировок и агрегатов совпадает с отражением.
Ускоряемый пример запроса:
SELECT
brand,
model,
city,
AVG(price) AS avg_price,
AVG(mileage) AS avg_mileage
FROM cars
GROUP BY brand, model, city;
Чтобы удалить отражение:
на строке датасета.
. Для удаления всех отражений воспользуйтесь кнопкой Удалить все отражения.
После удаления отражение перестаёт использоваться системой, а материализованные данные удаляются.
Рекомендуется:
Не рекомендуется:
RT.DataVision+ позволяет выгружать результаты запросов и датасетов в различные форматы. Способы экспорта:

Скачать результат.
Поддерживаемые форматы:
| Формат | Описание |
|---|---|
| CSV | Табличные данные, подходит для Excel и BI-систем. |
| JSON | Структурированные данные с вложенными объектами. |
| Parquet | Колонковый формат, оптимизированный для аналитики. |
Ниже перечислены типовые ошибки при работе с датасетами и способ их устранения.
| Ошибка | Возможная причина | Решение |
|---|---|---|
| Некорректное отображение русских символов | Неверная кодировка файла (например, ANSI вместо UTF-8) | При загрузке файла выберите кодировку UTF-8 или перекодируйте файл перед загрузкой. |
| Колонки отображаются как A, B, C | В первой строке файла отсутствуют заголовки | Добавьте строку с названиями колонок и перезагрузите файл. |
| Ошибка при выполнении SQL-запроса | Неверное имя таблицы или поля | Проверьте имена объектов, используйте подсказки SQL Editor. |
| Не отображаются данные в визуализации | Пустой результат запроса или фильтр исключает все строки | Проверьте фильтры и источник данных. |
| Дублирование строк при объединении | Используется JOIN без условий или с неправильным ключом |
Убедитесь, что объединение выполняется по уникальному полю. |
| Долгое выполнение запроса | Слишком большой объём данных или лишние операции | Сократите выборку: уберите лишние колонки, примените фильтры, создайте промежуточный датасет. |
| Не удаётся удалить датасет или пространство | На него ссылаются другие объекты | Удалите или обновите связанные виртуальные датасеты перед удалением. |
Рекомендации по организации работы в RT.DataVision+.
sales_2024_raw, sales_clean, sales_summary.calc_ или agg_.WHERE) и агрегации.