Сравнение версий
Ключ
- Эта строка добавлена.
- Эта строка удалена.
- Изменено форматирование.
О модуле преобразования данных
Данные нередко требуют предварительной обработки перед загрузкой на платформу: приведение их к нужному формату, фильтрация, удаление дубликатов и другие операции, что может потребовать значительных временных затрат, если выполнять их вручную без вспомогательных инструментов.
Платформа Visiology предлагает решение этой задачи с помощью модуля подготовки и трансформации данных – Self-Service ETL. Этот модуль значительно упрощает процесс преобразования данных перед их загрузкой в аналитическую платформу Visiology. Интуитивная панель управления с набором необходимых инструментов позволяет без труда выполнять требуемые операции над данными, сокращая временные затраты пользователей на их подготовку.
В данном разделе мы приведем пример преобразования данных загружаемого Excel-файла. Доступ к окну модуля преобразования данных открывается во время настройки загружаемой таблицы. Поэтому для начала давайте загрузим данные:
Находясь в рабочей области, перейдите на вкладку Наборы данных и выберите набор данных, в который вы хотите добавить таблицу. В нашем примере мы выберем Продажи:
В открывшемся окне нажмите Данные > Выбрать источник данных.
Image RemovedВ появившемся диалоге выберите тип источника данных и нажмите Выбрать. В нашем примере мы выберем Книга Excel:
Image RemovedВ окне проводника Windows выберите требуемый файл. Мы выбрали клиенты.xlsx:
В открывшемся окне вы увидите данные загружаемой таблицы. Убедитесь, что правильно определились типы данных и выполните необходимые настройки, которые требуются при загрузке Excel-файла.
Теперь вы можете нажать кнопку Преобразовать данные в нижней части окна, чтобы открыть ее в модуле преобразования данных:
Откроется окно, в котором вы можете трансформировать данные перед загрузкой на платформу:
Доступ к модулю преобразования данных
В модуль преобразования данных можно перейти из нескольких страниц:
страница построения модели данных;
страницы предварительного просмотра загружаемой таблицы;
страница дизайнера дашбордов.
Доступ со страницы построения модели данных и из дизайнера дашбордов
Находясь на странице построения модели данных или на странице дизайнера, нажмите кнопку Преобразование данных в верхней части окна:
Image Added | Image Added |
Откроется окно модуля преобразования данных:
Image AddedДоступ со страницы предпросмотра загружаемых данных
Открыть модуль можно также со страницы предпросмотра загружаемых данных. Для этого нужно сделать следующее:
Нажмите кнопку Данные в дизайнере дашбордов или на странице построения модели данных:
Image AddedВыберите источник данных и загрузите требуемую таблицу:
Image AddedМы загрузили Excel-файл. Для перехода в модуль преобразования данных нажмите кнопку Преобразовать данные:
Image AddedПри загрузке таблицы из базы данных с помощью JDBC, кнопка Преобразовать данные становится доступной после заполнения всех полей запроса:
Image AddedОткроется окно модуля преобразования данных:
Image Added
Интерфейс модуля преобразования данных
Ниже представлен интерфейс модуля с кратким описанием его основных компонентов:
Image AddedПанель инструментов – содержит различные инструменты, которые позволяют выполнять операции над данными, такие как объединение запросов, форматирование значений, фильтрация, и т.д.
Панель запросов – включает перечень запросов, которые используются для формирования итогового запроса. Запросы могут быть переименованы или удалены. Убедитесь, что выделенный элемент является основой создаваемого запроса, т.к. именно он будет добавлен в модель данных в качестве таблицы.
Область предварительного просмотра – рабочее пространство, где вы можете видеть изменения, вносимые в запрос в реальном времени, что помогает контролировать процесс трансформации данных. В этой области вы также можете переименовать столбцы, или изменить тип данных столбцов, нажав кнопку слева от названия столбца: Image Added
Панель применённых шагов – история операций преобразования. Панель отображает последовательность всех действий, которые были применены к данным, позволяя легко отслеживать все этапы обработки информации. Здесь вы также можете удалить или отредактировать шаги.
В таблице ниже представлены кнопки, расположенные на панели инструментов, с их кратким описанием:
Кнопка | Описание |
---|---|
Image Modified | Позволяет загрузить данные из нового или сохраненного источника. Данные могут быть извлечены как из реляционных СУБД, так и из отдельных CSV и Excel-файлов |
. |
Image Added | Позволяет добавить столбец в |
запрос. | |
Image Modified | Позволяет удалить столбец из |
запроса. | |
Image Modified | Позволяет заменить значения в столбце |
запроса. | |
Image Modified | Позволяет объединить несколько запросов с данными таблиц, загруженных из разных источников. |
Image Modified | Позволяет отформатировать записи в столбце |
запроса. | |
Image Modified | Позволяет удалить повторяющиеся значения в столбце |
запроса. | |
Image Modified | Позволяет отфильтровать данные в столбце |
запроса. | |
Image Modified | Позволяет произвести |
преобразования, которые не предусмотрены стандартными инструментами. Для этого используется SQL-запрос. |
Более подробную информацию об этих инструментах вы найдете на странице Инструменты преобразования данных.
Сценарии преобразования данных
Рассмотри два сценария преобразования данных:
Преобразование таблицы, загружаемой из источника данных.
Загрузка и преобразование таблиц непосредственно в модуле Self-Service ETL.
Преобразование таблицы, загружаемой из источника данных
При таком сценарии вы загружаете таблицу из источника данных и затем, в режиме предварительного просмотра данных, переходите в модуль преобразования данных для трансформации таблицы. Здесь вы производите необходимые изменения с помощью доступных инструментов и выгружаете результирующую таблицу в модель данных. При необходимости вы можете подгружать дополнительные таблицы с помощью кнопки Данные:
Image AddedЗагрузка и преобразование таблиц непосредственно в Self-Service ETL
При таком сценарии вы сначала открываете модуль преобразования данных, а затем добавляете в него таблицы с помощью кнопки Данные в левом верхнем углу окна:
Image AddedИнформация |
---|
В модуль преобразования данных могут быть загружены таблицы из различных источников. |
Примечание |
---|
При загрузке данных через модуль Self-Service ETL с использованием JDBC рекомендуется не использовать одинарные кавычки в тексте запроса. |
Затем вы аналогичным образом производите преобразования с помощью доступных инструментов и далее выгружаете получившуюся таблицу в модель данных для дальнейшего анализа и визуализации.
Image AddedИнформация |
---|
Во всех случаях в модель данных выгружается результирующая таблица, основанная на запросе, который выбран на панели Запросы и который является основой созданного запроса. |
Редактирование шагов преобразования
Модуль позволяет корректировать ранее выполненные действия, будь то применение фильтра, замена значений, объединение запросов или другое преобразование. Например, если вы заметили ошибку на одном из этапов обработки данных, то вместо того, чтобы начинать всё заново, вы можете вернуться к нужному шагу и внести необходимые исправления, или вовсе удалить этот шаг.
Для того, чтобы отредактировать шаг преобразования необходимо сделать следующее:
В панели применённых шагов наведите курсор мыши на название шага, который хотите отредактировать и нажмите на кнопку с изображением карандаша:
Image AddedВ открывшемся диалоге внесите необходимые изменения и нажмите Применить:
Image Added
Для удаления шага нажмите на крестик рядом с кнопкой редактирования, и затем подтвердите ваше действие, нажав Удалить в диалоге подтверждения:
Image AddedПримечание |
---|
Будьте внимательны при редактировании или удалении шага, так как эти действия могут повлиять на следующие за ними шаги. |
Однако, стоит учитывать, что не все шаги можно отредактировать:
Список редактируемых шагов | Список нередактируемых шагов |
---|---|
|
|
Информация |
---|
|
Переиспользование загруженных таблиц
Модуль позволяет переиспользовать ранее загруженные таблицы. Для этого необходимо выполнить следующие шаги:
Находясь на странице дизайнера дашбордов или на странице построения модели данных, нажмите кнопку
Image Added
Преобразование данных:В открывшемся окне нажмите Данные > Существующий источник данных:
Image AddedВ появившемся диалоге выберите нужную таблицу и нажмите Выбрать:
Image AddedОткроется окно модуля с данными загруженной таблицы:
Image AddedВыполните требуемые изменения. При необходимости вы также можете загрузить дополнительные таблицы. Когда все преобразования будут завершены, переименуйте запрос, в котором проводились изменения, нажав кнопку с изображением карандаша в панели Запросы. Затем нажмите Добавить запрос, чтобы добавить результирующую таблицу в модель данных:
Image AddedТаблица появится в списке таблиц модели данных:
Image Added
Если файл-источник обновился (в нашем примере Продажи), вы также можете обновить преобразованный файл. Для этого нажмите кнопку с тремя точками напротив названия файла и выберите Обновить таблицу в выпадающем меню. Все изменения будут загружены в преобразованный файл:
Image AddedРедактирование преобразованной таблицы
Для редактирования преобразованной таблицы необходимо выполнить следующие шаги:
Нажмите кнопку с тремя точками напротив названия таблицы, которую вы хотите обновить и выберите Изменить запрос в выпадающем меню:
Image AddedОткроется окно модуля преобразования данных. Внесите необходимые изменения и нажмите кнопку Добавить запрос. Таблица будет обновлена:
Image Added
Для более подробного описания каждого элемента перейдите в соответствующий раздел:
Автоматическое обновление преобразованных таблиц
Вы можете настроить автоматическое обновление для преобразованных таблиц, загруженных напрямую из базы данных через JDBC или созданных на основе других таблиц, подключенных через JDBC. Для этого необходимо выполнить следующие шаги:
Откройте рабочую область, перейдите на вкладку Наборы данных, наведите курсор мыши на набор данных, в котором находится таблица, для которой вы хотите выполнить настройки, и нажмите кнопку с изображением календаря:
Image AddedВ открывшемся окне выберите преобразованную таблицу, которую вы хотите обновлять в автоматическом режиме и настройте расписание в правой стороне окна:
Image AddedНажмите Сохранить расписание. Набор данных, содержащий хотя бы одну таблицу с настроенным автоматическим обновлением, помечается соответствующей иконкой:
Image Added
Ограничения
При работе с модулем преобразования данных необходимо учитывать следующие ограничения:
Если структура подключённого источника данных изменится, необходимо повторно сохранить преобразования в модуле.
В пользовательском SQL при использовании JOIN обязательно необходимо использовать ALIAS таблиц.
Смотрите также
На этой странице
Оглавление | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
|
🕑 Время чтения: 2 5 мин.
Нужна дополнительная помощь?