Объединение запросов
Модуль Self-Service ETL позволяет объединять данные таблиц, загруженных из разных источников. Например, вы загрузили таблицу с перечнем товаров и с указанием их стоимости, но данные о количестве проданных товаров находятся в другом файле. Эту ситуацию легко исправить следующим образом:
Находясь в модуле преобразования данных, загрузите вторую таблицу, из которой вы хотите получить данные. Для этого нажмите Данные в левом верхнем углу и выберите источник данных. Доступно два варианта: новый источник и существующий (тот, который загружался ранее в текущий набор данных). Для нашего примера мы выберем новый источник и загрузим Excel-файл:
В окне предпросмотра выберите нужные столбцы для загрузки и нажмите Добавить:
Вторая таблица появится в качестве запроса в боковой панели:
Теперь можно объединить оба запроса. Для этого нажмите кнопку Объединение запросов в верхней части окна:
В открывшемся диалоге сделайте следующее:
выберите столбец в разделе Исходный запрос, который будет ключом соединения. Например, столбец с идентификаторами (ID);
выберите второй запрос и один из его столбцов в разделе Запрос для объединения;
Выбирайте столбцы одного типа (числа, текст и т.д.).выберите тип соединения. Доступно два варианта:
Внешнее соединение слева (все из первой таблицы, совпадающие со второй) – если выбран этот тип, из первой таблицы будут добавлены все строки, которые совпадают со второй таблицей. Если во второй таблице нет совпадений для какой-либо строки из первой таблицы, в итоговой таблице будет пустое значение;
Внутреннее (только совпадающие строки) – если выбран этот тип, в итоговый запрос будут включены только те строки, которые совпадают в обоих запросах. Если данные есть в одном из запросов, но отсутствуют в другом, они не появятся в объединенном запросе.
Выбор между этими типами соединений зависит от того, нужны ли вам все записи из одного запроса независимо от наличия соответствий, или же вас интересуют только те записи, у которых имеются соответствия в обоих запросах.
Для нашего примера мы выберем тип Внутреннее (только совпадающие строки):
Как видно, в запросе появилось два новых столбца:
Теперь можно удалить лишний столбец с идентификаторами и нажать кнопку Добавить запрос, чтобы добавить трансформированную таблицу в модель данных:
Если потребуется выполнить дополнительные преобразования, нажмите напротив названия таблицы и выберите пункт Изменить запрос в выпадающем меню. Откроется окно преобразований данных, где вы сможете внести необходимые изменения:
Если изменятся исходные данные в подключенном источнике, то всё, что было настроено в процессе преобразования, также обновится.
Смотрите также