Загрузка данных с помощью CSV-файлов

Загрузка данных

Загрузка таблицы в CSV формате – один из самых простых способ получения данных.

В загружаемых таблицах названия полей не должны содержать следующие символы:

  • точка;

  • двоеточие;

  • квадратные скобки.

Для загрузки данных с помощью CSV-файла необходимо выполнить следующие шаги:

  1. В рабочей области щелкните по названию набора данных, в который вы будете загружать таблицы, либо создайте новый набор и выберите его:

     

  2. В открывшемся окне нажмите Данные > Выбрать источник данных:

     

  3. В появившемся диалоге кликните Файл CSV и нажмите кнопку Выбрать:

     

  4. Откроется стандартный диалог выбора файла. Выберите необходимый файл и нажмите Открыть:

  5. Система откроет вашу таблицу в отдельном окне. Здесь вы можете просмотреть и настроить ее перед загрузкой:

    • указать необходимый символ-разделитель колонки;

    • проверить типы данных в столбцах и при необходимости изменить их;

    • указать, имеет ли таблица заголовки;

    • отменить загрузку данных некоторых колонок (при необходимости).
      Если не указывать наличие заголовков, система добавит свои заголовки.


      Доступны следующие символы-разделители:
      - запятая;
      - двоеточие;
      - знак равенства;
      - точка с запятой;
      - пробел;
      - табуляция;
      - пользовательский.
      Типы данных используются для классификации значений, чтобы иметь структурированный набор данных. Система определяет типы данных загружаемой таблицы автоматически. Тем не менее, необходимо убедиться, что все типы данных были определены верно. При необходимости вы можете изменить тип данных, нажав на кнопку с обозначением типа данных и выбрав нужный тип:


      В таблице ниже перечислены типы данных, поддерживаемые платформой:

Тип данных

Описание

Тип данных

Описание

ABC String

Строка. Это могут быть строки, числа или даты, представленные в текстовом формате.

123 Int64

64-разрядное целочисленное значение (целое число).

1.2 Float

64-разрядное число с плавающей запятой (десятичное число).

DateTime

Значение даты и времени.

$ Decimal

Десятичное число с фиксированной запятой.

6. После того, как вы проверили и настроили таблицу, нажмите кнопку Загрузить. Данные загрузятся на платформу Visiology и вы увидите таблицу на экране построения модели данных:

Подобным образом добавьте еще несколько таблиц, данные которых вы хотите проанализировать:

В панели Поля таблицы сортируются по алфавиту (или по возрастанию, если названия начинаются с чисел).

Просмотр загруженных таблиц

Загруженные таблицы отображаются в панели Данные в правой стороне экрана:

Вы можете развернуть каждую таблицу, чтобы просмотреть список ее столбцов. Для этого нажмите на стрелку слева от названия таблицы:

Поля таблиц сортируются по алфавиту. Если название полей начинается с цифры, то сортировка происходит по возрастанию.

Для просмотра данных в загруженных таблицах, выберите таблицу, данные которой вы хотите просмотреть, и нажмите кнопку с изображением таблицы в левой стороне экрана:

Вы также можете создавать дополнительные данные на основе существующих данных с помощью формул DAX и затем визуализировать их. Чтобы узнать как это сделать, перейти в раздел Создание мер.

Настройка структуры загруженных таблиц

В любой момент вы можете донастроить загруженную таблицу. Например, вы можете добавить колонку, пропущенную при загрузке файла, изменить номер строки заголовков, и т.д. Это позволит избежать необходимости удалять и загружать таблицу заново.

Для этого необходимо выполнить следующие шаги:

  1. В панели Данные нажмите кнопку с тремя точками напротив названия загруженной таблицы и выберите Настроить структуру в выпадающем меню:

     

  2. В открывшемся окне произведите необходимые изменения и нажмите Загрузить – платформа обновит загруженный файл в соответствии с указанными настройками.

Обновление загруженных таблиц

Если данные в оригинальном CSV-файле изменились, вы можете обновить вашу таблицу, выполнив следующие шаги:

  1. В панели Данные нажмите кнопку с тремя точками напротив названия загруженной таблицы и выберите Настроить структуру в выпадающем меню:

     

  2. В открывшемся окне нажмите Изменить путь к файлу и выберите файл с помощь стандартного диалогового окна:

  3. В нашем примере добавилась колонка country. В окне Настройка структуры настройте обновленный файл, если это необходимо, и нажмите Загрузить:

     

  4. В панели Данные вы увидите обновленную таблицу:

Удаление таблицы из модели

Для удаления таблицы из модели данных, выполните следующие шаги:

  1. Нажмите кнопку с тремя точками напротив таблицы, которую вы хотите удалить.

  2. Во всплывающем меню выберите Удалить.

  3. Нажмите Удалить в диалоге подтверждения:

     

Дальнейшие шаги

После загрузки таблиц, вы можете построить модель данных по схеме “звезда“ или “созвездие“, которая станет основой для визуализации данных и создания дашбордов. Чтобы узнать как сделать это, перейдите в раздел Формирование модели данных для визуализации.

Особенности

Существует ряд особенностей, которые нужно учитывать при загрузке CSV-файлов, а именно:

  • Если в загружаемой таблице отсутствует один из заголовков колонки, система смещает заголовки на одну строку вниз и добавляет собственные заголовки.

  • Названия загружаемых файлов не должны содержать кириллические символы.

  • При отсутствии строки заголовков, столбцам присвоится имя автоматически.

  • Файл не будет загружен на платформу, если:

    • в таблице используются разные символы в качестве разделителя колонок (например, точка и точка с запятой);

    • отсутствует один из символов разделителя колонок;
      В этом случае, необходимо внести в файл необходимые изменения и попробовать загрузить его снова.


Смотрите также

Формирование модели данных для визуализации