Загрузка данных с помощью CSV-файлов

Загрузка данных

Загрузка таблицы в CSV формате – один из самых простых способ получения данных.

В загружаемых таблицах названия полей не должны содержать следующие символы:

  • точка;

  • двоеточие;

  • квадратные скобки.

Для загрузки данных с помощью CSV-файла необходимо выполнить следующие шаги:

  1. В рабочей области щелкните по названию набора данных, в который вы будете загружать таблицы, либо создайте новый набор и выберите его:

     

  2. В открывшемся окне нажмите Данные > Выбрать источник данных:

    select(1).png
  3. В появившемся диалоге кликните Файл CSV и нажмите кнопку Выбрать:

     

  4. Откроется стандартный диалог выбора файла. Выберите необходимый файл и нажмите Открыть:

  5. Система откроет вашу таблицу в отдельном окне. Здесь вы можете просмотреть и настроить ее перед загрузкой:

    • указать необходимый символ-разделитель колонки;

    • проверить типы данных в столбцах и при необходимости изменить их;

    • указать, имеет ли таблица заголовки;

    • отменить загрузку данных некоторых колонок (при необходимости).

    • переименовать таблицу или столбцы таблицы.
      Если не указывать наличие заголовков, система добавит свои заголовки.


      Доступны следующие символы-разделители:
      - запятая;
      - двоеточие;
      - знак равенства;
      - точка с запятой;
      - пробел;
      - табуляция;
      - пользовательский.
      Типы данных используются для классификации значений, чтобы иметь структурированный набор данных. Система определяет типы данных загружаемой таблицы автоматически. Тем не менее, необходимо убедиться, что все типы данных были определены верно. При необходимости вы можете изменить тип данных, нажав на кнопку с обозначением типа данных и выбрав нужный тип:


      В таблице ниже перечислены типы данных, поддерживаемые платформой:

Тип данных

Описание

Тип данных

Описание

ABC String

Строка. Это могут быть строки, числа или даты, представленные в текстовом формате (например, идентификатор объекта).

123 Int64

64-разрядное целочисленное значение (целое число).

1.2 Float

64-разрядное число с плавающей запятой (десятичное число). На платформе используется Float64. Вычисляется на аппаратном уровне и может хранить 15  значащих цифр. Занимает в памяти 8 байт. Представляет собой 64-битные числа с плавающей запятой в диапазоне 1,7E +/- 308. Данный тип чисел обрабатывается быстрее и требует меньше памяти, но менее точен, чем Decimal. Его можно использовать при работе с крупным объемом данных в случаях, когда точностью можно пожертвовать в угоду скорости расчетов.

DateTime

Значение даты и времени.

$ Decimal

Десятичное число с фиксированной запятой. На платформе используется Decimal128. Десятичный разделитель всегда имеет четыре цифры справа и допускает 34 цифр значения в целой части. Данный тип чисел обеспечивает более точный и контролируемый подход к представлению чисел. Он обеспечивает большую точность расчетов, но может быть медленнее, чем Float и требовать больше памяти. Чаще всего используется для расчета финансовых показателей, где важен учет до копейки.

Выбор между Decimal и Float зависит от требуемой точности чисел и производительности.

6. После того, как вы проверили и настроили таблицу, нажмите кнопку Загрузить. Данные загрузятся на платформу Visiology и вы увидите таблицу на экране построения модели данных:

Подобным образом добавьте еще несколько таблиц, данные которых вы хотите проанализировать:

В панели Поля таблицы сортируются по алфавиту (или по возрастанию, если названия начинаются с чисел).

Просмотр загруженных таблиц

Загруженные таблицы отображаются в панели Данные в правой стороне экрана:

Вы можете развернуть каждую таблицу, чтобы просмотреть список ее столбцов. Для этого нажмите на стрелку слева от названия таблицы:

Поля таблиц сортируются по алфавиту. Если название полей начинается с цифры, то сортировка происходит по возрастанию.

Для просмотра данных в загруженных таблицах перейдите в режим просмотра данных, нажав на соответствующую кнопку в левой стороне экрана, и выберите таблицу, данные которой вы хотите просмотреть:

Обратите внимание, что для каждого столбца указан тип используемых данных.

Вы также можете создавать дополнительные данные на основе существующих данных с помощью формул DAX и затем визуализировать их. Чтобы узнать как это сделать, перейти в раздел Создание мер.

Редактирование структуры и обновление загруженных таблиц

В любой момент вы можете полностью обновить или донастроить загруженную таблицу. Например, вы можете просто добавить колонку, пропущенную при загрузке файла, изменить тип данных, и т.д., и при этом вам не нужно будет удалять и загружать таблицу заново. Либо, если данные в исходном CSV-файле изменились и вы хотите обновить ваш файл целиком, вы можете полностью перезагрузить его, обновив тем самым все его данные. При этом вы также сможете произвести настройку структуры таблиц (при необходимости).

Ниже описаны процедуры донастройки и обновления загруженных таблиц.

Редактирование структуры загруженных таблиц

  1. В панели Данные нажмите кнопку с тремя точками напротив названия загруженной таблицы и выберите Настроить структуру в выпадающем меню:

     

  2. В открывшемся окне произведите необходимые изменения и нажмите Загрузить – платформа обновит загруженный файл в соответствии с указанными настройками.

Обновление загруженных таблиц

  1. В панели Данные нажмите кнопку с тремя точками напротив названия загруженной таблицы и выберите Настроить структуру в выпадающем меню:

     

  2. В открывшемся окне нажмите Изменить путь к файлу и выберите файл с помощь стандартного диалогового окна:

  3. В нашем примере добавилась колонка country. В окне Настройка структуры настройте обновленный файл, если это необходимо, и нажмите Загрузить:


    В исходном файле могут быть произведены следующие изменения:

    • добавлены столбцы;

    • изменены заголовки столбцов;

    • удалены столбцы.

    Все эти изменения будут загружены на платформу и вам не придется перенастраивать дашборды, в которых используются данные этой таблицы – они останутся рабочими. Исключением являются случаи, когда когда столбец, данные которого используются на дашборде, отсутствует в таблице.

  4. В панели Данные вы увидите обновленную таблицу:

Удаление таблицы из модели

Для удаления таблицы из модели данных, выполните следующие шаги:

  1. Нажмите кнопку с тремя точками напротив таблицы, которую вы хотите удалить.

  2. Во всплывающем меню выберите Удалить.

  3. Нажмите Удалить в диалоге подтверждения:

     

Дальнейшие шаги

После загрузки таблиц, вы можете построить модель данных по схеме “звезда“ или “созвездие“, которая станет основой для визуализации данных и создания дашбордов. Чтобы узнать как сделать это, перейдите в раздел Формирование модели данных для визуализации.

Особенности

Существует ряд особенностей, которые нужно учитывать при загрузке CSV-файлов, а именно:

  • Если в загружаемой таблице отсутствует один из заголовков колонки, система смещает заголовки на одну строку вниз и добавляет собственные заголовки.

  • Названия загружаемых файлов не должны содержать кириллические символы.

  • При отсутствии строки заголовков, столбцам присвоится имя автоматически.

  • Файл не будет загружен на платформу, если:

    • в таблице используются разные символы в качестве разделителя колонок (например, точка и точка с запятой);

    • отсутствует один из символов разделителя колонок;
      В этом случае, необходимо внести в файл необходимые изменения и попробовать загрузить его снова.


Смотрите также

Формирование модели данных для визуализации