Загрузка данных с помощью Excel-файлов

Загрузка данных

Excel-файлы являются одним из самых популярных источников данных, загружаемых на платформу для бизнес-анализа. Вы можете загружать файлы как со своего компьютера, так и из сетевого хранилища.

В загружаемых таблицах названия столбцов могут содержать только следующие символы:

  • A-Z a-z А-Я а-я Ё ё 0-9

  • . , ? ! : ;

  • $ € ¥ £ ₽ ₩ ₴ ฿ ₡ ₮ ₪ ₹ ₺ ₸

  • % _ # № " @ ^ & * / - + = < > { } ( ) | ~

Для загрузки данных с помощью Excel-файла необходимо выполнить следующие шаги:

  1. В рабочей области щелкните по названию набора данных, в который вы будете загружать таблицы, либо создайте новый набор и выберите его:

    datasets.png

  2. В открывшемся окне нажмите Данные > Выбрать источник данных:

    select-data.png
  3. В открывшемся диалоге выберите Книга Excel, если вы хотите выбрать файл на своем компьютере, либо Книга Excel из сетевого хранилища. Нажмите кнопку Выбрать:

    При выборе Книга Excel из сетевого хранилища дополнительно откроется окно, в котором вам нужно будет найти требуемый файл и нажать Подключить напротив его названия:

    Сетевое хранилище создается администратором платформы (см. Подключение сетевой папки).

  4. Откроется стандартный диалог выбора файла. Выберите необходимый файл и нажмите Открыть:

     

  5. Система откроет вашу таблицу в отдельном окне. Здесь вы можете просмотреть и настроить ее перед загрузкой:

    • указать, имеет ли таблица заголовки;

    • указать номер строки, в которой находятся заголовки;

    • указать номер строки, с которой следует загружать данные;

    • проверить загружаемые данные;

    • отменить загрузку данных некоторых колонок при необходимости;

    • просмотреть тип данных колонок и при необходимости изменить их;

    • переименовать столбцы таблицы или листы:

      Если при загрузке файла переименовать лист и изменить в нем данные, то после загрузки появится новая таблица вместо обновленной исходной.
      Если первые 20 строк столбца пустые, платформа не отображает этот столбец и загрузка таблицы происходит без него.
      Типы данных используются для классификации значений, чтобы иметь структурированный набор данных. Система определяет типы данных загружаемой таблицы автоматически. Тем не менее, необходимо убедиться, что все типы данных были определены верно. При необходимости вы можете изменить тип данных, нажав на кнопку с обозначением типа данных и выбрав нужный тип:

      В таблице ниже перечислены типы данных, поддерживаемые платформой:

Тип данных

Описание

Тип данных

Описание

ABC Текст

Строка. Это могут быть текст, числа или даты, представленные в текстовом формате (например, идентификатор объекта).

123 Целое число

64-разрядное целочисленное значение (целое число).

1,2 Десятичное число с плавающей запятой

64-разрядное число с плавающей запятой (десятичное число). На платформе используется Float64. Вычисляется на аппаратном уровне и может хранить 15  значащих цифр. Занимает в памяти 8 байт. Представляет собой 64-битные числа с плавающей запятой в диапазоне 1,7E +/- 308. Данный тип чисел обрабатывается быстрее и требует меньше памяти, но менее точен, чем десятичное число с фиксированной запятой. Его можно использовать при работе с крупным объемом данных в случаях, когда точностью можно пожертвовать в угоду скорости расчетов.

Дата и время

Значение даты и времени.

$ Десятичное число с фиксированной запятой

На платформе используется Decimal128. Десятичный разделитель всегда имеет четыре цифры справа и допускает 34 цифр значения в целой части. Данный тип чисел обеспечивает более точный и контролируемый подход к представлению чисел. Он обеспечивает большую точность расчетов, но может быть медленнее, чем число с плавающей запятой и требовать больше памяти. Чаще всего используется для расчета финансовых показателей, где важен учет до копейки.

Выбор между десятичными числами с плавающей и фиксированной запятой зависит от требуемой точности чисел и производительности.

6. После того, как вы проверили и настроили таблицу, нажмите кнопку Добавить выбранные. Данные загрузятся на платформу Visiology и вы увидите таблицу на экране построения модели данных:

Подобным образом добавьте еще несколько таблиц, данные которых вы хотите проанализировать:

В панели Данные таблицы сортируются по алфавиту (или по возрастанию, если названия начинаются с чисел).

Просмотр загруженных таблиц

Загруженные таблицы отображаются в панели Данные в правой стороне экрана:

Вы можете развернуть каждую таблицу для быстрого просмотра списка ее столбцов. Для этого нажмите на стрелку слева от названия таблицы:

Столбцы таблиц сортируются по алфавиту. Если название столбцов начинается с цифры, то сортировка происходит по возрастанию.

Для просмотра данных в загруженных таблицах перейдите в режим просмотра данных, нажав на соответствующую кнопку в левой стороне экрана, и выберите таблицу, данные которой вы хотите просмотреть:

Обратите внимание, что для каждого столбца указан тип используемых данных.

Редактирование структуры и обновление загруженных таблиц

В любой момент вы можете полностью обновить или донастроить загруженную таблицу. Например, вы можете просто добавить колонку, пропущенную при загрузке файла, изменить номер строки, с которой будут загружаться данные, изменить тип данных, и т.д., и при этом вам не нужно будет удалять и загружать таблицу заново. Либо, если данные в исходном Excel-файле изменились и вы хотите обновить ваш файл целиком, вы можете полностью перезагрузить его, обновив тем самым все его данные. При этом вы также сможете произвести настройку структуры таблиц (при необходимости).

Ниже описаны процедуры донастройки и обновления загруженных таблиц.

Редактирование структуры загруженных таблиц

  1. В панели Данные нажмите кнопку с тремя точками напротив названия загруженной таблицы и выберите Настроить структуру в выпадающем меню:

  2. В открывшемся окне произведите необходимые изменения и нажмите Загрузить выбранные – платформа обновит загруженный файл в соответствии с указанными настройками:

Обновление загруженных таблиц

  1. В панели Данные нажмите кнопку с тремя точками напротив названия загруженной таблицы и выберите Настроить структуру в выпадающем меню:

     

  2. В открывшемся окне нажмите Изменить путь к файлу и выберите обновленный файл с помощь стандартного диалогового окна:

    Если вы загружали файл из сетевого хранилища, вам потребуется указать файл в окне подключения источника данных:

  3. В нашем примере добавилась колонка country. Настройте структуру обновленного файла, если это необходимо, и нажмите Загрузить выбранные:

    В исходном файле могут быть произведены следующие изменения:

    • добавлены столбцы;

    • изменены заголовки столбцов;

    • удалены столбцы.

    Все эти изменения будут загружены на платформу и вам не придется перенастраивать дашборды, в которых используются данные этой таблицы – они останутся рабочими. Исключением являются случаи, когда когда столбец, данные которого используются на дашборде, отсутствует в таблице.

  4. В панели Данные вы увидите обновленную таблицу:

Удаление таблицы из модели

Для удаления таблицы из модели данных, выполните следующие шаги:

  1. Нажмите кнопку с тремя точками напротив таблицы, которую вы хотите удалить.

  2. Во всплывающем меню выберите Удалить.

  3. Нажмите Удалить в диалоге подтверждения:

     

Дальнейшие шаги

После загрузки таблиц, вы можете построить модель данных по схеме “звезда“ или “созвездие“, которая станет основой для визуализации данных и создания дашбордов. Чтобы узнать как это сделать, перейдите в раздел Формирование модели данных для визуализации.


Смотрите также

Формирование модели данных для визуализации