Описание и особенности DataLens
DataLens — сервис Yandex.Cloud для визуализации и анализа данных. Он позволяет создавать чарты — диаграммы и графики, а также строить дашборды — страницы с инфографикой. Всё, что для этого нужно, — взять источник данных, создать датасет и настроить его визуальное представление.
С помощью DataLens можно быстро проанализировать данные, взятые напрямую из источника. Например, бизнес-показатели — количество звонков и заказов — или данные из сервисов аналитики Яндекс Метрика и AppMetriсa. Анализ помогает сформулировать гипотезы для детальной проработки или увидеть, как развивается ситуация.
Источником данных для визуализаций могут быть базы данных (облачные и локальные), плоские файлы (простые текстовые файлы с данными, например csv), Яндекс Метрика, AppMetrica и другие сервисы. DataLens может работать с источником данных напрямую или кешировать их в кластере ClickHouse, чтобы снять нагрузку с источника и обеспечить более быстрый отклик. На дашборде или графике можно комбинировать данные из разных источников.
DataLens позволяет настраивать права доступа к объектам, в том числе на уровне строк с данными. То есть, например, можно открыть дашборд для нескольких пользователей, но каждый из них увидит данные, доступные только для него. Например, сотрудники регионального отделения компании используют дашборд с бизнес-показателями, отражающими работу своего отделения, а центральный офис видит полную картину: и по каждому филиалу, и по компании в целом.
Ещё один немаловажный момент. В отличие от многих BI-инструментов (инструментов для бизнес-аналитики) DataLens полностью бесплатный.
Работа с данными в DataLens происходит так: мы подключаем источник данных, создаём из него датасет, а на основе датасета делаем чарты, из которых составляем дашборд.
В качестве источника данных DataLens использует БД (ClickHouse, MySQL, PostgreSQL, SQL Server, Oracle Database, YDB, Greenplum), которые могут находиться и в облаке, и вне него, а также csv-файлы, сервисы Google Sheets, Яндекс Метрика и AppMetrica. Подойдут и другие источники, если в маркетплейсе для них есть коннекторы. Список поддерживаемых источников постоянно пополняется.
Из источника данных сервис создаёт датасет: набор данных и их описание.
Датасет может работать в двух режимах. В режиме прямого доступа DataLens направляет запросы к источнику данных каждый раз, когда создаёт визуализацию. В режиме материализации DataLens один раз загружает все данные из источника в свою БД и потом на её основе строит чарты. Материализацию используют, если не хотят нагружать исходную БД.
На основе данных из одного или нескольких датасетов создают чарты: диаграммы, графики, картограммы и таблицы. Чарты позволяют быстро оценить данные или проверить гипотезы.
Создание датасетов, чартов и дашбордов
Пошаговая инструкция из практикума.
📂 YandexCloud | Последнее изменение: 15.08.2024 11:51