Визуальное представление данных – это не просто красивые картинки, но и возможность быстро, одним взглядом уловить закономерности, увидеть акценты за бесконечными столбиками цифр. Один из популярных способов визуализации – создание инфографики. Задача непростая, облегчить ее решение призваны специализированные редакторы. Один из лучших на сегодня редакторов инфографики – Tableau Public (public.tableau.com). Что особенно приятно, программа бесплатна, пусть и с некоторыми оговорками. Tableau Public – это не только редактор инфографики, но и сервис для ее онлайновой публикации. Бесплатная версия редактора требует обязательного сохранения готовой инфографики на сервере.
Есть и некоторые другие ограничения, не так заметные частному пользователю. Судите сами: объем файла для анализа ограничен 10 млн строк, для хранения своих проектов на сервере выделяется 10 Гбайт, ограничений на количество публикуемых на сайтах виджетов с инфографикой нет. Обновившись до коммерческой версии, мы получим возможность работать с большими объемами информации, а также более широкие опции выбора источников импорта исходных данных. Далее разговор пойдет о бесплатной версии. Поверьте, ее возможностей вполне достаточно для большинства реальных проектов. Да и на профессиональных ресурсах я нередко встречал замечательную инфографику, для изготовления которой вполне бы хватило опций бесплатной версии сервиса. Благо функциональность собственно редактора в фриварном Tableau Public не порезана. Что же касается только онлайнового сохранения, то и тут нет худа без добра. Немного забегая вперед, скажу, что виджеты Tableau могут быть интерактивными, так что сетевая среда для них – дом родной. С большой вероятностью вы и так будете размещать работы в онлайне. А то, что они еще и будут общедоступны в хорошо известной и посещаемой галерее Tableau, вообще можно и как плюс рассматривать. Вытащить картинку для печати тоже можно. Да, там есть свои ограничения, но не всем же нам надо печататься в бумажном «глянце».
В общем, бесплатный Tableau – штука действительно серьезная. Вот только и освоения она также требует осознанного. Обучающих материалов на английском полно, предусмотрено даже несколько программ сертификации. А вот на русском информации не то чтобы очень много. На исчерпывающее описание претендовать не буду, но стартовать с реальным проектом можно параллельно с чтением этой статьи.
Процесс создания инфографики здесь можно разделить на несколько этапов. Первый и самый трудоемкий – это подготовка рабочих данных, так называемого датасета. Именно на его основе и будут рисоваться впоследствии разные красивости. Импортировать данные в Tableau Public можно из таблицы Excel, базы данных Access, текстового файла. Поддерживается подключение к серверу OData. Работа с таким протоколом вообще и «открытыми данными» в целом – отдельная тема, сейчас будем исходить из того, что данные у нас локальные.
Пожалуй, самый удобный – первый вариант подготовки информации: использование электронных таблиц. Помимо прочего именно в этот формат проще всего перевести данные, которые вы получили в неструктурированном виде. Например, из текстового документа или из простой таблицы на веб-странице. Кстати говоря, в последнем случае сразу же избавляйтесь от лишних элементов оформления.
Для того чтобы данные импортировались в Tableau корректно, файл электронной таблицы должен быть определенным образом структурирован. Первой строкой выносятся названия параметров. Если такой строки нет, лучше ее создать. Не то чтобы без нее ничего не получилось, просто работы потом будет меньше. Желательно, чтобы в таблицах не было разрывов, лишнего оформления. Короче говоря, если вы хотя бы слышали, что такое «нормальная форма» в таблице базы данных, все требования просты и очевидны. Хорошее представление о том, как следует готовить данные, можно получить, воспользовавшись одним из уже созданных тестовых датасетов, доступных на сайте Tableau Public (public.tableau.com/s/resources). Надо сказать, что именно подготовка датасета занимает большую часть времени реального проекта. Чем тщательней и точней подготовлены исходные данные, тем проще и быстрее будет получен хороший результат. Так что не спешим, «застревать» здесь – нормально.
Второй этап – импорт данных в Tableau. Исходной точкой новой работы может быть и уже готовая инфографика, которую вы сохраняли ранее на сервисе Tableau Public. Данные в этом случае заново обрабатывать не надо, все импортируется в готовом виде. Если мы начинали с нуля, указываем путь к созданному на первом этапе файлу. Для электронных таблиц можно включить инструмент Tableau Data Interpreter. Он попытается самостоятельно отформатировать по правилам входной файл, недостаточно тщательно обработанный на первом этапе. Так что если у вас есть готовая таблица, можно попробовать импортировать данные с помощью автоматики, и только если что-то пойдет не так, возвращаться к относительно трудоемкой ручной подготовке данных. Если таблица сложная и содержит много данных, которые вы не планируете визуализировать, воспользуйтесь фильтрами – соответствующая кнопка есть в верхнем правом углу рабочего пространства. Еще один нюанс, на который стоит обратить внимание при импорте, – тип данных в столбцах. Дело в том, что помимо численных и строковых типов здесь предусмотрен формат Geographic Role, который позволяет потом при необходимости привязать данные к картам и выполнить парочку других интересных трюков.
Третий этап относится уже к анализу данных. Это создание рабочих листов (Worksheets). Это основные элементы будущей инфографики: отдельные графики, диаграммы. На основе одного датасета можно изготовить столько рабочих листов, сколько вам требуется для разностороннего анализа и демонстрации данных. Импортированные таблицы автоматически разделяются на «Измерения» (Dimensions), которые, обозначают объекты анализа, условно говоря соответствуют колонкам, и «Значения» (Measures), которые хранят массивы значений параметров. Начинаем строить рабочий лист простым перетаскиванием измерений и значений на панельки Columns и Rows. Для каждого добавленного элемента доступны фильтры и настройки внешнего вида. Оптимизировать можно долго и гибко. В простейшем же случае вообще достаточно обратить внимание на панель Show Me. На ней показаны варианты диаграмм, которые Tableau может для вас построить. Причем в зависимости от того, какие элементы вы выбрали в датасете, там подсвечиваются только доступные для их визуализации виды графиков и диаграмм. Более того, работает интерактивная подсказка, которая сообщит, каких данных не хватает для открытия любого неактивного в данный момент вида. Так что с хорошим датасетом изготовление рабочего листа занимает считаные минуты. Обычно требуется разве что поменять на русский перевод текст автоматически добавленных подписей.
Следующий этап – создание собственно инфографики. Принцип здесь такой: будущая инфографика – это холст, на котором можно разместить один или несколько рабочих листов, а также различные вспомогательные блоки заголовков, картинок, подписей. Перетаскиваем в рабочую область заготовленные рабочие листы, список которых доступен на боковой панели. Программа автоматически добавит к ним легенды, если вид рабочего листа подразумевает их использование. Предлагаются различные варианты выравнивания блоков, добавление произвольных надписей, картинок и ссылок. В результате в рамках одной инфографики можно собрать набор разнотипных диаграмм и симпатично оформить ее внешний вид. Или же опять положиться на предложения программы и ограничиться переводом подписей с английского, получив результат за считаные минуты.
Инфографика практически готова, остается только представить ее публике. Именно здесь ощущается радикальное преимущество Tableau Public по сравнению, например, с редакторами диаграмм современных офисных электронных таблиц. Так, здесь есть особая форма представления инфографики, актуальная именно для размещения ее в виде виджета: «История» (Story). По сути это показ ее в виде интерактивной презентации. Она состоит из последовательных слайдов, на которых можно размещать как готовые композиции, так и отдельные рабочие листы. Доступные элементы, как обычно, выводятся в списке на боковой панели. При необходимости добавляем отдельные блоки примечаний, пустые слайды, на которых можно разместить заголовки разделов. Выбираем размер будущего виджета или размер картинки для печати.
После публикации проекта на сервере Tableau Public можно внести в него косметические улучшения, например изменить заголовок. Самое главное здесь – опции экспорта. Основной режим – это, конечно же, виджет, который можно разместить на внешнем ресурсе. Кроме того, доступны варианты сохранения инфографики на локальном компьютере как в виде файла собственного формата Tableau, так и в виде пэдээфки или картинки. Если вы предполагаете печатать инфографику, то вам нужны именно они.
С недавнего времени пользователям бесплатной версии приложения стала доступна опция скрытия ссылки на скачивание файла во внедряемом на сторонний ресурс виджете.
Дальнейший простор для творчества широк. Пробегитесь по открытой галерее проекта, посмотрите раздел Featured – там множество источников вдохновения, как простых, так и навороченных, с динамическими элементами управления и другими вкусностями. Прелесть Tableau как раз в сочетании опции быстрого старта на основе готовых конструкций и гибких возможностей усложнения и индивидуализации проекта. Да, как и любое типовое решение, этот редактор не подойдет для нестандартной дизайнерской инфографики. Такие решения «от кутюр» все равно рисуют вручную. Но для красивого анализа данных и особенно публикации его результатов в онлайне это очень хорошее решение.