Большая подборка книг для дата-аналитиков и BI-специалистов. От подготовки данных до крутой визуализации и сторителлинга

Попросил коллег поделиться книгами, полезными для погружения в мир данных, дашбордов и BI. В ответ получил целую кучу рекомендаций, из которых сформировал эту подборку русскоязычных и англоязычных книг. Получилось 10 + 10.

Большая подборка книг для дата-аналитиков и BI-специалистов. От подготовки данных до крутой визуализации и сторителлинга

Представлюсь: Михаил Греков, менеджер продукта Analytic Workspace – это российский BI.
Изначально подборку хотел выложить только в нашем телеграм-канале Data Driven культура, но набралось много – решил статьёй.

Если какие-то книги заинтересуют – даю ссылки на Литрес и Амазон, чтобы там оценить книгу по отзывам.

Фундаментальные книги

1 — DAMA-DMBOK: Свод знаний по управлению данными
Dama International

Ссылка на Litres

830 стр.

Книга очень дорогая (8 000 р. на Литрес) – там более 800 страниц.

Внутри, собственно, описан весь цикл работы с данными. Новичкам можно прочитать всё (что-то да отложится), а профи могут использовать как справочник – обращаться только к нужным здесь и сейчас местам.

Исключительно положительные отзывы.

Можно полистать содержание на Литресе, чтобы проникнуться глубиной.

2 — Бизнес-аналитика: от данных к знаниям
Н. Паклин, В. Орешков

Это матчасть, по сути. Не новая (2013 года), но там про фундамент: хранилища данных, ETL, OLAP, Data Mining, Knowledge Discovery in Databases.

Формат ближе к учебнику – супер вовлекающе и интересно не будет, но основы даны. Книга легко ищется в электронном формате. Сcылки на Litres нет, так как книги там тоже нет.

В книге есть практическая часть на Deductor Academic – это вам уже вряд ли пригодится.

Про визуализацию

3 — Графики, которые убеждают всех
Александр Богачев

Ссылка на Litres

280 стр. 320 иллюстраций

Внутри всего понемножку: как подготовить данные к работе, как выбрать подходящий для своих данных график или диаграмму, как оформить график, чтобы он максимально доносил ваше сообщение, как распознать, когда статистикой пытаются манипулировать.

4 — Данные: визуализируй, расскажи, используй (Сторителлинг в аналитике)
Коул Нафлик

Ссылка на Litres

290 стр. 152 иллюстрации




В книге упор на создание увлекательной, информативной и убедительной истории: как превратить данные в яркие визуальные рассказы, которые будут поняты аудиторией.

Собственно, пригодится всем, кто занимается визуализацией данных (хоть в Excel, хоть в BI).

5 — Говори на языке диаграмм. Пособие по визуальным коммуникациям
Джин Желязны

Ссылка на Litres

290 стр. 341 иллюстрация

В книге приведены практические рекомендации по выбору типа диаграммы (круговая, линейчатая, точечная и т. д.), правила подготовки и использования каждого из них, а также мастер-класс по исправлению неудачных диаграмм.

По сути это базовое пособие по дата сторителлингу.

Главное правило при подготовке презентаций — чем меньше диаграмм, тем лучше. 1) Подготовка диаграмм занимает довольно много времени. 2) Чем больше диаграмм используется в презентации, тем хуже их запоминают слушатели. Если в презентации или отчете используется одна диаграмма, то она получит 100 % внимания аудитории; если сто — не запомнится ни одна.

Фрагмент из книги

Материал написан просто и понятно. Теорию дополняют иллюстрации, примеры и практические упражнения. В четвертой главе автор даже добавил мастер-класс по улучшению диаграмм, чтобы вы могли отточить свои навыки. Книга также будет полезна всем, кто сталкивается в работе с презентациями и отчетами.

6 — Заставьте данные говорить
Алексей Колоколов

Ссылка на Litres

450 стр. 518 иллюстраций

Книга свежая и она для тех, кто хочет погрузиться в мир BI от простого к сложному.

2/3 книги — это пошаговое создание дашборда в Excel. Взрослого дашборда — через сводные таблицы, с фильтрами, с разумным выбором визуализаций и прочего. Excel в данном случае только инструмент — большАя часть логики подойдёт для работы в любой BI.

1/3 книги — общие основы создания дашбордов: способы визуализации, когда и какие визуализации применять, цветовая градация, объединение данных на дашборде (чтобы всё и сразу) и т.п.

7 — Data Yoga. Путеводитель по грамотной работе с данными
Александра Усачева, Андрей Демидо.

Эта книгу у нас в листе ожидания – выйдет вот-вот в Альпина PRO: https://alpinabook.ru/catalog/book-data-yoga/

Как-то охарактеризовать книгу пока нельзя, так как она не вышла. Но описание интересное для тех, кто в BI:

Небольшой путеводитель по грамотной работе с данными, источник подходов и советов по созданию визуальных форм ваших данных. Мы хотим, чтобы вы научились создавать красоту из сложных хитросплетений абстрактных данных, умели задавать аналитические вопросы, овладели навыками целеориентированной разработки интерактивных дашбордов и визуализации.

Полезная классика и основы статистики

8 — Как лгать при помощи статистики
Дарелл Хафф

Ссылка на Litres

190 стр. 87 иллюстраций

Это классика. Первая редакция выпущена аж в 1954 году – примеры из книги кому-то могут показаться довольно винтажными, но в этом своя прелесть.

Почитать стоит хотя бы для того, чтобы самим случайно не делать «враки» в своих графиках, дашиках и выводах.

Она рассказывает о различных способах злоупотребления статистикой в целях обмана аудитории и манипулирования её мнением. Рассмотрено множество конкретных примеров, в основном из американской жизни (реклама, политика, пропаганда и агитация).

9 — Голая статистика. Самая интересная книга о самой скучной науке
Чарльз Уилан

Ссылка на Litres

470 стр. 52 иллюстрации

В книге рассказано про основы статистики простым и понятным языком с примерами из повседневной жизни.

Не все примеры подходят для российского читателя, типа примеров про бейсбол, но большинство просты и легки.

Прочитав можно сделать свой курс «Статистика для продактов» – хотя, наверное, многие уже так и сделали 🤔

10 — Статистика и котики
Владимир Савельев

Ссылка на Litres

170 стр. 158 иллюстраций

Если хочется изучить основы статистики в нескучном формате, то книга в помощь – все примеры на котиках.

Являются ли песики более разнообразными по размеру, чем котики, или же нет. Для этого мы можем воспользоваться F-критерием равенства дисперсий Фишера, который укажет нам, насколько различаются между собой эти показатели.

Фрагмент из книги

Книги на английском

1- Бесплатная книга по Airflow (инструмент для разработки ETL-процессов)

Data Pipelines with Apache Airflow

2 — Бесплатная книга от Databricks про Apache Spark (фреймворк обработки данных)
Get up to speed with Apache Spark

3 — Edward Tufte: The Visual Display of Quantitative Information

4 — Tamara Munzner: Visualization Analysis and Design

5 — Jonathan Schwabish: Better Data Visualizations: A Guide for Scholars, Researchers, and Wonks

6 — Cole Nussbaumer Knaflic: Storytelling with Data

7 — Steve Wexler and Co: The Big Book of Dashboards

8 — Stephen Few: Now You See It

9 — Stephen Few: Show Me the Numbers

10 — Stephen Few: Information Dashboard Design

Это та самая подборка, в комментариях к которой желательно написать книги, которые я всё-таки упустил, но которые вы рекомендуете😉

Буду рад, если присоединитесь к нашему телеграм-каналу Data Driven культура – мы там с первых рядов про российский BI пишем, но не только про него.

 

Источник

Читайте также