пятница, 5 октября 2012 г.

Ложь в картинках

 "А график для менеджера - как клипарт для дизайнера, постоянно для совещаний надо"


Издревле так повелось, что любой мало-мальски мощный инструмент может быть использован как во благо так и совсем наоборот. Графики в данном случае совсем не исключение. С одной стороны это мощный инструмент работы с данными, а с другой стороны мощный инструмент искажения данных. Но людям нравятся графики, особенно они нравятся менеджерам.

Почему так? Да потому, что картинки многим из нас воспринимать проще чем здоровенные портянки табличных или, что еще хуже, многомерных данных. Еще нам нравятся красивые картинки. Зачастую они нам нравятся куда больше чем картинки правильные. Практически любая современная инфографика тому отличное подтверждение - мусор с точки зрения мыслящего аналитика и красота с точки зрения восторженного гражданина.

К тому же графики это метод манипуляции данными. И, как любой метод манипуляции данными, он может быть крайне опасен в руках умелого шарлатана. Особенно если слушающая его публика не обладает знанием матчасти.

И подобно тому как юный американец начинает освоение статистики с книжки "Как врать при помощи статистики?" любой, кому показывают графики, должен отказываться на них смотреть не прочитав пару книжек Тафти.

Если же вам читать Тафти лень, то попробую дать краткую выжимку.

0. Мешайте читать информацию

Любой график это история. Чтобы запутать слушающего простой историей надо обладать нехилым мастерством. Поэтому самый простой способ загадить людям мозги картинкой - загадить картинку лишней информацией. Даже врать не надо - просто засоряйте эфир.

Если работать с данными не умеете - засоряйте чем угодно. Если умеете - не мне вам объяснять.

У Тафти есть простая формула Data-Ink Ratio - пропорция чернил затраченных на полезную информацию к всем чернилам затраченным на картинку. Чем дальше эта цифра от 100% тем сложнее зрителю будет понять что вы нарисовали.

У Тафти это выглядит примерно так:
Хорошо
Плохо
Запомните - первое это ваш враг, а второе ваш друг. Но можно пойти еще дальше - использовать объемные изображения и массивные элементы диаграммы не несущие в себе  ничего полезного кроме украшательства. Люди фигово на глаз оценивают разницу в объеме и плозади. К тому же это придаст вашему графику вид произведения искуства и создаст ощущение что вы много над ним поработали.

Лучшие практики можно почерпнуть из инфографики. Мы вообще живем в удивительное время, когда для того чтобы увидеть хреновую визуализацию данных всех мастей достаточно набрать в гугле "инфографика".

Вот парочка отличных примеров:

Красоты наведены, читать невозможно и простой ранжированный по местам список был бы куда информативнее и проще для восприятия
Шикарная работа с дробными значениями, веселые картинки вместо колонок и еще табличка сбоку для создания в головах ложной корелляции

На этом, в принципе, можно закончить, так как остальное это просто частные случаи.

1. Уберите к чертям весь контекст

Это уже практически мастерство лжи. Можно делать как Fox News. Например у вас есть вот такой график:

А вы не палитесь и сделайте вот так:
Цифры на месте - вы просто слегка поиграли со шкалой. Зато какой эффект! Сразу виден весь драматизм 4,6%!

Или можно сделать вот так круто:

Тут, правда нужны пояснения. На самом деле ребята просто склеили два этих графика:

Первый график показывает данные за 11 лет, а второй вообще за 35. При этом оба показывают изменение разных параметров. Так же второй график показывает изменение в рейтинге. Т.е. на самом деле его вертикальную шкалу вообще нужно развернуть. Но в этом же самый сок! Резкое падение на втором графике на самом деле ни что иное как резкое улучшение дел. Но из хорошего не делаются газетные сенсации...

При этом менеджеру даже не нужно напрягаться - он работает в условиях недостатка информации и тотальной неопределенности. Поэтому он будет рисовать тренды исходя из недостатка и принимать их как истину. Например вот так:
Не стоит рассказывать о недостатке данных, о размере выборки и прочими способами нагружать слушателя математикой. Просто скажите что эта колеблющаяся фигня это прямая, аппроксимируйте ее как прямую и все - вы решили проблему индукции своей наглостью. Скорее всего никто даже не подумает что вы могли бы точно так же нарисовать там синусоиду или экспоненту - прямая нравится всем, особенно когда она направленна вверх.


2. Больше цветов, хороших и разных

Тут вам может помочь художественное образование - там иногда рассказывают про работу с цветом.

Для начала можно вспомнить, что два одинаковых квадрата могут визуально восприниматься совершенно по разному из-за цвета и фона. Например синий квадрат на белом выглядит крупнее чем точно такой же квадрат желтого цвета на белом же фоне. Выглядит это примерно так:
Правильной работой с цветом можно внести порядочно хаоса в разум смотрящего на график.

Во-вторых всегда можно поработать с контрастом:
С одной стороны тут цветом закодированы прибыль и убытки в зависимости от масштабов. С другой стороны на темно красном и темно зеленом хрен прочитаешь что там написано.

В третьих - куча цветов усложнит чтение не только тем, что читателю придется постоянно обращаться к легенде графика, но и послужит визуальным шумом и поводом для поиска разницы в данных там, где ее нет.
Мыло цветов, да? Надо занять мозг читателя попытками поиска разницы в совершенно однородных данных:
3. Пироги!

Менеджеры любят пироги. Не знаю почему, но чую все от того, что у Pie Chart'а есть одна фундаментальная проблема - человек еще может сравнить две линии по длине, а вот углы секторов круга различает очень плохо.
Это, наверное, самый честный pie chart  в истории. Но даже для него кто-нибудь может мне сказать какой процент пирога съеден?

Можно усложнить задачу и добавить кучу полей. Например простой топ100 в виде колонок это отвратная идея, а в случае пирогов она начинает играть новыми цветами:
Но если топ100 это откровенное палево, то можно сделать меньше данных и усложнить восприятие секторов круга добавлением перспективы. Ребята из Microsoft в свое время сделали классный вклад в такую визуализацию:
Что тут меньше - Word 2000, Word 2002 или Word 2003? Как нужно повернуть пирог, чтобы Word 2002 выглядел поменьше? Большой простор для творчества, бесспорно.

В конце концов - комбинируйте с предыдущими пунктами.
Попробуйте не сломав мозг осмыслить то, что нарисовано тут:

4. Отупляйте!

Человек занятой всегда одержим мечтой идиота - упрощением. Он хочет получить упрощенную картинку и принять решение. Он не хочет думать над данными внутри, вокруг и уж тем более не хочет думать над математикой. Поэтому упрощайте. Убирайте контекст, усложняйте восприятие. Им не нужно уметь сомневаться в прочитанном. Им нужно быстро посмотреть и быстро принять решение. А вам нужно премию.

Не стоит показывать исполнительным директорам шедевры вроде работ Минарда:
В этой картинке слишком много концентрированных данных. Надо много осмыслять и думать. Читать. И не важно что соотношение полученных данных к затраченному времени тут эффективно как никогда. График не дает главного для менеджера - не говорит что ему делать. И при этом съедает кучу времени. Так что в идеале надо слушать дядюшку Година и упрощать этот график до такого:

11 комментариев:

  1. Какая полезная статья! :) Просто великолепно! Спасибо.

    ОтветитьУдалить
  2. http://book.flowingdata.com/
    Visualize This: The Flowing Data Guide to Design, Visualization, and Statistics
    by Nathan Yau

    ОтветитьУдалить
    Ответы
    1. Я думаю все же сначала Тафти и Фью, а потом уже все остальное. А так да, книжек много. Жаль никто не читает :)

      Удалить
    2. Мне показалось там был уклон как показать в лучшую для себя сторону, а не как показать объективно :)

      Удалить
  3. Статистика вообще может быть лицемерной и продажной штукой, дело не только в картинках :) Статья понравилась.

    ОтветитьУдалить
    Ответы
    1. Про статистику вообще отдельная история. Но там много математики - будет скучно

      Удалить
  4. очень полезная статья как не надо делать :) Серёжа молодец :)

    ОтветитьУдалить
  5. Да, отличная статья.
    Заказал книгу с amazon)

    ОтветитьУдалить