© fot. Ogólnopolski kwartalnik projektowy 2+3D

Wizualizacja danych, czy infografika?

Tekst został opublikowany w Ogólnopolskim kwartalniku projektowym 2+3D nr 57 (IV 2015).


Jakiś czas temu, wczytując się w literaturę na temat wizualizacji danych, zderzyłem się z problemem terminologicznym. Znaczenia przypisywane terminom „wizualizacja danych” i „infografika”, jakie znałem z jednych publikacji, nie potwierdzały się w innych. Czasami wyrażenia były stosowane zamiennie, innym razem funkcjonowały jako przeciwstawne. Szczególnie irytuje, że systematyki jednych autorów wywracają do góry nogami to, co twierdzą inni. Problem nie ogranicza się do materiałów polskojęzycznych. W Polsce tematyka wizualizacji nie jest jeszcze zbyt mocno eksplorowana – więc bałaganu można się spodziewać. Jednak materiały angielskojęzyczne, redagowane przez światowej sławy ekspertów, również nie są spójne w tej kwestii.

Oczywiście, szybko zapytałem wyszukiwarkę internetową o różnicę pomiędzy „wizualizacją danych” a „infografiką”. No cóż, nie ma co ukrywać, że nie byłem pierwszym mierzącym się z tą zagadką, i w wynikach otrzymałem całkiem pokaźną listę odpowiedzi na moje pytanie. Pomysły były przeróżne, niemniej kilka z nich powtarzało się bardzo często – co niestety nie znaczy, że były sensowne i należy je przyjąć do wiadomości, przynajmniej nie bezkrytycznie.

Popularne definicje „wizualizacji danych” i „infografiki”

1. Wizualizacja danych jest tworzona przez komputer, a infografika ręcznie.
To bardzo częsta próba wskazania różnicy. Problem w tym, że efekty końcowe tworzenia ręcznego i generowania komputerowego wizualizacji mogą być identyczne. Generowanie wizualizacji za pomocą komputera bywa o wiele szybsze, jednak manualnie można zrobić to równie precyzyjnie – tym bardziej kiedy używa się aplikacji do projektowania grafiki wektorowej – a zastosowany algorytm będzie tak samo skalowalny jak w przypadku wykonywania go przez komputer. Jedyna różnica to poświęcony czas. Takie postawienie sprawy bardzo trafnie skomentował Piotr Kozłowski: Nie chcę obrażać zwolenników tej tezy, ale to dla mnie absolutny bezsens. Czy samochody składane ręcznie nazywamy inaczej niż te wyjeżdżające z fabryki? 1.

Aby zrozumieć, o co chodzi, wystarczy spojrzeć na diagramy tworzone przez XIX-wiecznych prekursorów wizualizacji danych statystycznych [il. 1, 2, 3]. Nie są to upstrzone ilustracjami kolaże, raczej czysta reprezentacja danych, w której bardziej można dostrzec wynik działania algorytmu programu komputerowego niż odręczne opracowanie – a ich autorzy nie mieli przecież zbyt łatwego dostępu do komputerów…

Omawiana definicja opiera się na prostym kojarzeniu tego, co manualne, z przerostem formy nad treścią, a tego, co minimalistyczne i zorientowane na dane, z wytworem maszyny.
Termin „data visualization” – jak to widać choćby w Google Trends [il. 4] – ma dłuższą historię i względnie stabilną popularność, natomiast „infographic” dopiero niedawno, bo około roku 2010, zaczął być wyszukiwany. Jednak w przeciwieństwie do „wizualizacji danych”, „infografika” bardzo szybko zyskała dużą popularność. Co to oznacza? „Wizualizacja danych” jest terminem od dawna używanym przez wąskie grono specjalistów, natomiast „infografika” zaczęła wchodzić do słownika wraz z popularyzacją atrakcyjnych w odbiorze grafik informacyjnych przeznaczonych dla szerokiego grona odbiorców, które zaczęły się rozlewać po internecie. Trend tworzenia „infografik” na masową skalę, wręcz zagraconych tym, co Edward Tufte nazywa chart junk, jeszcze bardziej wzmacnia skojarzenie, na którym opiera się omawiana definicja. Idąc tropem Tufte’a, można by tę definicję przeformułować, mówiąc, że „wizualizacja danych” ma wysoki współczynnik data-ink 2, a „infografika” – niski. Problem w tym, że przy takim podejściu ten sam wykres, w zależności od jego upstrzenia, raz będzie infografiką, a raz wizualizacją danych – co nie trzyma się kupy.

2. Wizualizacja jest obiektywną reprezentacją danych, a infografika subiektywnym przedstawieniem punktu widzenia autora.
Dobrym puntem wyjścia do zastanowienia się nad tą propozycją będzie cytat z zeszytów naukowych Uniwersytetu Ekonomicznego w Krakowie: „Choć same dane nie mają znaczenia ani celu, to dobór odpowiednich symboli może narzucać lub sugerować ich określoną interpretację” 3.

Każda forma przedstawienia danych, nawet tabela, może mieć charakter perswazyjny – tj. przekonywać odbiorcę do przyjęcia punktu widzenia autora – lub informacyjny, prezentować możliwie kompleksowo i obiektywnie dane zjawisko. Dobrym tego przykładem mogą być diagramy przedstawiające planowaną przez demokratów strukturę służby zdrowia w Stanach Zjednoczonych [il. 5, 6].

Jak widać, za pomocą praktycznie tych samych środków i zbliżonego sposobu przedstawiania można uzyskać skrajnie różne diagramy pod względem odwzorowania struktury. Jeden został celowo przesadnie skomplikowany z pobudek politycznych, drugi natomiast stworzony przez „niezależnego” projektanta, któremu – jak się wydaje – zdecydowanie lepiej poszło przystępne zaprezentowanie zależności. Czy więc jeden diagram powinniśmy nazwać infografiką, a drugi wizualizacją danych? Problem występuje nie tylko w przypadku prezentowania danych w postaci relacji. W zależności od parametrów prostego wykresu – jak np. parametry osi – możemy uzyskać i obiektywny, i subiektywny komunikat. Jak widać, na grafice przedstawiającej konsekwencje wygaśnięcia cięć podatkowych George’a W. Busha w programie telewizji Fox celowo obcięto wykres, tak aby różnica pomiędzy dwiema wartościami wydawała się większa [il. 7]. Na tej samej ilustracji po prawej – poprawny wykres słupkowy prezentujący te same dane. Podobnie jest z doborem kolorów na kartogramie, który może w dużym stopniu wpłynąć na odbiór danych, a co za tym idzie – zmienić charakter grafiki z informacyjnego na perswazyjny. Warto zwrócić uwagę, że w powyższych przykładach to nie dane zostały sfałszowane, a jedynie sposób ich transformacji na postać wizualną został tak dobrany, aby wymowa otrzymanego komunikatu była autorowi na rękę.

3. Infografiki używa się, aby opowiedzieć historię lub odpowiedzieć na pytanie. Wizualizacja danych pozwala odbiorcy odnaleźć własną historię lub odpowiedź.
Nie wszystkie wyszukane próby rozróżnienia okazały się tak rażąco niespójne jak dwa pierwsze przykłady. Powyższy sposób odniesienia się do omawianej kwestii szanuje nasze intuicje i w wielu przypadkach pozwoli rozróżnić infografiki i wizualizacje danych. Niestety, definicja nie jest wyczerpująca, nie wydaje się wystarczająco jasna, żeby posługiwać się nią w dyskusjach, ani dość precyzyjna, żeby analizować za jej pomocą przypadki graniczne, nie jest również pomocna w praktyce projektowej.

4. Infografika i wizualizacja to to samo.
W obliczu przedstawionych powyżej trudności bardzo kuszące i w pewnych przypadkach chyba uzasadnione jest używanie terminów zamiennie. Lecz choć niewątpliwie pojęcia wizualizacji i infografiki wydają się częściowo przenikać, to czy na pewno można postawić między nimi znak równości? Mając na uwadze historię oraz konteksty użycia tych pojęć, warto podjąć próbę ich wyklarowania, aby stały się przydatnymi narzędziami w teorii i praktyce projektowej.

Dane, informacja, wiedza

Aby jednak było to możliwe, trzeba spojrzeć na problem na poziomie elementarnym, a co za tym idzie, w pierwszej kolejności zrozumieć, czym są dane i informacje oraz w jakich relacjach względem siebie się znajdują. Przy czym i w tym przypadku konieczna jest ostrożność. Terminy takie jak dane, informacje, wiedza również bywają problematyczne. Nie tylko w języku potocznym, lecz także używane przez specjalistów teorii informacji czy zarządzania wiedzą – pozostają często niejednoznaczne (co wynika częściowo z ich pierwotnego charakteru).

W ujęciu kognitywistycznym tzw. hierarchia podstawowych pojęć poznawczych ma się następująco: dane są reprezentacją faktów, zazwyczaj wybranymi na potrzeby zapamiętania lub analizowania określonych zjawisk 4. Same dane nie mają celu ani znaczenia 5 – są abstrakcyjne i nie muszą być użyteczne 6. Dane trafiają do świadomości odbiorcy w postaci komunikatu i są przekształcane w informacje poprzez kontekstualizację 7, tj. przez odniesienie do tego, co w rzeczywistości reprezentują, oraz do już istniejącej wiedzy odbiorcy – w ten sposób nadawane jest im znaczenie. Dzięki temu jest możliwa ich interpretacja i zrozumienie. Tak więc informacja to dane zawarte w komunikacie, zinterpretowane przez odbiorcę, mające dla niego znaczenie, a jeśli wnoszą do jego świadomości element nowości – zmniejszają jego niewiedzę, stając się elementem jego wiedzy. Jeśli jednak komunikat zawierający dane nie zostanie zrozumiany, jego treść nie znajdzie zaczepienia w istniejącej już wiedzy, to nie zostanie on zinterpretowany i pozostanie jedynie szumem informacyjnym – o czym często wspomina Krzysztof Lenk 8. Warto wspomnieć, że o ile dane są obiektywnym zapisem faktów, o tyle informacja ma charakter subiektywny, to znaczy jeden komunikat, a tym samym ten sam zestaw danych, może być źródłem różnych informacji dla różnych odbiorców, w zależności od posiadanej przez nich wiedzy, ich indywidualnego systemu konceptualizacji oraz sposobu kontekstualizacji danych. „Wynika z tego, że proces interpretacji danych wymaga posiadania określonej wiedzy o opisywanym świecie i o języku, w którym dane są zapisane. Wiedza odgrywa zatem aktywną rolę w procesie interpretacji danych, nadawania im znaczenia” 9. Nowa wiedza powstaje wskutek wyciągania wniosków z już posiadanej wiedzy oraz otrzymanych informacji w określonym kontekście.

Próba definicji

Wizualizacja danych

Wizualizacja danych to proces transformacji danych do postaci wizualnej, tj. do obrazu, lub rezultat takiej transformacji. Wizualizacją można nazwać nie tylko różnego rodzaju grafy, wykresy i diagramy, ale właściwie każdą formę wizualną, która powstała wskutek wykonania na zestawie danych określonego powtarzalnego algorytmu – nieważne, czy za pomocą komputera, czy też manualnie – w tym zapis tekstowy i tabelaryczny. Wizualizacja to również wizualny lub samowizualizujący się zapis danych, jak np. ten pochodzący z dawnych sejsmografów, w których wstrząsy były rejestrowane za pomocą wahadła i najpierw przyjmowały formę graficzną, a dopiero później była możliwa ich transformacja do postaci cyfrowej.

Warto się tu zastanowić nad problemem celowości wizualizacji danych, tj. nad tym, czy sposób kodowania, zapisu danych lub też ich transformacji do postaci wizualnej powinien być podporządkowany czytelności i możliwości ich interpretacji. Innymi słowy, czy wizualizacja musi być użyteczna lub efektywnie komunikować informacje. Wydaje się, że zgodnie z definicją danych 10 i przy założeniu, że wizualizacja jest szczególną formą ich zapisu, można powiedzieć, że jest postacią graficzną jedynie opartą na danych, niekoniecznie realizującą określony cel, czy narzucającą ich interpretację lub mającą sformułowany ówcześnie komunikat. Taka definicja otwiera pole z jednej strony do działań eksploracyjnych, nie do końca mających zdefiniowane cele, a z drugiej do wykorzystania wizualizacji danych w działaniach artystycznych, które w ogóle nie muszą być źródłem informacji, a wciąż mogą być nazywane wizualizacją danych.

Infografika / grafika informacyjna

Wyróżniającą cechą grafiki informacyjnej jest jej – jak łatwo się domyślić – aspekt informacyjny. Wobec tego, co już wiemy o informacji, można powiedzieć, że infografika musi zapewniać danym otoczkę, która z kolei umożliwi ich odniesienie do tego, co opisują, a także do wiedzy odbiorcy. Ale co to właściwie znaczy? Infografika oznacza bardziej kompleksową formę niż wizualizacja danych. Może kierować do odbiorcy jeden lub wiele komunikatów nawzajem się kontekstualizujących, co za tym idzie, wykorzystywać pojedynczą lub wiele wizualizacji danych, może zawierać zredagowany tekst, ilustracje, fotografie itp., wszystko po to, aby zapewnić niezrozumiałym dla odbiorcy danym kontekst i objaśnić, jak je interpretować za pomocą treści, które nawiązują do tego, co już wie. Jak twierdził Kant, „puste pojęcie może się odnieść do jakiejś intuicji empirycznej tylko wówczas, gdy istnieje jakaś aprioryczna zdolność figuratywna, która przygotowuje i wspomaga wtłoczenie nieznanej treści w znaną, zrozumiałą już treść” 11.

Infografika z założenia jest użytecznym i efektywnym źródłem określonych informacji dla danego odbiorcy, jednocześnie już pojedyncza wizualizacja danych, nawet w postaci tabeli lub ilustracja, może funkcjonować jako infografika, kiedy jest źródłem informacji.
Pojawia się jednak pytanie, czy infografika podobnie jak informacja ma charakter subiektywny? Trzymając się definicji, trzeba by stwierdzić, że tak. Specjalistyczne wizualizacje dla laika będą tylko szumem informacyjnym, natomiast dla odbiorcy posiadającego wiedzę, jak je interpretować, będą źródłem konkretnych informacji. Różnicę w pierwszym przypadku będzie czynił opis, jak interpretować, oraz elementy kontekstualizujące, dzięki którym wizualizacja nabierze również dla laika charakteru informacyjnego. Z drugiej jednak strony jeśli zawęzimy grupę docelową i tak zaprojektujemy komunikat, że pojawi się pewność jego poprawnej interpretacji wewnątrz tej grupy, będziemy mieli zawsze do czynienia z infografiką.

Co o tym wszystkim myśleć?

Czemu ma zatem służyć rozróżnianie wizualizacji danych i infografik? Na pewno nie powinno być pretekstem do próżnych sporów słownikowych. Będzie natomiast przydatne w zastanawianiu się, co jest w danej sytuacji celem projektowym, nas projektantów lub autora, którego pracę widzimy. W tym drugim przypadku nie pozwoli dać się nabrać. Kiedy natomiast projektujemy sami, musimy zadać sobie pytanie o cel naszych działań, dlaczego chcemy coś zakomunikować12. Wiedząc dlaczego, możemy zadać sobie pytanie „jak”. Z kolei odpowiedzieć na to pytanie pomoże dalsze doprecyzowanie, m.in. czy nasze działania mają charakter artystyczny czy użytkowy, a jeśli to drugie, to czy wykorzystujemy wizualizację jako narzędzie do eksplorowania danych, dając odbiorcy wolną rękę w poszukiwaniu ewentualnych korelacji (podejście eksploracyjne), czy przedstawiamy zestaw danych, prezentując już określone zależności i wnioski (podejście objaśniające). Czy zależy nam na przekonaniu odbiorcy do konkretnego punktu widzenia, wywołaniu zmiany w zakresie postawy (podejście perswazyjne), czy też na jak najbardziej obiektywnym przedstawieniu problemu, które pozwoli odbiorcy zrozumieć dane zjawisko i dokonać własnych spostrzeżeń, niekoniecznie zgodnych z naszymi (podejście informacyjne) 13.

Kolejne pytanie – jakiego narzędzia powinniśmy użyć? Niewielką ilość danych można sprawnie wyrysować ręcznie, jednak w przypadku dużej liczby danych lub takich danych, które chcemy przetwarzać w czasie rzeczywistym albo interaktywnie, najczęściej konieczne będzie stworzenie dedykowanej aplikacji.

Moim celem nie było postawienie kropki nad i, a jedynie zaznaczenie istnienia problemu, który dodatkowo komplikuje się, kiedy inforgafikę i wizualizację danych umieścimy w szerszym kontekście projektowania informacji, komunikacji wizualnej, projektowania graficznego, grafiki użytkowej itd. Nad wszystkim tym od czasu do czasu warto się zastanowić.

Ilustracja tytułowa © Ogólnopolski kwartalnik projektowy 2+3D


  1. Cytat pochodzi z prywatnej korespondencji autora. 
  2. Pojęcie chart junk i współczynnika data-ink wprowadził Tufte w książce The Visual Display of Quantitative z 1983 roku. Pierwsze oznacza graficzne elementy wykresów i diagramów, które nie są niezbędne w procesie kodowania informacji, drugie niezbędną ilość tuszu potrzebną do zaprezentowania informacji. Im wyższy współczynnik data-ink, tym mniej zbędnych elementów. 
  3. M. Grabowski, A. Zając, Dane, informacja, wiedza – próba definicji;
    www.uci.agh.edu.pl/uczelnia/tad/PSI11/art/Dane_informacje_wiedza.pdf 
  4. Zob. Wiedza, informacja i dane,
    www.inzynieriawiedzy.pl/wiedza/wiedza-informacje-dane 
  5. Zob. M. Grabowski, A. Zając, Dane, informacja, wiedza – próba definicji, dz. cyt. 
  6. Zob. T.H. Davenport, L. Prusak, Working Knowledge,
    Harvard Business Review Press 2000. 
  7. Zob. tamże oraz Wiedza, informacja i dane, dz. cyt. 
  8. Zob. K. Lenk, Wątpliwości projektanta informacji wizualnej, vimeo.com/52745649;
    tenże, Krótkie teksty o sztuce projektowania, Gdańsk [2011], s. 106. 
  9. Zob. Wiedza, informacja i dane, dz. cyt. 
  10. Zob. M. Grabowski, A. Zając, Dane, informacja, wiedza – próba definicji, dz. cyt. 
  11. J.-J. Wunenburger, Filozofia obrazów, tł. T. Stróżyński, Gdańsk 2011, s. 54. 
  12. Zob. R. Kosara, Talk: How to Visualize Data, „Eagereyes: Visualization and Visual Communication”, https://eagereyes.org/talk/talk-how-to-visualize-data 
  13. M. Ciesielska, Komunikacja wizualna w działaniu, http://tworczelaboratorium.weebly.com/uploads/1/0/6/3/10632528/komunikacja_w_dzialaniu.pdf