VISUALIZING DATA (PDF -versio)
Kirjan kirjoittaja Ben Fry on kirjassa käsiteltävän avoimen lähdekoodin Processing:n kehittäjä. Processing on datan visualisointiin tarkoitettu, suhteellisen yksinkertainen ohjelmointikieli, joka perustuu Javaan.
Fry kirjoittaa, että suunnattoman iso osa dataa menee näinä päivinä käyttämättä vain, koska ihmiset eivät osaa visualisoida määriä eikä niiden suhteita toisiinsa. Kirja demonstroi metodeja kuinka esittää dataa tarkasti verkossa ja muualla – täydennettynä interaktioilla ja animaatioilla.
Processing ohjelmaa kutsutaan _sketch:_ksi. Ideana Fryn mukaan on tehdä Java-tyylinen ohjelmointityyli tuntumaan enemmänkin käsikirjoittamiselta, ja jalostaa tuo skriptiprosessi nopeaan koodin kirjoittamiseen.
The Seven Stages of Visualizing Data
Fry käy läpi seitsemän datan visualisointiin tarkoitettua vaihetta. Kohdatessa suuren määrän dataa, meidän pitää purkaa se pienempiin osiin.
Prosessi datan ymmärtämiseksi alkaa joukolla numeroita ja kysymyksellä. Seuraavat vaiheet ovat polku vastaukseen:
Hankinta
Hanki data, joko sitten tiedostosta tai lähteestä verkosta
Jäsentele
Luo datan tarkoitukselle rakenne ja järjestele se kategorioihin
Suodata
Poista kaikki paitsi tarvittava data
Louhi
Sovella metodeja tilastotieteestä tai datan louhimisesta löytääksesi kuvion tai sijoita data matemaattiseen kontekstiin
Esitä
Valitse tavallinen visuaalinen malli, kuten pylväsmalli, lista tms.
Tarkenna
Kohenna ja kehitä perus esitysmallia tehdäksesi siitä selkeämmän ja visuaalisesti kiinostavamman
Vuorovaikuta
Lisää metodeja datan manipuloimiseen tai datan näkyvyyden kontrollointiin
Fry mainitsee, että jokaisen visualisoinnin tulisi välittää omanlaisensa, uniikin, tarpeiston sille datalle jota se edustaa. Kirja ei perustu valmiisiin visualisointeihin, joita voidaan tarpeen vaatiessa hyödyntää mihin tahansa. Valmiit visuaaliset pohjat voivat auttaa pikaisen visualisoinnin tekemiseen, mutta ne eivät ole yleensä joustavia. Jokainen Excelillä tehty pylväsdiagrammi näyttää Excelillä tehdyltä pylväsdiagrammilta. Jokainen ongelma on uniikki, joten hyödynnä sitä uniikkia ratkaistaksesi ongelman.
Fry jatkaa, että kirja on tarkoitettu auttamaan sinua ymmärtämään data työkaluna – kuinka se vaihtelee, kuinka sitä voi käyttää, ja kuinka löytää miten datasi on uniikki.
Kirjoittaja muistuttaa myös, että usein vähemmän yksityiskohtia välittävät enemmän informaatiota, koska liialliset yksityiskohdat johdattavat katselijan pois siitä mikä on tärkeintä tai katselija sivuuttaa kuvan kokonaisuudessaan, koska se on liian monimutkainen. Käytä niin vähän dataa kuin mahdollista, vaikka se vaikuttaisi kuinka kallisarvoiselta.
Metrokartat jättävät yksityiskohdista pois maan päällä sijaitsevat tiet, koska lisäyksityiskohdat aiheuttavat liiallista monimutkaisuutta. Esimerkiksi kuuluisa Lontoon metrokartta perustuu suoriin tai 45 asteen kulmissa meneviin viivoihin, vaikka metroverkosta kaartelee ja kääntyilee huomattaasti mutkikkaammin. Tärkein tieto metrokartoissa on miten päästä paikasta A paikkaan B, miten pääsen täältä tuonne.
Fry kertoo, että datan keruu on helppoa, ja se valtaa joidenkin ihmisten mielet kartuttamalla enemmän monimutkaisempaa dataa ja dataa massoittain. Mutta mitä enemmän dataa ei välttämättä ole parempi. Vain koska sen voi mitata, ei tarkoita että se pitäisi.
Tunne Yleisösi
Kuka on yleisösi? Mitkä ovat heidän tavoitteet, kun he lähestyvät visualisointia? Ellei se ole saavutettava yleisölle, miksi ylipäätään teet sitä? Fry kuitenkin muistuttaa, että tehdessään asioista yksinkertaisia ja selkeitä, ei kuitenkaan tarkoita että oletetaan että käyttäjät olisivat tyhmiä ja että käyttöliittymä pitää ”tyhmentää” heitä varten. Millä tavalla yleisösi käyttää luomustasi? Käytetäänkö sitä mobiililaitteella vai tietokoneella? Nämä vaativat hyvinkin erilaiset designit toisiinsa nähden.
Kirjansa toisessa kappaleessa Fry käy läpi Processingin alkeet, ympäristön ja syntaksit. Kappale luo hieman taustaa API (Application programming interface) rakenteelle ja projektin taustalla olevalle filosofialle.
Kolmannessa kappaleessa käydään läpi esimerkkejä projekteista, jotka käyvät progressiivisesti koko ajan monimutkaisemmaksi.
Neljäs kappale kattaa metodeja graafeista, jotka edustavat kuinka data vaihtelee ajan myötä.
Kirjan viides kappale syventyy datan ja tiedon hankkimiseen sekä sen jäsentelyyn, kappaleessa käytettyjä tekniikoita voidaan hyödyntää myös monessa muussa projektissa.
Kuudes kappale vastaa kysymykseen ”Miten postinumero liittyy maantieteeseen?”, kyseessä on projekti, joka antaa käyttäjän progressiivisesti kehittää USA:n karttaa samalla kun he kirjoittavat postinumeroa.
Seitsemännessä kappaleessa Fry selostaa hierarkiasta. Se kattaa toiston, joka Fryn mukaan on tärkeä aihe, kun käsitellään puustruktuuria – hyödyllinen esitystapa tietynlaisille puujärjestelmää käyttävälle datalle.
Kahdekas kappale on tietoverkoista ja informaatiosta, grafiikasta. Ensimmäinen puoli kattaa tavat joilla tuotetaan esityksiä yhdistelmistä tietoverkon solmuista. Toinen puoli on esittää saman tekniikan tehtynä websivun liikennedatalle.
Viimeiset kolme, yhdeksäs, kymmenes ja yhdestoista kappale pitää sisällään referenssimateriaalia, sisältäen enemmän taustoista ja tekniikoita kuinka hankkia ja jäsentää dataa.
Processing ohjelman voi ladata sivustolta: