Lauri Salminen
Tiedon digitalisoituminen on muuttanut radikaalisti tiedon keräämisen ja jakamisen mahdollisuuksia. Digitalisoitua tietoa voidaan nykyään helposti manipuloida sekä analysoida ja luoda näin uutta tietoutta (Kitchin & Lauriault, 2015, s. 467).
Ihmiskunta on kerännyt tietoa talteen lähes koko olemassaolonsa ajan. Kerätty tieto on ollut luonteeltaan muodollista tai epämuodollista käyttötarkoituksestaan riippuen. (Kitchin & Lauriault, 2015, s. 467). Jo 15 000 vuotta ennen ajanlaskumme alkua esi-isämme tallensivat ja siirsivät tietouttaan luolamaalausten avulla. Ajan saatossa dokumentointimenetelmät kehittyivät siten, että ihmiset oppivat tallentamaan tietoa kirjoitetun tekstin muodossa. Tämä dokumentoitu tieto oli kuitenkin vain harvojen ja valittujen henkilöiden saatavilla. Kirjastojen yleistyttyä 1800-luvulla tieto saapui yhä useamman ihmisen ulottuville. Nykypäivänä tietokoneet ja internet ovat tuoneet tiedon lähes jokaisen ihmisen ulottuville ja mahdollistavat tehokkaan ja nopean tiedon haun ajasta ja paikasta riippumatta (Alexander, 2017).
Yritykset, jotka tähtäävät investointiensa tuottojen (ROI) kasvattamisen sekä pyrkivät parantamaan päätöksentekoprosessejaan, hyödyntävät yhä enenevissä määrin erilaisista lähteistä kerättävää dataa. Tätä dataa voidaan pitää liiketoimintatiedon hallinnan (Business intelligence, BI) perustana. BI:n datan lähteenä toimii useimmiten nykypäivänä kaikkien huulilla oleva big data (Mariani, Fuchs, & Höpken, 2018, s. 3515), mutta yrityksen liiketoimintaa hyödyttävää tietoa on saatavilla helpommin lähestyttävän small datan muodossa.
Tiedon hankinta ja kerääminen
Tiedon keräämisen ei koskaan pitäisi olla itseisarvo, vaan se tulisi nähdä apuvälineenä tehokkaampien ennusteiden luonnissa sekä asioiden ymmärtämisen tehostajana. Tietoa ei pidä lähteä keräämään mahdollisimman monesta eri lähteestä, vaan on suositeltavaa keskittää ponnistelut vain muutamaan hyödyllisimpään lähteeseen. Tavoitteena tulisi olla vain käyttäjälleen hyödyllisen tiedon kerääminen, ei kaiken mahdollisen tietämyksen saavuttaminen (Kitchin & Lauriault, 2015, s. 8).
Hankittaessa tietoa eri lähteistä tulee myöskin huomioida tiedon hankinnasta aiheutuvat kustannukset. Tiedosta saadut taloudelliset hyödyt ja sen hankinnasta aiheutuvat kustannukset tulee pitää tasapainossa. Edellä mainitut hankintakustannukset voivat koostua esimerkiksi erilaisista tietosuoja- ja laskentakuluista (Kitchin & Lauriault, 2015, s. 1).
Small data
Small datasta puhuttaessa mainitaan usein datan pieni määrä, mutta käyttötarkoituksesta riippuen sitä voidaan kerätä suuriakin määriä esimerkiksi väestönlaskennassa. Toisin kuin big datassa, dataa kerätään harvemmin ja hitaammassa tahdissa. Small dataa voisi kuvailla keitaaksi keskellä massiivista big data -tiedon aavikkoa (Kitchin & Lauriault, 2015, ss. 464–465).
Small datalla on pitkä kehityshistoria ja sitä onkin hyödynnetty esim. liiketoiminnassa, kansalaisjärjestöjen välillä sekä erilaisten valtion virastojen toiminnassa. Small datan hyvin tunnettujen metodologioiden ja analysointityökalujen ansiosta kerättyä ja analysoitua tietoa hyödyntämällä on pystytty tuottamaan tärkeisiin kysymyksiin käyttökelpoisia vastauksia. Small dataa hyödyntävät tutkimukset voidaan kohdentaa tarkasti tiettyihin tutkimuskysymyksiin, joiden avulla halutaan lisätä tietoutta esimerkiksi ihmisten erilaisista toimintatavoista – olivatpa ne sitten rationaalisia tai irrationaalisia – erilaisissa konteksteissa ja toimintaympäristöissä (Kitchin & Lauriault, 2015, s. 466).
Small datan käyttö ja hyödyntäminen
Small dataa hyödyntävällä henkilöllä on usein henkilökohtainen linkki etsimäänsä ja käyttämäänsä tietoon. Small datalle on ominaista, että sitä on usein saatavilla vain rajallinen määrä ja että se rakentuu syy-seuraus-yhteyksistä. Henkilön asiantuntemus ja kokemus tiedon kontekstista auttaa häntä muodostamaan edellä mainittuja syy-yhteyksiä, joita ulkopuoliste asiasta tietämättömien tahojen ei ole mahdollista rakentaa. Oikein käytettynä small data edistää henkilöiden näkemysten muovautumista muuttaen usein heidän ajattelutapojaan. Small data voi myös auttaa käyttäjiään muodostamaan uudenlaisia käsityksiä, joita he voivat myöhemmin hyödyntää esimerkiksi liiketoimintansa kohentamisessa (Klein, 2018).
Small dataa hyödynnettäessä tulisi huomioida erinäisiä seikkoja, jotka juontavat juurensa erääseen small datan ominaisuuteen – tiedon määrään. Koska small data sisältää pääsääntöisesti vähemmän näytteitä kuin big data, on tärkeää, että kerätty data on mahdollisimman puhdasta ja vääristymätöntä. Data ei saisi olla puolueellista ja sen tulisi kuvata mahdollisimman tarkasti tutkittavaa asiaa (Kitchin & Lauriault, 2015, s. 466).
Small data liiketoiminnan apuna
Small data toimii hyvänä perustana liiketoimintasuunnitelmaa luotaessa. Tiedoilla voidaan luoda tarkempi kokonaiskuva omasta liiketoiminnasta ja siitä, millaisia asiakkaita yrityksellä on. Pienen tietomääränsä ansiosta small datan sisältämä tieto on helposti hallittavissa sekä käytettävissä, eikä se vaadi laaja kokemusta tiedon analysointimalleista. Yritysten käyttämillä tietotyövälineillä voidaan nykyään helposti kerätä small dataa. Tiedon lähteinä voidaan käyttää esimerkiksi asiakkaiden suuntaan käytyä viestintää tai vaikkapa CRM-työkaluja. Esimerkiksi Google Analytics tarjoaa dataa helposti lähestyttävässä ja kompaktissa muodossa. Mainitusta tiedonlähteistä kerättyä dataa voidaan siirtää vaikkapa Excel-taulukoihin, joissa sitä voidaan käsitellä, visualisoida ja analysoida tarkemmin. Mahdolliset poikkeamat sekä ongelmien paljastuvat tehokkaasti tällaisesta datasta. Tämän lisäksi data saattaa paljastaa esimerkiksi nousevia trendejä tai yritykselle tärkeimpiä asiakassegmenttejä (Gosselin, 2018).
Asiakkaiden liiketoimintaan liittyviä perustietoja, kuten toiminimet ja maantieteelliset profiilit, voidaan selvittää yksinkertaisesti yrityksen keräämistä asiakastiedoista. Tällaisten tietojen perusteella yrityksen tärkeimmille asiakkaille voidaan esimerkiksi räätälöidä kohdennettua viestintää ja mainontaa. Small dataa hyödyntämällä yritys pystyy perustamaan päätöksen tekonsa saatavilla olevaan konkreettiseen tietoon uskomusten sijasta (Gosselin, 2018).
Small data Hämeen ammattikorkeakoulussa
HAMK on kehittämässä Venla-valmennusta yhdessä Lahden ammattikorkeakoulun kanssa. Valmennuksen tavoitteena on tarjota verkossa tapahtuvaa koulutusta ja valmennusta yrittäjänaisille, jotka haluavat lisäkoulutuksellaan vahvistaa omaa liiketoimintaansa. Small data on yksi kohderyhmälle tarjotuista valmennusteemoista muiden teemojen ollessa palvelumuotoilu, markkinointi, myynti ja kansainvälistyminen. Hanketta viedään eteenpäin Euroopan sosiaalirahaston tuella ja sen päättyminen ajoittuu näillä näkymin vuoteen 2020.
Kirjoittaja
Lauri Salminen toimii lehtorina tietojenkäsittelyn koulutusohjelmassa. Hän on mukana myös Venla-hankkeessa ja tekee valmennusmateriaaleja small data -osioon.
Lähteet
Alexander, R. (2017). The History of Knowledge Sharing [Blogijulkaisu 29.8.2017]. Haettu 20.2.2019 osoitteesta https://bloomfire.com/blog/history-of-knowledge-sharing
Augustin, N. & Faraway, J., (2018). When small data beats big data. Statistics and Probability Letter, 136, 142–145.
Gosselin, J., (2018). Big Data vs. Small Data: What’s the Difference and How Can You Use This Information? [Blogijulkaisu 13.2.2018]. Haettu 31.1.2019 osoitteesta http://www.themeasurementstandard.com/2018/02/big-data-vs-small-data-whats-difference-can-use-information
Kitchin, R. & Lauriault, T. P., (2015). Small data in the era of big data. GeoJournal, 80(4), 463–475.
Klein, G., (2018). Small Data [Blogijulkaisu 22.6.2018]. Haettu 31.1.2019 osoitteesta https://www.psychologytoday.com/us/blog/seeing-what-others-dont/201807/small-data
Mariani, M., Baggio, R., Fuchs, M. & Höpken, W. (2018). Business intelligence and big data in hospitality and tourism: a systematic literature review. International Journal of Contemporary Hospitality Management, 30(12), 3514–3554.