Hanna Willman-Iivarinen
Monessa tutkimuksessa pyritään osoittamaan, mistä jokin asia johtuu, tai ennustamaan erilaisten toimenpiteiden vaikutuksia. Nämä selitykset ja ennusteet nojaavat vahvasti ajatukseen syy-seuraussuhteista eli kausaalisuudesta. Empiirisissä tutkimuksissa pystytään melko hyvin osoittamaan, että ilmiöillä on jokin yhteys keskenään (esimerkiksi tilastollinen riippuvuus, kuten vaikka korrelaatio), mutta sen sijaan kausaalisuuden osoittaminen ei ole ihan yksinkertaista. Syy-seuraussuhteita ei voida ilmaista ainoastaan matematiikan tai tilastotieteen kielellä, vaan kausaalisuuden osoittamiseen tarvitaan kausaalista kieltä, jossa kuvataan mekanismit, syyt ja seuraukset. Kausaalisuuden osoittamisessa astutaan datasta saatavan tiedon ulkopuolelle. Tällöin kuvaillaan, miksi jokin asia tapahtuu, mikä on sen syy, mikä seuraus, ja millainen vaikutusmekanismi niiden välillä on; eli toisin sanoen millainen on ilmiöiden välinen dynamiikka. Tässä artikkelissa pohditaan kausaalisuuden osoittamisen ongelmaa käytännössä. Artikkelin tavoitteena on herättää akateemista keskustelua siitä, miten kausaalisuudesta voidaan tieteellisissä julkaisuissa puhua.
Johdanto
Kausaalisuus liittyy selittämiseen tieteessä, se on kuvausta säännönmukaisuudesta, ja sen avulla pyritään ennustamaan ilmiöitä ja tapahtumia. Vaikka kausaalisuus onkin intuitiivisesti helppoa ymmärtää ja määritellä arkikielessä (jostain tapahtumasta seuraa toinen tapahtuma), tieteenfilosofiassa sen osoittaminen ja määritteleminen on osoittautunut hyvin mutkikkaaksi. Filosofit ovat päätyneet hyvin erilaisiin tulkintoihin kausaalisuudesta ja jopa sen olemassaolosta. Tulkintoja on huomattavan paljon. Esimerkiksi White (1990) on koonnut yli kahdenkymmenen filosofin toisistaan merkittävästi poikkeavia määritelmiä kausaalisuudesta. Kausaalisuuden olemuksen ymmärtäminen on tärkeää kaikille tutkijoille, jotka pyrkivät kuvaamaan syy-seuraussuhteita tai ennustamaan asioita ja ilmiöitä. Shuganin (2007) mukaan kausaalisuuskäsitteen vaikeuden takia monilla tieteenaloilla vältetään kausaalisuudesta puhumista ja käytetään sen sijaan suppeammin määriteltyjä termejä (kuten korrelaatio, tilastollinen riippuvuus, matemaattiset mallit, ennusteet, rakenneyhtälöt, endogeeniset muuttujat). Kuitenkin, jos halutaan tieteellisellä työllä olevan laajempaa merkitystä, pitäisi johtopäätökset pystyä yleistämään ja argumentoimaan kausaalisella kielellä. Kausaalinen kieli tarkoittaa siis selkeää ilmaisua, että jokin tapahtuma, tilanne, toiminta tai ilmiö vaikuttaa johonkin toiseen (Thapa ym., 2020).
Kausaalisessa systeemissä tarvitaan sekä syy että seuraus ja niiden pitää jollain tasolla kohdata samassa ajassa ja paikassa. Ajatellaan epidemiologiaan liittyvää kausaalista esimerkkiä. Jos taudin aiheuttaja ja ihminen eivät kohtaa missään tilanteessa, ei myöskään tapahdu sairastumista. Näiden kohdatessa tietyissä olosuhteissa, ihminen sen sijaan sairastuu. Tieteenharjoittaja kohtaa kolmenlaisia ongelmia edellä olevaan esimerkkiin liittyen. Ensimmäinen ongelma on ontologinen eli kausaalisuuden olemassaoloon liittyvä. David Hume on argumentoinut, että kausaalisuus on vain ihmisten keksimä käsite, eikä sitä ole olemassa fyysisessä todellisuudessa (Shugan, 2007). Kausaalisuus siis luodaan silloin, kun sitä mitataan ja määritellään. Voidaan myös argumentoida, että syy on seurausta jostain edeltävästä syy-seuraus-ketjusta, joka edelleen voi olla seuraus, jostain toisesta syy-seuraus-ketjusta. Jos mennään tarpeeksi pitkälle tässä päättelyketjussa, huomataan että kaikki vaikuttaa kaikkeen, eikä siis mikään ole yksittäinen syy mihinkään (Shugan, 2007). Toinen ongelma on epistemologinen eli ongelma siitä, miten kausaalisuhteesta voidaan saada tietoa. Vaikka voimme olettaa, että sairastuminen johtuu joko biologisista syistä tai ulkoisesta taudinaiheuttajasta, tiedonhankkiminen varsinaisesta syystä saattaa olla haasteellista. Kolmas ongelma on kausaalisuhteen todistaminen.
Tämä artikkeli käsittelee näitä kaikkia kausaalisuuteen liittyviä ongelmia. Ensin kausaalisuus määritellään ontologisesti, sitten käsitellään epistemologista ongelmaa eli kausaalisuusvihjeitä ja lopuksi kausaalisuuden todistamisen ongelmaa. Artikkelin tavoitteena on herättää akateemista keskustelua siitä, miten kausaalisuudesta voidaan tieteellisissä julkaisuissa puhua.
Mitä kausaalisuus on?
Kausaalisen mekanismin olemassaoloon tarvitaan sekä syy että seuraus. Seuraus on olemassa syyn takia. Tämä tuntuu aika yksinkertaiselta, mutta lähemmin tarkasteltuna ilmiö mutkistuu. Jos minulla on nälkä ja ostan siksi hampurilaisen, nälkä on syy ja hampurilaisen ostaminen on kausaalinen seuraus. Jos nälällä ja hampurilaisen ostamisella on kausaalinen yhteys, ostanko aina hampurilaisen, kun minulla on nälkä? Voinko joskus ostaa hampurilaisen itselleni, vaikka minulla ei olisikaan nälkä? Deterministisen kausaalisuuskäsityksen mukaan tietystä syystä seuraa aina tietty seuraus. Tämä käsitys ei salli poikkeuksia. Seuraus voi olla olemassa vain, jos syykin on olemassa eli siis syy on seurauksen välttämätön ehto (Parascandola & Weed, 2001). Tämäntyyppistä kausaalisuutta on vaikeaa todistaa. Yksikin poikkeava havainto tarkoittaisi, ettei kausaalisuutta ole.
Ehdollinen (conditional) kausaalisuuskäsitys saattaisi ratkaista edellä esitellyn ongelman. Syyn ja seurauksen lisäksi tarvitaan tilanneväittämiä, jotka kuvaavat missä oloissa kausaalisuhde pätee. Esimerkiksi: mieleni tekee hampurilaista, hampurilaisia on saatavilla, minulla on rahaa ja nälkä jne. Ehdollinen kausaalisuus on deterministisen kausaalisuuden muunnelma. Tietystä syystä seuraa aina tietty seuraus, kunhan tietyt ehdot toteutuvat. Relevantteja tilannemuuttujia saattaa olla paljon ja niiden listaaminen kattavasti voi olla hankalaa. Shugan (2007) ja Cartwright (2006) ovatkin sitä mieltä, ettei ehdollisessa kausaalisuudessa ole juurikaan mieltä, koska tämän tyyppinen kausaalinen yhteys on laimea ja lukuisten tilannemääritysten takia sillä ei ole mitään käytännön merkitystä.
Sekä deterministinen kausaalisuus että sen muunnelma ehdollinen kausaalisuus ovat siis vaikeasti todettavissa. Mahdollisesti sen takia filosofi Woodward (2003) ja taloustieteilijä Heckman (2006) määrittelevät kausaalisuuden aivan eri tavalla. Heidän mukaansa kausaalisuus on olemassa vain, jos syiden muuttaminen (manipulointi) aiheuttaa seurausten muuttumisen. Tässäkin kokeellisessa (experimental tai manipulative) kausaalisuuskäsityksessä on ongelmia. Ensinnäkin manipulointia voi olla vaikeaa tehdä käytännössä, ja toiseksi kausaalinen suhde voi olla olemassa, vaikka mitään muutosta ei tapahtuisikaan.
Edellä mainittujen ehdottomien kausaalisuuskäsitysten lisäksi voidaan myös tarkastella todennäköistä kausaatiota. Todennäköinen (probabilistic) kausaalisuuskäsitys, kertoo, että syystä saattaa aiheutua seuraus, mutta näin ei välttämättä aina tapahdu (Granger, 1988; Cartwright, 2004; Cartwright, 2010). On ihan eri asia yrittää todistaa, että jostain seuraa aina jotakin kuin, että siitä saattaa seurata jotakin. Käytännössä usein olemme tilanteessa, jossa jokin teko nostaa tapahtuman todennäköisyyttä, mutta ei välttämättä aiheuta sitä deterministisessä mielessä. Esimerkiksi tupakointi nostaa keuhkosyövän todennäköisyyttä, mutta keuhkosyövän voi saada muutenkin eikä tupakoinnista aina seuraa keuhkosyöpää.
Kausaalisuuden määrittely tiukan deterministisen tai löyhemmän todennäköisyyden kautta on herättänyt kiivasta akateemista väittelyä (esimerkiksi Dowe, 1992; 1995; Salmon, 1994; 1997; Parascandola & Weed, 2001; Cartwright, 2004). Deterministinen eli kapeampi määritelmä on helpompi todistaa tai hylätä, mutta käytännössä usein tarvitaan laajempaa näkökulmaa.
Koska todellisuudessa syyt ja seuraukset ovat melko mutkikkaita, filosofit ovat esittäneet idean kausaalisesta verkosta, missä useat kausaaliset mekanismit vaikuttavat samaan aikaan (ks. esim. Krieger, 1994). Tällöin ajatellaan, että ilmiöille on useita vaihtoehtoisia selityksiä (ikään kuin useita kausaalisia historioita). Aina ei ole mahdollistakaan löytää yhtä yksittäistä syytä tietylle tapahtumalle, vaan asia tapahtuu useiden eri syiden yhteisvaikutuksena. Monimutkaisesta syiden ja seurausten verkosta pyritään löytämään tärkeimmät vaikuttavat mekanismit. Mutta kausaalisen verkonkaan käsite ei poista sitä ongelmaa, että pitäisi silti löytää yksittäisiä kausaalisia mekanismeja, jotta voidaan päätellä verkon kausaalinen vaikutus.
Kausaalisuusvihjeet
Vaikka päästäisiinkin yhteisymmärrykseen kausaalisuuden määritelmästä, kausaalisuuden todistaminen ei ole ihan helppoa. Tutkijalle on toki olemassa useita erilaisia vihjeitä potentiaalisesta kausaalisuudesta, mutta kaikki nämä vihjeet ovat jossain määrin ongelmallisia. Mikään näistä vihjeistä ei sinänsä todista kausaalisuutta, eikä ole edes tarpeellista kausaalisuuden kannalta. Kausaalisuusvihjeitä ovat mm. korrelaatio, muu tilastollinen riippuvuus, samanaikaisuus, tapahtuminen järjestys ja muutokset.
Korrelaatio on kuvaus kahden tekijän välisestä tilastollisesta riippuvuudesta. Se viestii potentiaalisesta kausaalisuudesta, mutta korrelaation voi myös aiheuttaa jokin muu tekijä, mikä vaikuttaa molempiin muuttujiin. Usein käytetty esimerkki on jäätelön syömisen ja hukkumiskuolemien yhteys (molempiin vaikuttavana syynä toimii kesä). Korrelaatio on selvä, mutta kausaalisuus ei. Korrelaatio ei ole myöskään tarpeellinen kausaalisuuden kannalta, koska kausaalinen suhde voi olla muunkinlainen kuin lineaarinen. Muuttujilla voi olla monimutkaisia ja päällekkäisiä vaikutusmekanismeja toisiinsa, joita ei saa korrelaatiolla esiin (Kuorikoski, 2006). Osa vaikutuksista voi olla jopa toisensa kumoavia. Sama tuntemattomien muuttujien ongelma koskee myös muita tilastollisia riippuvuuksia testaavia menetelmiä, kuten regressioanalyysiä tai taloustieteessä käytettyä viivästettyjä muuttujia käyttävää Granger-kausaalisuutta, vaikka niillä saadaankin tarkempia vihjeitä kuin pelkällä korrelaatiolla. Sternin (2011) mukaan tämäkään ei vielä riitä todistamaan sitä, sillä mallista saattaa puuttua relevantteja muuttujia, tai kausaalisuhde saattaakin olla stabiili eikä muuttuva.
Minkään muunkaan tilastollisen menetelmän avulla kausaalisuutta ei voida todistaa (Phillips ja Goodman, 2006; Pearl, 2009; Shugan, 2007), koska datasta havaittu kausaalisuuden vihje on täysin riippuvainen tutkijan tekemistä valinnoista; siitä mitä muuttujia on valittu mukaan (ja mitä jätetty pois). Jos esimerkiksi mahdollinen yhteinen syy jää pois datasta, ei datasta saada selville kausaalisuudesta mitään. Tilastotieteen keinoin pystytään hyvin osoittamaan assosiaatio eli tapahtumien tai muuttujien yhteys, mutta kausaalisuutta ei voida todistaa aukottomasti, sillä kausaalisuus tarvitsee aina myös jonkin selityksen mekanismista eli ilmiöiden välisestä dynamiikasta (Pearl, 2009; Antonakis ym. 2010; Shugan, 2007). Tarvitaan alan asiantuntemusta, jotta voidaan kattavasti ja uskottavasti sulkea pois muut mahdolliset selittävät tekijät (Rothman ja Greenland 2005). Datasta voidaan päätellä mitä tapahtuu, mutta ei sitä tapahtuuko näin aina vai vain tässä datassa, eikä myöskään sitä miksi asiat vaikuttavat toisiinsa.
Shugan (2007) nostaa esiin myös erään kausaalisuuden kannalta kiusallisen ilmiön datan analysoinnissa: vaikka yhdellä ostoksella ei ole vaikutusta yrityksen tulokseen, ostosten sarjalla on. Olennainen on myös kysymys siitä, millä aikavälillä ilmiö on kausaalinen. Jos aikajänne on lyhyt, vaikutukset ovat erilaisia kuin pitkällä aikavälillä (Kuorikoski, 2006). Tämä johtuu siitä, että pidemmällä aikavälillä toimijoilla (esimerkiksi yrityksillä tai kuluttajilla) on aikaa sopeuttaa toimintaansa (esimerkiksi kysyntään tai tarjontaan). Tutkijan pitääkin nähdä lyhyen ja pitkän aikavälin vaikutukset (ne voivat olla päinvastaiset) ja osata valita muuttujat sekä aikajänne oikein.
Kaikkea ei voi mitata eikä siis tilastollisia menetelmiä voi aina käyttää. Kausaalisuudesta on kuitenkin muitakin vihjeitä kuin pelkästään tilastolliset riippuvuudet. Tapahtumien samanaikaisuus vihjaa kausaalisuudesta, mutta ei todista sitä. Samanaikaisuus aiheuttaa myös haasteita kausaalisuuden tulkinnalle, sillä jos syyt ja seuraukset ovat samaan aikaan olemassa, voi olla vaikeaa erottaa mikä on syy ja mikä seuraus (Shugan, 2007). Yleensä oletetaan, että syy on olemassa ajallisesti ennen seurausta, mutta tilanne voi myös olla päinvastainen. Esimerkiksi eläimet valmistautuvat talven tuloon kasvattamalla rasvakerrosta ja ruokavarastoja. Nämä aktiviteetit tapahtuvat ennen talvea, eli syy tulee ajallisesti vasta seurauksen jälkeen. Voi myös olla, että syyn ja seurauksen välillä on niin pitkä ajallinen viive, ettei niitä osata yhdistää toisiinsa. Pitää olla tarkkana, ettei syyllisty Post Hoc- virhepäätelmään, jossa kausaalisuus päätellään virheellisesti pelkästään tapahtumien järjestyksen perusteella.
Usein ajatellaan, että kausaalisuus liittyy muutoksiin. Muutokset eivät kuitenkaan ole välttämättömiä. Esimerkiksi jokeen rakennettu pato pitää veden joen yläosassa, vaikka se on täysin stabiili. Kausaalisuhde voi estää tapahtumia tapahtumasta tai pitää ne stabiileina. Joskus kausaalisuuden todisteena pidetään syiden lukumäärää. Esimerkiksi rikostutkimuksessa, jos syyllisyyteen viittaavia seikkoja on paljon – vaikka mikään niistä ei yksinään riittäisi – mahdollinen rikoksen tekijä tuomitaan herkemmin kuin jos syyllisyydestä on vain vähänlaisesti vihjeitä (Shugan, 2007).
Kausaalinen kieli
Kun kausaalisuudesta löydetään jokin vihje, moni tutkija innostuu kynäilemään johtopäätöksen kausaalisella kielellä. Tämä tarkoittaa siis sellaisen terminologian käyttöä, mikä ilmaisee selkeästi, että jokin tapahtuma, tilanne, toiminta tai ilmiö vaikuttaa johonkin (Thapa ym., 2020). Kausaalinen kieli saattaa olla tiettyjen verbien (esimerkiksi lisää, vähentää, vaikuttaa, johtuu, seuraa) käyttämistä, joista lukijalle syntyy vaikutelma kausaalisuudesta (Adams ym., 2018, Yu ym., 2019; Thapa ym., 2020). Sama vaikutelma saadaan myös tietyillä konjunktioilla, esimerkiksi “koska”, “sillä”, “jos-niin” (Waldmann ym., 2017). Joidenkin arvioiden mukaan tutkijat saattavat olla liian innokkaita kausaalisen kielen käyttämisessä (esimerkiksi Cartwrigt, 2016).
On siis olennaista, miten kausaalisuudesta puhutaan. Yu ym. (2019) ovat tutkineet kausaalisen kielen käyttöä lääketieteen alan akateemisissa julkaisuissa. Analyysin perusteella noin kolmannes artikkeleista ilmaisi kausaalisen väitteen, osa kertoi korrelaatiosta ja vain viidennes ei ilmaissut minkäänlaista kausaaliseksi tulkittavaa väitettä. Kausaalisen kielen väärinkäyttäminen tieteellisissä julkaisuissa on suuri ongelma, koska tutkimuksesta saatetaan tehdä harhaanjohtavia päätelmiä. Useiden tutkimusten mukaan erityisesti lääketieteen alalla kausaalisen kielen käyttö on suurpiirteistä ja harhaanjohtavaa (von Elm & Egger, 2004; Glasziou & Chalmers, 2018). Esimerkiksi Rubin ja Parrish (2007) havaitsivat tutkimuksessaan, että 70 prosentissa heidän analysoimistaan tutkimuksista kausaalisuus oli yleistetty ongelmallisesti ja Cofieldin ym. (2010) mukaan 31 prosentissa heidän analysoimistaan tutkimuksista käytettiin kausaalista kieltä harhaanjohtavasti. Yun ym. (2019) tutkimuksessa havaittiin selkeitä eroja sen suhteen, miten eri maiden tutkijat käyttivät kausaalista kieltä. Heidän mukaansa se osoittaa, että tiedemaailmassa ei vallitse konsensusta siitä, miten kausaalisuudesta puhutaan.
Aiemmin tässä artikkelissa esitettyihin eri kausaalisuuskäsityksiin kuuluu jokaiseen oma kielensä, eikä niitä tarvitse nähdä toisensa poissulkevina. Kiinnostavia kysymyksiä aiemmin kuvatussa epidemiologiaan liittyvässä esimerkissä ovat, seuraako altistumisesta aina sairastuminen (determinismi), mikä on riittävä altistuminen (ehdollinen), miten sairastumisen tai kohtaamisen voi ehkäistä (kokeellisuus), mitkä asiat nostavat sairastumisen todennäköisyyttä (todennäköinen) ja mitkä muut syyt vaikuttavat sairastumiseen (kausaalisuusverkko). Olennaista on, että jokaiseen kausaalisuuskäsitteeseen kuuluu erilaiset argumentit ja eri kieli. Deterministiseen kausaalisuuskäsitykseen perustuva lause on esimerkiksi: “Altistumisesta taudin aiheuttajalle seuraa sairastuminen”. Ehdollinen kausaalisuus saattaa lisätä edelliseen joitain määritteitä, milloin väite pätee ja milloin ei. Kokeelliseen kausaalisuuden ajatukseen perustuva näkemys voisi olla: “Rokottaminen estää sairastumisen, vaikka henkilö altistuisi taudin aiheuttajalle”. Todennäköinen kausaalisuuskäsitys voisi kuvata asiaa seuraavasti: “Altistuminen taudin aiheuttajalle nostaa sairastumisen todennäköisyyttä”. Kausaaliverkossa voidaan kertoa minkä tekijöiden yhteisvaikutus johtaa sairastumiseen, ja millaisia suoria ja epäsuoria vaikutuksia eri muuttujilla on. Valitsemalla terminologian eli kausaalisen kielen tulee siis valinneeksi myös tietyn määritelmän (kausaalisuuskäsityksen) ja tietyt vaatimukset sen todistamiselle. Tutkijan on hyvä valita tarkkaan, miten ilmaisee kausaalisuuden, erityisesti ilmaiseeko sen deterministisesti vai niin, että se nostaa ilmiön todennäköisyyttä. On mahdollista, että ongelmat Rubin ja Parrish (2007) tutkimuksissa esiin nostetuissa artikkeleissa olisi voitu välttää valitsemalla oikeanlainen kausaalinen kieli.
Kausaalisuuden osoittaminen
Tässä artikkelissa on todettu kausaalisuudelle olevan erilaisia määritelmiä, joista jokaiseen liittyy omanlaisensa kieli. Kausaalisuutta on vaikea tieteellisesti todistaa, vaikka kausaalisuusvihjeitä on paljon. Yhtenä tapana testata kausaalisuutta käytetään kokeellista menettelyä, jossa on testiryhmä ja kontrolliryhmä. Eri tieteenaloilla tälle menettelylle on eri nimiä, esimerkiksi taloustieteilijät puhuvat satunnaistetusta kontrolloidusta testistä. Kokeellisen menettelyn avulla voidaan helposti tutkia vaikutuksia syyn kanssa ja ilman sitä. Voidaan saada selville, onko syy tarpeellinen, riittävä tai peräti välttämätön seurausten tapahtumiselle. Testiolosuhteissa on helppo kontrolloida muuttujien määrää ja kausaalisuuden osoittaminen onnistuukin testiolosuhteissa usein. Näitä testejä ei tosin voida käyttää kaikkiin ongelmiin eikä kaikilla tieteenaloilla. Lisäksi testeissä tehtyjen löydösten yleistäminen on ongelmallista, sillä pelkästään testiolosuhteet saattavat muuttaa ihmisten käyttäytymistä.
Kausaalisuuden osoittamisen vaikeuksista huolimatta joillakin tieteenaloilla on valtava tarve rakentaa kausaalisia väittämiä. Esimerkiksi epidemiologian koko tieteenala on rakennettu kausaalisuuden ajatuksen varaan. Sen ytimessä on sairastumisen ja/tai tervehtymisen syiden löytäminen ja siksi kausaalisen kielen käyttäminen on tutkimuksissa yleistä. Lipton ja Ødegaard (2005) suosittelevat kuitenkin kausaalisuuden osoittamiseen liittyvien haasteiden takia kausaalisten ilmaisujen välttämistä tai todennäköisen kausaalisuuden käyttämistä. On tieteellisesti helpompaa todistaa, että jokin nostaa sairastumisen riskiä kuin aiheuttaa sen. Esimerkiksi väite “tupakointi nostaa syöpään sairastumisen todennäköisyyttä” on huomattavan paljon helpompi todistaa kuin “tupakointi aiheuttaa syöpää”. Todennäköisyysterminologian käyttäminenkään ei ole täysin ongelmatonta, sillä Toulmin (2015) varoittaa käyttämästä todennäköisyyskäsitettä liian kevyesti. Abstraktilla todennäköisyys-sanalla ei ole tarkkaa määritelmää. Sitä voidaan käyttää ilmaisemaan mielipiteen vahvuutta tai matemaattisia laskelmia. Jotkut ilmaisivat yhtä ja toiset toista. Todennäköisyyden avulla ilmaistut väitteet eivät aina kerro tosiasioista, vaan saattavat kuvata puhujan uskomuksia maailmasta. Jos joku sanoo, että asia on todennäköisesti tietyllä tavalla, niin hän saattaa tarkoittaa pelkästään luottavansa sen olevan niin. Olisi hyvä perustella mihin sana todennäköisyys viittaa.
Lopuksi
Kausaalisuudesta puhumisen välttely ei vie tiedettä eteenpäin. Tieteen tehtävänä on auttaa yhteiskuntaa ratkaisemaan ongelmia. Monella tieteenalalla tarvitaan kipeästi tietoa kausaalisuudesta (esimerkiksi taloustiede ja terveystiede). Kuten Searle (2015) argumentoi, kausaalisuus on osa maailmaamme huolimatta sen todistamisen vaikeudesta: “elämme kausaalisten kokemusten meressä”. Niiniluoto (1998) kirjoittaa, että hyvän tieteen tunnusmerkkinä on vaikuttaminen tulevaisuuteen. Tämä pitää sisällään ajatuksen kausaalisista mekanismeista. Tähän päämäärään on vaikeaa päästä, jos vältellään kausaalisuudesta puhumista. Cartwright (2009) on samoilla linjoilla, kun hän kirjoittaa, ettei riitä, että tieteellinen löytö on totta, sen pitää olla myös relevantti. Toisin sanoen yhteiskunta tarvitsee riittävän kausaalista tietoa. Mikä sitten, jos mikään, on riittävä todiste kausaalisuudesta? Kuten yllä on todettu, tilastollisesti tai metodologisesti kausaalisuutta on vaikeaa saada todistettua. Kausaaliset yhteydet ovat parhaimmillaankin vain teoriaan ja aiempiin havaintoihin pohjautuvia kuvauksia mekanismeista, joita on testattu tutkijan valitsemilla muuttujilla tietyissä olosuhteissa. Toki on aina mahdollista myös kausaalisten ilmaisujen loiventaminen vihjesanoilla kuten “voi”, “saattaa”, “näyttää” (Adams ym., 2017). Näiden sanojen avulla voidaan ilmaista epävarmuutta ja heikentää kausaalista väitettä. Tämän lisäksi voidaan puhua ainoastaan ilmiöiden välisestä yhteydestä. Voidaan sanoa, että ne “korreloivat”, “liittyvät yhteen”, “muuttuvat samanaikaisesti” yms. Tämä on kuitenkin lähinnä kikkailua ja ongelman kiertämistä.
Yksi ratkaisuehdotus on Willman-Iivarisen (2020a, 2020b) ehdotus ”riittävän kausaalisuuden” käsitteestä oikeuttamaan kausaalisen kielen käyttöä käyttäytymis-tieteellisissä tutkimuksissa. Willman-Iivarisen ehdotuksen mukaan riittävä pragmaattinen kausaalisuus syntyy, kun testataan empiirisesti teoriaan tai aiempiin tutkimuksiin perustuva hypoteesi, löydetään korrelaatio (tai muu kausaalisuusvihje) ja pystytään kuvaamaan kausaalinen mekanismi sekä sulkemaan pois muut mahdolliset selittävät tekijät.
Vaikka kausaaliset ilmiöt ovat osa arkikokemustamme, on hyvin mahdollista, että joitain kausaalisia ilmiöitä ei ikinä pystytä todistamaan tieteellisellä täsmällisyydellä. Kausaalisuuden aukoton todistaminen datan ulkopuolella on melko mahdotonta, koska datankin avulla todistaminen riippuu tutkijan tekemistä valinnoista, mukaan valituista muuttujista, niiden mittaamisesta, ajanjaksosta ja muuttujien määrittelystä. On kuitenkin olemassa valtava tarve kausaalisille väitteille ja tosiasiassa kausaalisuutta käytetään pohjana hyvin monissa tutkimuksissa. Tarvitaankin lisää akateemista keskustelua siitä, miten kausaalisuudesta voidaan tieteellisissä julkaisuissa puhua ja millaista on kausaalisuuden riittävä osoittaminen.
Abstract in English
Many studies attempt to describe why something happens and predict the effects of different actions. These descriptions and predictions are strongly based on the notion of causation, or causality. Empirical studies can show that there is a relationship between phenomena (for example correlation), but proving causality is not quite straightforward. Causal relationships cannot be expressed in the language of mathematics or statistics. Instead, causal language describes the mechanisms, causes, and consequences. Demonstrating causality goes far beyond the information available from the data. One needs to describe why something is happening, what is the cause, what is the consequence and what mechanism is there. This article discusses the problem of proving causality in practice.
Kirjoittaja
YTT Hanna Willman-Iivarinen on yrittäjä ja freelance-tutkija. Hannan yritys Miratio myy tutkimuksia, koulutuksia ja konsultointia. Tutkijana Hanna on erityisen kiinnostunut kuluttajien ja äänestäjien päätöksenteosta. Koulutusten toteutuksessa on paljon hyötyä HAMKissa hankituista opettajaopinnoista 2020.
Lähteet
Adams, R.C, Sumner, P. … & Bott, L. (2018). How readers understand causal and correlational expressions used in news headlines. Journal of experimental Psychology: Applied, 23(1), 1–14. https://psycnet.apa.org/doi/10.1037/xap0000100
Antonakis, J., Bendahan, S., Jacquart, P. & Lalive, R. (2010). On making causal claims: A review and recommendations. The Leadership Quarterly, 21(6), 1086–1120. https://doi.org/10.1016/j.leaqua.2010.10.010
Cartwright, N. (2004). Causation. One word, many things. Philosophy of Science, 71(5), 805–819. https://doi.org/10.1086/426771
Cartwright, N. (2006). Where is the theory in our “theories” about causality? Journal of Philosophy, 103(2), 55–66. http://dx.doi.org/10.1561/1400000045
Cartwright, N. (2009). Evidence-based policy: what’s to be done about relevance? Philosophical Studies, 143(1), 127–136. https://doi.org/10.1007/s11098-008-9311-4
Cartwright, N. (2010). Comments on Longworth and Weber. Analysis, 70(2), 325–330. https://doi.org/10.1093/analys/anp158
Cartwright, N. (2016). Where’s the Rigor When You Need It? Foundations and Trends® in Accounting, 10(2–4), 106–124. http://dx.doi.org/10.1561/1400000045
Cofield, S. S, Corona, R. V. & Allison, D. B. (2010). Use of causal language in observational studies of obesity and nutrition. Obesity Facts, 3(6), 353–356. doi: https://dx.doi.org/10.1159/000322940
Dowe, P. (1992). Wesley Salmons’s process theory of causality and the conserved quantity theory. Philosophy of Science, 59(2), 195–216. https://www.jstor.org/stable/188242
Dowe, P. (1995). Causality and conserved quantities: A reply to Salmon. Philosophy of Science, 62(2), 321–333. https://www.jstor.org/stable/188437
Glasziou, P. & Chalmers, I. (2018). Research waste is still a scandal. British Medical Journal, 363, 4645. https://doi.org/10.1136/bmj.k4645
Granger, C. W. J. (1988). Some recent development in a concept of causality. Journal of Econometrics, 39(1–2), 199–211. https://doi.org/10.1016/0304-4076(88)90045-0
Heckman, J. (2006). The Scientific model of causality. Sociological Methodology, 35(1), 1–97. https://doi.org/10.1111/j.0081-1750.2006.00164.x
Krieger, N. (1994). Epidemiology and the web of causation: has anyone seen the spider? Social science & medicine, 39(7), 887–903. https://doi.org/10.1016/0277-9536(94)90202-X
Kuorikoski, J. (2006). Syyt ja vaikutukset kvantitatiivisessa liiketaloustieteellisessä tutkimuksessa. Teoksessa K. Rolin, M.-L. Kaakkuri-Knuuttila & E. Henttonen (toim.), Soveltava yhteiskuntatiede ja filosofia (ss. 88–110). Gaudeamus.
Lipton, R. & Ødegaard, T. (2005). Causal thinking and causal language in epidemiology: it’s in the details. Epidemiologic Perspectives & Innovations, 2(1), 8. doi: https://dx.doi.org/10.1186%2F1742-5573-2-8
Niiniluoto, I. (1998). Kuuluuko tulevaisuuteen vaikuttaminen tieteen laatuvaatimuksiin. Futura, 17(4), 7–10. http://urn.fi/URN:NBN:fi:ELE-1036356
Parascandola, M. & Weed D. L. (2001). Causation in epidemiology. Journal of Epidemiology and Community Health, 55(12), 905–912. http://dx.doi.org/10.1136/jech.55.12.905
Pearl, J. (2009). Causality in the social and behavioral sciences. UCLA Cognitive Systems Laboratory Technical Report. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.154.446&rep=rep1&type=pdf
Phillips, C. V. & Goodman, K. J. (2006). Causal criteria and counterfactuals; nothing more (or less) than scientific common sense. Emerging Themes of Epidemiology, 3(1), 1–7. https://doi.org/10.1186/1742-7622-3-5
Rothman, K. J. & Greenland, S. (2005). Causation and causal inference in epidemiology. American Journal of Public Health, 95(S1), S144–S150. https://doi.org/10.2105/AJPH.2004.059204
Rubin, A. & Parrish, D. (2007). Problematic phrases in the conclusions of published outcome studies: implications for evidence-based practice. Research on social work practice, 17(3), 334–347. https://doi.org/10.1177/1049731506293726
Salmon, W. C. (1994). Causality without counterfactuals. Philosophy of Science, 61(2), 297–312. https://www.jstor.org/stable/188214
Salmon, W.C. (1997). Causality and Explanation: A reply to two critiques. Philosophy of Science, 64(3), 461–477. https://doi.org/10.1086/392561
Searle, J. R. (2015). Seeing things as they are: A theory of perception. Oxford University Press.
Shugan, S. M. (2007). Causality, Unintended Consequences and Deducing Shared Causes. Marketing Science, 26(6), 731–741. https://doi.org/10.1287/mksc.1070.0338
Stern, D. I. (2011). From correlation to Granger causality. Crawford School Research Paper No. 13. https://dx.doi.org/10.2139/ssrn.1959624
Thapa, D. K., Visentin, D. C., Hunt, G. E., Watson, R. & Cleary, M. (2020). Being honest with causal language in writing for publication. Journal of Advanced Nursing, 76(6), 1285–1288. https://doi.org/10.1111/jan.14311
Toulmin, S. (2015). Argumentit. Luonne ja käyttö (suom. T. Kilpeläinen). niin & näin.
Von Elm, E. & Egger, M. (2004). The scandal of poor epidemiological research. British Medical Journal, 329, 868–869. https://doi.org/10.1136/bmj.329.7471.868
Waldmann, M. R., Solstad, T. & Bott, O. (2017). Causality and causal reasoning in natural language. Teoksessa M. R. Waldmann (toim.), The Oxford handbook of causal reasoning. Oxford University Press.
White, P. A. (1990). Ideas about causation in philosophy and psychology. Psychological Bulletin, 108(1), 3–18. https://psycnet.apa.org/doi/10.1037/0033-2909.108.1.3
Willman-Iivarinen, H. (2.9.2020a). Kausaalisuuden riittävä osoittaminen? Tutkimusguru-blogi. https://tutkimusguru.blogspot.com/2020/09/kausaalisuuden-riittava-osoittaminen.html
Willman-Iivarinen, H. (2020b). Consumer media choice – towards a comprehensive model (Tampere University Dissertations 328) [Väitöskirja, Tampereen yliopisto]. Trepo. http://urn.fi/URN:ISBN:978-952-03-1739-3
Woodward, J. (2003). Making things happen – A Theory of Causal Explanation. Oxford University Press.
Yu, B., Yingya L. & Wang, J. (2019). Detecting Causal Language Use in Science Findings. Teoksessa K. Inui, J. Jiang, V. Ng & X. Wan (toim.), Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP) (ss. 4664–4674). Association for Computational Linguistics. http://dx.doi.org/10.18653/v1/D19-1473