<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=267448967019753&amp;ev=PageView&amp;noscript=1">

Blogi

Ennakoivan analytiikan kuuma syksy: Python ja R Qlikissä ja Alteryxissa

Näin syksyn kynnyksellä business intelligence -maailmassa eletään jännittäviä aikoja. Qlik Senseen on tulossa vihdoinkin jo pitkään uumoillut R- ja Python-toiminnallisuudet, ja Alteryx on myös saamassa oman Python-työkalunsa. Molemmat firmat tähtäävät kesäkuun julkaisuun, eli näiden tulisi olla jokaisen käytettävissä piakkoin. Näin Python-miehenä tämä lämmittää mieltäni ja sieluani. Tässä blogissa kerron vähän omista ennakkofiiliksistäni R- ja Python-laajennuksista.

Alteryx

Aloitetaan vaikka Alteryxilla. R on ollut jo pitkään suuressa roolissa Alteryxin ennakoivassa analytiikassa. Sinänsä Python ei siis tuo mitään suurta ja mullistavaa Alteryxiin, vaan se on lähinnä yksi työkalu muiden joukossa. Pythonin käyttö on periaattessa onnistunut aiemminkin Run Command -työkalulla, mutta nyt tämä integraatio antaa Python-osaajille mahdollisuuden hyödyntää omaa tietämystään suoraan Alteryxin sisältä. Python on kuitenkin erilainen kieli kuin R (ohjelmointikieli vs. tilastolliseen analytiikkaan tarkoitettu skriptikieli), joten se voi soveltua joihinkin tehtäviin paremmin kuin R.

Omat odotukset liittyvätkin tällä hetkellä pääosin oman osaamiseni hyödyntämiseen (“tämän tekisin muutamalla rivillä Pythonia…”) ja Alteryxista puuttuvien toimintojen laajentamiseen. Esimerkiksi omien kokemusteni perusteella Alteryxilla on hivenen työlästä pelata XML-tiedostojen kanssa, varsinkin niiden luomisen kanssa. Kaiken kaikkiaan odotankin innolla pääseväni puuhaamaan Python-työkalun kanssa ja näkemään, mitä kaikkea sillä saakaan aikaan Alteryxin kanssa.

Qlik Sense

R:n ja Pythonin tuleminen Qlik Senseen onkin suurempi juttu kuin Alteryxin Python-työkalu. Qlikin yksi suurimpia heikkouksia nykyisessä BI-markkinaympäristössä on juurikin ennakoivan analytiikan puuttuminen, ja tätä puutetta paikkaamaan R/Python-integraatio on enemmän kuin tarpeen.

Ensimmäisessä vaiheessa ennakoiva analytiikka on vain visualisointipuolella. Toiminnallisuus mahdollistaa esimerkiksi valinnoista riippuvien suoran sovituksien tai klusterointien tekemistä. Laskenta tapahtuu “lennosta”, ja R:llä tai Pythonilla tehtyjä laskentoja ei saa takaisin tietomalliin. Tässä vaiheessa analytiikka käytännössä rajoittuu vain kevyeeseen laskentaan. Ennakoivan analytiikan mallit ja raskaampi laskenta kannattaa yhä tehdä muilla työkaluilla, kuten Alteryxilla. Myös "in-house" tehty R- ja Python-kehitystyökään tuskin menee hukkaan Sensen jatkokehitystä ajatellen. Tulevaisuudessa R ja Python toivottavasti saadaan yhdistymään tietomalliin, muuten ennakoivan analytiikan hyödyntäminen jäänee melko heikolle tasolle.

Ennen kuin pystyn tarkemmin sanomaan R.n ja Pythonin toimivuudesta Sensessä, minun pitäisi päästä ensin hypistelemään laajennusta käytännössä. Toiminnallisuus vaikuttaa kyllä hyödylliseltä ja tarpeelliselta, ainakin teoriassa. Itse toivoisin R:n ja Pythonin integroimista myös suoraan Sensen skriptipuolelle. Muutamassa asiakastapauksessa lyhyestä Python-skriptistä data load -vaiheessa olisi ollut erittäin suuri apu (nämä tapaukset ratkesivat kyllä, vaikkakin siinä sai käyttää vähän luovuutta). Joka tapauksessa odotan suurella mielenkiinnolla R:ää ja Pythonia.

Summa summarum

Alteryxiin siis tulossa Python-työkalu, joka tekee Pythonin käytön helpommaksi. Qlik Senseen on tulossa R- ja Python-laajennukset, jotka mahdollistavat ennakoivan analytiikan Sensessä (tosin aluksi vain laskennallisesti kevyisiin operaatioihin). Omat odotukseni ovat melko korkealla ja näen tässä uusia ja hyviä työkaluja datan kanssa puuhaamiseen, ja varmasti nämä työkalut tulevat tarpeeseen.

KIRJOITTAJA
Petteri Karsisto
Kirjoittaja on suoraan koulun penkiltä BI-maailmaan lennähtänyt ilmakehätieteilijä - eli tuttavallisemmin meteorologi - ja latinisti.
MUITA BLOGIKIRJOITUKSIA
KIRJOITTAJA: Aleksi Hellman
"Merta edemmäs kalaan"
KIRJOITTAJA: Petteri Karsisto
Yhdessä lastensairauksia voittamassa