Big data

Iso haloo isosta datasta

Sampo Sauri & Juuso Viitanen

Ilkka Malin & Hanna-Mari Kuivalainen

Big datasta on kohistu jo muutaman vuoden ajan. Sille on asetettu suuria toiveita tehostaa ja muuttaa liiketoimintaa melkein alasta riippumatta, mutta koko ilmiöstä on vaikea saada konkreettista otetta. Mistä big datassa on kyse? Mitä se on?

bigdata_1

Yksiselitteisen vastauksen l√∂yt√§minen on vaikeaa. “Big data k√§sitteen√§ on niin yleinen ja ep√§m√§√§r√§inen ett√§ sille ei ole universaalia m√§√§ritelm√§√§”, selitt√§√§ big data ‚Äďkonsultointia ja koulutusta tarjoavan Ivorion Immo Salo. Konkreettinen tapa hahmottaa dataa ja sen hy√∂dynt√§mist√§ on jakaa data kahteen eri osa-alueeseen: digitaaliseen ja sensoriseen dataan. Digitaalisella datalla viitataan internetist√§, yh√§ useammin sosiaalisesta mediasta, l√∂ytyv√§√§n dataan. Sensorinen data on erilaisten mittalaitteiden meit√§ ymp√§r√∂iv√§st√§ todellisuudesta tuottamaa dataa, esimerkiksi l√§mp√∂-, kosteus- ja tuulimittareista tai liikkeentunnistimista tulevaa mitattavaa dataa.

Sensorista dataa on pääsääntöisesti helpompi käsitellä kuin sosiaalisesta mediasta tulevaa digitaalista dataa. Jälkimmäinen koostuu pääsääntöisesti tekstistä, kuvista ja videoista. Esimerkiksi Facebookissa teksti on lukuisilla eri kielillä ja lisäksi usein puhekieltä, mikä hankaloittaa sen analysointia.

Pekka Lehti datal√§ht√∂ist√§ ohjelmistokehityst√§ tekev√§st√§ Valuemotivesta m√§√§rittelee termin teknisemmin. “T√§n√§ p√§iv√§n√§ big data tarkoittaa yhteiskunnallisia ja liiketoiminnallisia mahdollisuuksia innovoida ja toteuttaa uudenlaisia datal√§ht√∂isi√§ palveluita ilman datan m√§√§r√§√§n, monimuotoisuuteen tai saantinopeuteen liittyvi√§ teknologisia rajoituksia. Big data, aivan kuten sen sisarilmi√∂t sosiaalinen media, mobiilius ja pilvipalvelut, tulevat muuttamaan useita nykyisi√§ toimialoja ja luomaan kokonaan uutta liiketoimintaa.”

Tieto auttaa ennakoimaan

Teollisuuden laitteet ja niitä valvovat sensorit kytketään yhä useammin tietoverkkoihin. Kun niiden keräämää dataa analysoidaan, voidaan kokonaisia järjestelmiä optimoida ja virheitä ennakoida. Tätä kutsutaan teolliseksi internetiksi tai koneiden internetiksi. Teollisuudessa suuret suomalaisyrityksetkin sujuvoittavat prosessejaan big dataa hyödyntämällä. Maailmanlaajuisesti alan edelläkävijä on yhdysvaltalainen General Electric.

“Ennakoiva huolto kytkeytyy big data -ilmi√∂ss√§ sensoriseen dataan: KoneCranes mittaa nostureita, Kone hissej√§ ja W√§rtsil√§ laivojen moottoreita lukuisilla sensoreilla. N√§iden sensoreiden avulla voidaan ennakoida laitteiden vikaantumista ja korjata tai ennaltaehk√§ist√§ niiden vikaantumista ennen kuin vikoja ilmenee. T√§m√§ s√§√§st√§√§ kustannuksia”, Immo Salo kertoo.

Seuraava iso juttu

Entä mitä seuraavaksi? Sekä digitaalisen että sensorisen datan puolella tietomäärät kasvavat kiihtyvällä tahdilla, ja niiden pohjalta kehittyvät myös palvelut. Pekka Lehden mukaan big datan avulla toimivat palvelut kehittyvät tarjoamaan käyttäjilleen kokemuksia, joita he eivät vielä tienneet haluavansa.

“Datal√§ht√∂inen palvelu vie my√∂s loppuk√§ytt√§j√§kokemuksen askelta pidemm√§lle. Sen perusteella millainen olet, miss√§ olet ja mit√§ parhaillaan teet, voi √§lyk√§s palvelu ehdottaa sinulle ‚ÄĚp√§√§t√∂ksi√§‚ÄĚ siit√§, mit√§ sinun mahdollisesti kannattaisi tehd√§ seuraavaksi. K√§ytt√§j√§n teht√§v√§ksi j√§√§ sitten ehdotusten hyv√§ksyminen. Esim. henkil√∂kohtaisessa markkinoinnissa vain korttelin p√§√§ss√§ minusta juuri nyt oleva parturiliike voisi l√§hett√§√§ puhelimeeni erikoistarjouksen, perustuen aiempien hiustenleikkausteni v√§lill√§ tyypillisesti kuluvaan aikaan, sosiaalisessa mediassa aiemmin antamaani positiiviseen palautteeseen sek√§ siihen, ett√§ vapautin t√§ydest√§ kalenteristani juuri hetki sitten seuraavan tunnin.‚ÄĚ

“Seuraava iso juttu on √§lykk√§√§t koneet, laitteet jotka eiv√§t vain sy√∂t√§ dataa ns. big data ‚Äďty√∂kaluille, vaan my√∂s vastaanottavat sielt√§ toimintaohjeita, jotka auttavat niit√§ toimimaan √§lykk√§√§sti”, ennustaa Immo Salo. H√§n ei ole ennustuksessaan yksin: Gartnerin arvion mukaan √§lykk√§ill√§ koneilla eli ‚ÄĚsmart machines‚ÄĚ -ilmi√∂ll√§ on syv√§ vaikutus maailman talouteen jo vuoteen 2020 menness√§.

Ulkoistettuja päätöksiä

Liiketoimintaa tehd√§√§n yh√§ enemm√§n data edell√§. Suuntausta kutsutaan termill√§ ‚ÄĚevidence-based decision-making‚ÄĚ, eli todisteisiin pohjaava p√§√§t√∂ksenteko. “P√§√§t√∂ksenteossa siirryt√§√§n intuitiosta ja arvailusta faktapohjaiseen p√§√§t√∂ksentekoon ja pitk√§ll√§ aikav√§lill√§ yh√§ enemm√§n automatisoituun p√§√§t√∂ksentekoon, miss√§ ihmisell√§ ei v√§ltt√§m√§tt√§ ole niin keskeist√§ roolia kuin t√§ll√§ hetkell√§”, Immo Salo povaa. Tarvitaanko tulevaisuudessa v√§hemm√§n johtajia?

Työryhmä pohtii big datan käyttöä

Liikenne- ja viestint√§ministeri√∂ on asettanut ty√∂ryhm√§n valmistelemaan big datan hy√∂dynt√§mist√§ ja kehittymist√§ edist√§vi√§ toimia Suomessa. Big dataa pidet√§√§n yhten√§ taloudellisen kasvun avainteknologiana, ja arviot sen markkinoiden arvosta vaihtelevat noin 15‚Äď50 miljardin euron v√§lill√§.
Työryhmän tarkoituksena on luoda kokonaiskuva big datan käytöstä ja esittää näkemys toimista, joilla parantaa datan tehokasta käyttöä yhteiskunnan eri osa-alueilla.
Työryhmän on määrä saada työ valmiiksi 30. kesäkuuta 2014 mennessä. Immo Salo ja Pekka Lehti ovat työryhmän jäseniä.

Mainettaan isompi Big Data

Yritysten saatavilla oleva ja kerätty datamäärä kasvaa vuosi vuodelta enemmän. Kuluvan vuosikymmenen aikana datamäärän kasvun oletetaan olevan jopa 50-kertainen, mutta Suomessa tätä suurta tietomäärää ei osata vielä hyödyntää tarpeeksi.

Big dataa, eli kykyä hyödyntää suuria ja monimuotoisia digitaalisia tietomassoja, pidetään yhtenä taloudellisen kasvun avainteknologiana. Tällä hetkellä arviot big datan markkinoiden arvosta vaihtelevat 15-50 miljardin euron välillä. Aihe on noussut myös Liikenne- ja viestintäministeriön KIDE-ohjelmassa avoimen datan teeman rinnalle.

Vuoden 2013 lopussa Liikenne- ja viestintäministeriön asettaman big data -työryhmän tarkoitus on luoda näkemys kansallisista edistämistoimista, joilla parantaa edellytyksiä eri Iähteistä saatavan datan tehokkaaseen ja innovatiiviseen käyttöön. Tavoitteena on, että yhteiskunnan eri sektoreilla pystyttäisiin entistä paremmin hyödyntämään tietoaineistoja.

NOPEA REAGOINTI ELINT√ĄRKE√Ą√Ą

Työryhmän jäsen Rovio Entertainmentin tutkimusjohtaja Veikko Hara perää nykypäivänä nopeaa reagointia erityisesti kuluttajilta saataviin palautteisiin.

‚ÄĚYhdysvalloissa yritykset ovat ottaneet etumatkaa, kun katsoo kuluttajak√§ytt√§ytymisi√§ ja niiden hy√∂dynt√§mist√§. Kuluttajapalaute on yrityksille elint√§rke√§√§ t√§n√§ p√§iv√§n√§. Jos palautetta on ennen tullut suuri√§ m√§√§ri√§, niin sit√§ ei olla pystytty reaaliaikaisesti k√§sittelem√§√§n. On voinut menn√§ viikkoja tai jopa kuukausia saadun tiedon k√§sittelyss√§. Analysointi on t√§rke√§√§ tehd√§ nopeasti.‚ÄĚ

Haran mukaan kuluttajilta saatavaa palautetta ei ole kyetty hyödyntämään vielä Suomessa, eikä edes koko Euroopan mittakaavalla tarpeeksi. Vaikka EU tuottaa yhteensä noin 20% maailman BKT:stä, maailman 20 isoimman big dataa hyödyksi käyttävän yrityksen joukossa on vain kaksi eurooppalaista yritystä.

‚ÄĚKyse on siit√§, miten saadaan prosessoitua sit√§ massaa. On se Rovio tai mik√§ yritys tahansa. Jos tavaraa tulee, on pakko saada reagoitua.‚ÄĚ

TEKO√ĄLY HY√ĖTYK√ĄYTT√Ė√ĖN

Yksi osa big dataa on verkkoliikenne. Nykyään on mahdollista käsitellä aivan jokainen verkon tapahtuma, jolloin yrityksillä on analysoitavanaan satoja kertoja enemmän tapahtumia kuin ennen. Samalla nähdään, mitkä verkon tapahtumat toimivat ongelmitta ja mitkä eivät.

Nokia Siemens Networks kehittää tekoälyä, joka kykenee nopeaan ja ennakoivaan etähuoltoon.

‚ÄĚTele- ja mobiiliverkkojen hallinnassa t√§h√§n asti perinne on ollut se, ett√§ silloin kun joku menee pieleen tai jokin toiminto ei onnistu, siit√§ ilmoitetaan, jotta siihen voidaan sitten reagoida. T√§m√§ reagointi on aikaisemmin tarkoittanut k√§yt√§nn√∂ss√§ sit√§, ett√§ t√§t√§ monimutkaista ongelmaa ratkomaan on tarvittu siihen p√§tev√§ henkil√∂. Ensin joudutaan paikantamaan ongelma, jonka j√§lkeen p√§√§st√§√§n vasta ratkaisemaan sit√§‚ÄĚ,kertoo NSN:n Markku Rauhamaa.

NSN kutsuu tekoälyprojektiaan nimellä Service Productivity Learning Machine.

‚ÄĚParhaimpien eksperttien kokemukset vied√§√§n Learning Machineen ja huoltohenkil√∂n ty√∂ automatisoidaan teko√§lyksi. Kaikkea tietoliikennett√§ seurataan automaattisesti ja samalla kone oppii sen, mik√§ on vaarallista. T√§m√§ sitten indikoidaan. Tuossa on ongelmatilanne ja n√§in se voidaan ratkaista‚ÄĚ, Rauhamaa selitt√§√§.

Tekoäly oppii luokittelemaan ja monitoroimaan toistuvia malleja, tekemään ehdotuksia sekä kerättyä tietoa verkosta kerätystä datasta.

‚ÄĚN√§in p√§√§st√§√§n p√§ivien ty√∂st√§ ja yksitt√§isist√§ eksperteist√§ siihen, ett√§ voidaan sekunneissa tai minuuteissa ratkoa n√§m√§ ongelmat‚ÄĚ, Rauhamaa selvent√§√§.

bigdata_bg1

Tietoliikenteen ammattilainen keskiössä

‚ÄĚErilaisista mittalaitteistoista tulevan tiedon yhdist√§minen toisten mittalaitteistojen tietoihin ja siit√§ seuraavien oikeiden johtop√§√§t√∂sten tekeminen vaatii edelleen sit√§ inhimillist√§ asiantuntemusta,‚ÄĚ painottaa Metropolia ammattikorkeakoulun lehtori Aarne Klemetti.

Klemetti painottaa myös, että big data näkyy tulevaisuudessa tavallisen kuluttajan arjessa eri tavoin:

‚ÄĚSe ei mene niin, ett√§ k√§ytt√§j√§ olisi n√§iden j√§rjestelmien k√§yt√∂n asiantuntija, vaan ett√§ j√§rjestelm√§t olisivat k√§ytt√§jien asiantuntijoita ja antaisivat tarvittavaa apua ja ohjausta. Ja se apu mik√§ tulee, perustuu siihen big dataan. Big data j√§√§ ik√§√§n kuin n√§kym√§tt√∂m√§ksi k√§ytt√§j√§lle. T√§m√§n kautta n√§en, ett√§ se hy√∂ty tulee perusk√§ytt√§j√§lle‚ÄĚ, Klemetti jatkaa.

Pahimpia esteitä ei olla kuitenkaan vielä ylitetty ja yksi niistä on se, että miten saatu tieto jäsennellään yhdenmukaisesti saavutettavaksi. Rima on siis korkealla, mutta vuoretkin on tehty kiivettäviksi.

dataliikenne_sin-03

Vuonna 2014 verkkoon yhdistet√§√§n keskim√§√§rin 99 “asiaa” tai esinett√§ (objects) per sekunti. Vuorokaudessa se tarkoittaa noin 8,6 miljoonaa uutta luotua yhteytt√§. N√§ist√§ luoduista yhteyksist√§ jokainen tuottaa lis√§√§ dataa verkkoon.

Vuosikymmenen loppuun menness√§ luotavien yhteyksien m√§√§r√§ per sekunti uskotaan olevan jo yli 250kpl. N√§in ollen, vuonna 2020 Cisco arvioi, ett√§ verkkoon olisi kytkettyn√§ yli 50 miljardia ‚ÄĚasiaa‚ÄĚ.