Maailmassa on 30 zetabittiä tietoa – ja sen jalostaminen tekoälyn avulla olisi kansallinen kilpailuvaltti

Valtaosa digitaalisesta tiedosta on irrallista ja hajallaan. Se voidaan järjestää hyötykäyttöön.

Maailmassa on tämän vuoden lopussa 30 zetabittiä digitaalista tietoa, arvioi konsulttiyhtiö IDC. Zeta on tuhat seitsemänteen potenssiin, ja yksi zetabitti on 1 000 000 000 000 000 000 megatavua.

Uutta tietoa tuottavat niin yritykset, julkinen sektori kuin tavalliset kansalaisetkin.

Valtaosa tiedosta on luotu johonkin tarkoitukseen, mutta sen luonnetta ja tarkoitusta ei ole tarkkaan kuvattu. Tietoa ei myöskään linkitetä muuhun tietoon.

Tällöin puhutaan strukturoimattomasta tiedosta. Sen määrä kasvaa eksponentiaalisesti. Arvioiden mukaan kaikesta digitaalisesta datasta yli 80 prosenttia on strukturoimatonta tietoa.

Sellaista syntyy, kun julkaisemme valokuvia Instagramissa, osallistumme chat-keskusteluihin ja teemme Facebook-päivityksiä. Kuluttajina arvioimme netissä tuotteita ja palveluita TripAdvisorissa sekä kommentoimme median juttuja.

Yritykset puolestaan tuottavat runsaasti pdf-tiedostoja, videotallenteita, asiakaspalvelupuheluiden tallenteita ja yhä enemmän teollisen internetin sensoritietoa.

Strukturoimaton tieto on pitkälti hyödyntämätön resurssi. Edelläkävijöitä ovat Googlen kaltaiset yritykset, jotka keräävät strukturoimatonta dataa internetistä ja jalostavat siitä tekoälyn avulla strukturoitua tietoa.

Strukturoinnissa hyödynnetään käyttäjien hakuja. Niiden avulla tekoälyalgoritmit osaavat päätellä, mistä tiedosta on kova kysyntä.

Strukturoimattomasta tiedosta voidaan jalostaa – jopa reaaliaikaisesti – merkityksellistä, arvokasta ja kilpailuetua tuottavaa tietoa yritysten käyttöön. Tarvittava teknologia ja työkalut ovat olemassa, sillä viime vuosina laskentateho on kasvanut valtavin harppauksin ja algoritmit ovat kehittyneet.

Suomella on edellytykset olla eturintamassa strukturoimattoman tiedon jalostajana ja hyödyntäjänä.

Tekoälyn avulla voidaan jo nyt ymmärtää luonnollista kieltä, tunnistaa hahmoja sekä löytää ja analysoida merkityksiä tietomassoista. Kun tämä analyysi yhdistetään olemassa olevaan strukturoituun tietoon, saadaan tulokseksi aiempaa monipuolisempi ja nopeampi näkemys päätöksenteon pohjaksi.

Yritysten verkkosivutietoja, median uutisia ja sosiaalisen median keskusteluja analysoimalla voidaan esimerkiksi määritellä yritysten todellinen toiminta-alue paljon täsmällisemmin kuin kaupparekisteri-ilmoituksen strukturoidusta tiedosta voidaan lukea.

Tästä on hyötyä esimeriksi yrityksille, jotka myyvät palveluita muille yrityksille. Vaikkapa vakuutusyhtiöt voivat suunnata markkinointiaan juuri oikeille yrityksille.

Parhaimmillaan strukturoimattoman tiedon jalostaminen tekoälyllä voi vaikuttaa merkittävästi jopa kansalliseen kilpailukykyyn.

Oletetaan, että samaan ekosysteemiin saataisiin nyt hajallaan oleva tieto esimerkiksi metsänkasvusta, säätilasta, puukaupasta, puunkorjuuseen liittyvien ajoneuvojen paikkatiedosta, metsäyhtiöiden raaka-aineen tarpeesta, tehtaiden käyttöasteesta sekä tuotteiden kansainvälisestä kysynnästä ja hinnoista. Koko metsäteollisuuden toimitusketjun mallintaminen auttaisi näin säästämään resursseja ja optimoimaan toimintaa.

Suomella on edellytykset olla eturintamassa strukturoimattoman tiedon jalostajana ja hyödyntäjänä. Meillä on vuosikymmenien historia tekoälyn ja koneoppimisen tutkimuksesta. Tutkimuksessa me olemme maailman kärkeä.

Kilpailuetua tuo myös se, että meillä on hyvää osaamista teollisen internetin IoT-tiedon ja sosiaalisen median datan hyödyntämisessä. Suomalaiseen ”pienuuden ekonomiaan” sopivat hyvin tekoälyn hyödyntämisessä tärkeät ketterät kokeilut. Niistä meillä on kokemusta mm. pelikehityksessä.

Suomen ehkä paras valttikortti strukturoimattoman tiedon suurvalta-asemaa tavoiteltaessa on maine luotettavana ja läpinäkyvänä maana. Vakavimmat epäilyt strukturoimattoman tiedon hyödyntämiseen liittyvät nimittäin eettisiin kysymyksiin. Millaista tietoa kerätään, kunnioitetaanko kansalaisten yksityisyyden suojaa ja mitä tiedoilla tehdään?

Keväällä voimaan tullut EU:n tietosuoja-asetus GDPR on tässä kansalaisten turvana, sillä se rajaa tiukasti yksityistä ihmistä koskevan tiedon käyttöä. Yksityisyyden suoja on huomioitava myös strukturoimattoman tiedon käytössä.

Suomessa pitäisikin luoda eettiset koodit strukturoimattoman tiedon hyödyntämiseksi. Niiden olemassaolo lisäisi suomalaisten yritysten uskottavuutta ja voisi houkutella tänne kansainvälisiä toimijoita turvalliseen toimintaympäristöön.

Näin varmistettaisiin myös se, että suomalaisilla yrityksillä olisi kykyä hyödyntää dataa liiketoiminnassaan, emmekä olisi tulevaisuudessa vain isojen amerikkalaisten yritysten armoilla.

Kirjoitus on alun perin julkaistu Talouselämässä 9.9.2018.

Tilaa ilmoitukset
Ilmoita kun
guest
2 Kommenttia
vanhimmat
uusimmat suosituin
Inline Feedbacks
View all comments
mijus
mijus
3 vuotta sitten

Miten zetabitti voi olla 1 000 000 000 000 000 000 megatavua? Taitaa nyt mennä bititi ja tavut sekaisin koko jutussa. IDC raportoi maailman tietomäärän aina zettatavuissa.

etuliite
etuliite
3 vuotta sitten

ja suomeksi se on tsettatavu (engl. zettabyte, ei zetabyte)