Uudella klusterointimenetelmällä voidaan tunnistaa aiempaa helpommin ja luotettavammin niitä fyysisiä paikkoja, joissa kännykän käyttäjä liikkuu, todetaan Helsingin yliopistossa 21.3. tarkastettavassa FM Kari Laasosen väitöstutkimuksessa.
Matkapuhelinverkoissa tukiasemat palvelevat tietyllä alueella olevia puhelimia. Tukiaseman radiosignaalin kattamaa aluetta kutsutaan soluksi. Vaihtaessaan käyttämäänsä tukiasemaa puhelin tuottaa solusiirtymädataa, joka koostuu sarjasta solutunnisteita ja siirtymisaikoja. Vaikka data ei sisälläkään paikkojen koordinaatteja, siitä voidaan silti oppia tunnistamaan puhelimen käyttäjälle tärkeitä paikkoja sekä ennustamaan hänen liikkumistaan paikkojen välillä.
Väitöskirjatyössä sovellettiin tiedonlouhinnan menetelmiä solusiirtymädataan ja työn tavoitteena oli tuottaa työkaluja paikkatietoisten sovellusten kehittämiseen. Tällaisia sovelluksia ovat esimerkiksi opastus- ja muistutussovellukset, paikkatiedon välitys sosiaalisissa verkostoissa tai logistiikanhallinta. Saatuja tuloksia testattiin aineistolla, joka oli kerätty noin sadalta matkapuhelimen käyttäjältä. Kunkin käyttäjän solusiirtymätietoja kerättiin usean kuukauden ajan, jonka jälkeen vaikkapa tulevien paikkojen ennustamista voitiin verrata havaittuun liikkumiseen.
Solusiirtymädatassa on erityispiirteitä, jotka tekevät sen käsittelystä haastavaa. Yksi keskeinen ongelma on se, että solun vaihtuminen ei aina riipu käyttäjän liikkumisesta, vaan puhelin voi vaihtaa käyttämäänsä tukiasemaa myös muista syistä. Tämä voi johtua esimerkiksi tukiasemien kuormituksen vaihteluista. Vastaavasti yksittäisen solun sisällä on mahdollista liikkua jonkin matkaa ennen solun vaihtumista.
Solujen ja fyysisten paikkojen vastaavuuksien löytämiseksi työssä esitellään klusterointimenetelmä, joka yhdistää samaan paikkaan todennäköisesti liittyviä soluja suuremmiksi kokonaisuuksiksi eli klustereiksi. Kyseessä on niin sanottu online-algoritmi, joka analysoi solusiirtymävirtaa ja päivittää klusterien joukkoa reaaliaikaisesti. Klusteroinnista on kahdenlaista hyötyä: klusteri liittyy yksikäsitteisesti tiettyyn paikkaan, mikä mahdollistaa fyysisten paikkojen luotettavan tunnistamisen. Toiseksi, klusteroitu paikkatieto vie tilaa vain murto-osan alkuperäisestä, mikä helpottaa sen käyttöä vähillä resursseilla varustetuissa mobiililaitteissa.
Työn tuloksena syntyneet algoritmit voidaan toteuttaa käytännössä kaikilla älypuhelin- ja mobiililaitealustoilla, eikä niiden käyttö vaadi toimenpiteitä operaattorilta tai puhelinvalmistajalta. Koska menetelmät vaativat vain vähän puhelimen laskenta- ja tallennuskapasiteettia, käyttäjän paikkatietoja ei tarvitse lähettää puhelimesta eteenpäin jatkokäsittelyä varten. Tämä turvaa puhelimen käyttäjän yksityisyyttä, sillä käyttäjä voi päättää itse, kenelle ja kuinka paljon tietoja luovutetaan.
FM Kari Laasonen väitteli 21.3.2009 Helsingin yliopiston matemaattis-luonnontieteellisessä tiedekunnassa aiheesta "Mining Cell Transition Data". Vastaväittäjänä oli professori Dino Pedreschi (Università di Pisa, Italia) ja kustoksena professori Hannu Toivonen (Helsingin yliopisto).
Väittelijän yhteystiedot:
kari.laasonen [ä] iki.fi,
puh. +41 76 210 7233
Last updated on 31 Mar 2009 by Visa Noronen - Page created on 31 Mar 2009 by Visa Noronen