Poikkikielellinen semantiikka

Demo: Merkitykseen perustuva navigaatio

Visualisointidemossa jokaiselle dokumentille on muodostettu automaattinen kuvaus moniulotteisessa käsiteavaruudessa. Tässä esimerkissä tarkastelussa on satunnainen otos, joka on muodostettu "Barack Obama" -haun tuloksista.

Kun siirrät hiiren "Merkittävimpiä käsitteitä" -listan käsitteen ylle, käsitteeseen kuuluvat dokumentit maalautuvat visualisoinnissa. Kun siirrät hiiren tietyn dokumentin ylle, järjestelmä listaa siinä esiintyvät merkittävimmät käsitteet "Dokumentin käsitteet"-otsikon alla. Dokumenttipallon klikkaaminen avaa kyseisen linkin.

Visualisoinnista

Dokumenttien sijoittelu visualisoinnissa lasketaan kunkin dokumenttiparin keskinäisen käsite-etäisyyden perusteella. Semantiikaltaan samankaltaiset dokumentit ryhmitellään yhteen ja toisistaan käsitteellisesti etäällä olevat pyritään erottamaan toisistaan. X/Y-akseleilla ei ole itsessään mitään merkitystä, niitä käytetään vain dokumenttien suhteellisten etäisyyksien havainnollistamiseen. Läheisyys on yhtä kuin samankaltaisuus.

Huom. Vaikka ulottuvuusredusointi hyvin moniulotteisesta avaruudesta kahteen ulottuvuuteen pyrkiikin säilyttämään alkuperäiset parittaiset etäisyydet niin pitkälle kuin mahdollista, menetelmä joutuu tyypillisesti tekemään joitakin paikallisia uhrauksia. Tällöin etäisesti samankaltaiset dokumentitkin saattavat joutua lähelle toisiaan, sillä ne ovat vieläkin kauempana kaikista muista. Epätäydellinen sisältöön kuulumattoman aineksen siivous satunnaisesti valituille sivuille saattaa myös joskus johtaa semantiikan määritystä harhaan. M-Brainin tuotantoprosessissa ihmisäly hioo tässä vaiheessa tuotteen lopulliseen muotoonsa.

M-Brain Media Oy
Siirry sivuillemme tästä