
Tuija Aalto seuraa digimediaa työkseen ja huvikseen.
Täggääminen edistää yhteisöllisyyttä, koska se auttaa asioista samoin ajattelevia löytämään toisensa, sanoo David Weinberger, Harvardin Berkman Center for Internet and Societyn tutkija.
"Some have criticised tagging as being too imprecise or ambiguous but Mr Weinberger is not concerned that one person may tag, say, a Stephen King story as "horror" while someone else calls it "ghost story". "Tagging allows social groups to form around similarities of interests and points of view. If you're using the same tags as I do, we probably share some deep commonalities," he told Pew Internet. (BBC: Tagging 'takes off for web users')
Oletko sinä tägännyt jotain tänään? Minä merkkasin ohimennen muutamia asiasanoja pariin Flickr-kuvaani, samoin ohimennen talletin muutaman artikkelin del.icio.usiin ja taisinpa gmail-tililläkin yhden tärkeän viestin leimata otsikkotermillä, jonka alta tiedän sen tarvittaessa löytäväni.
BBC:n artikkelin mukaan tuore amerikkalaistutkimus kertoo, että reilu neljännes amerikkalaisista internetin käyttäjistä oli joskus merkannut jotain. Nytkö kohta meillä on se semanttinen web, josta akateemikot haaveilevat?
Kommentit
Avainsanoitin Flickr-kuvia
Avainsanoitin Flickr-kuvia tänään reippaasti minäkin, se tuntuu hyödylliseltä. Vielä kun entistä useampi oppisi avainsanoittelun taidon, niin kiinnostavat kuvat löytyisivät helpommin. Ja entistä useampi kotimainen sivu ottaisi avainsanat käyttöönsä. Ehkä joskus kaukana tulevaisuudessa kotimaiset sanomalehdetkin lisäävät nettiuutisiinsa avainsanoja, toivoisin sitä ainakin.
Avainsanoilla on kyllä kääntöpuolensakin, Flickr rajoitti äskettäin avainsanojen määrän 75 kappaleeseen per kuva, jotteivat hieman turhan innokkaat käyttäjät enää tarjoaisi kuviaan satoihin eri avainsananäkymiin. Joilla ei välttämättä enää itse kuvan aiheen kanssa ollut mitään tekemistä.
Avainsanoittaja minäkin
Itse katson helpottavani ennen kaikkea omia hakujani kun hakkaan noita avainsanoja flickriin ja del.icio.usiin. Sellaisen hauskan pikkudetaljin huomasin tuolla flickrin tägeissä, että järjestelmä kertoo jos olet ainoa kyseistä tägiä käyttänyt käyttäjä. Raflaava esimerkki - safe for work kuitenkin :)
Kirjanmerkkejä
Tulin tänään laittaneeksi jonkun linkin del.icio.usiin. Tägit luovat turvallisen tunteen siitä, että asia on tallessa ja mahdollista löytää myöhemmin, vaikkei sitä todellisuudessa koskaan etsisikään. Enemmän olen tänään hyötynyt toisten tägeistä, joita seuraamalla on löytynyt mielenkiintoisia juttuja.
Semanttiseen webbiin taitaa kuitenkin olla vielä matkaa, vaikka ahkera täggääminen voi sen tuloa vähän vauhdittaakin.
Semanttinen Web ehkä lähempänä Web 4.0:aa kuin 2.0:aa
Matkalla kohti semanttisempaa webiä olemme toki, mutta vasta kun automaattinen tagien laittelu alkaa kasvamaan, niin alamme tosiaan edetä semanttisen webin tiellä. Ihmisten tekemä tagittaminen ja sisällön kuvailu on vasta "ihan kiva juttu" asteella, mielestäni. Ennenkuin tätä ihmisten ryhmässä puuhastelua ruetaan hyödyntämään automaattisesti ja laajassa mittakaavassa, niin esim nämä social bookmarking palvelut ovat aika tyhmiä. Esim StumbleUpon (www.stumbleupon.com) on kai ainut joka oikeasti käyttää automaattisesti hyväkseen tätä ihmisten tekemää kategorisointia. Mutta ei sekään osaa soveltaa sitä tietoa uusiin kohteisiin...
Mutta pitää nauttia nyt tästä tagittelusta, tai leimaamisesta, tai otsikoinnista, tai kategorisoinnista... Tosin itse pidän kyllä täysin vapaata tagittelua jotenkin rikkinäisenä konseptina. Se on tärkeää ja täydentävää, mutta tagittamisen pitäisi kuitenkin aina ensisijaisesti perustua jonkinlaiseen yhteisesti sovittuun sanastoon (ja vasta toissijaisesti täysin itse määriteltyihin sanoihin). Esim Stumblessa kaikki saitit merkataan kuuluvaksi johonkin kategoriaan (valmis lista) ja sitten vasta kuvailua laajennetaan käyttäjän omilla tageilla. Tällaista yhteistä sanastotyötä tarvittaisiinkin paljon enemmän kuin mitä sitä nyt tehdään.
Jos maailmassa oisi kahva..
Täytyy ymmärtää, että kun puhutaan täggäämisestä, puhutaan kielestä ja kielen perustavaa laatua olevista ominaisuuksista, kuten siitä, että se on samaan aikaan poissulkevaa että inklusiivista. Joku voisi sanoa, että se johtuu kielen metaforisesta luonteesta. Samoin on kai hyvä ymmärtää, että ihminen voi muokata kieltä ja sen käyttöä, kieli ja sen käyttö voi muokata ihmisen havaintoa todellisuudesta, tai jotain sinnepäin.
Mielestäni tärkeintä täggäämisen yhteydessä pitäisi ymmärtää, että mikä on verbaalisten luokittelujärjestelmien, nimeämisen, lajittelun, kategorioiden, yms. olemassa olon kulttuurilliset ja sosiaaliset syyt? Weinbergerin läppä on ihan oikeassa, mutta kyseiset asiat ovat jo aika lailla pitkälle vietyjä tapoja järjestää asioita ja todellisuudessa on olemassa parempiakin, "matalamman" tason tapoja järjestää juttuja.
PerttuT, kun väität, että pitäisi tehdä sanastotyötä, kerropa minulle fiksuna, kuka tuota sanastotyötä sitten tekisi? Ja vielä oikeammin, voisitko määritellä, mitä kaikkea tuo sanastotyö sisältää? Ja lopuksi, minkälaisia ennakko-oletuksia maailmasta, kielestä, kulttuurista ja asiantuntemuksesta ajatus "sanastotyöstä" pitää sisällään? Aina voi elätellä kuvitelmia utopiasta, jossa asiat pysyvät oikeissa karsinoissa. Todellisuus on kuitenkin toisenlainen.
Tuija, jos haluaa ymmärtää, mistä täggäämisessä on kyse, ei kannata kuunnella insinöörien, web 2.0 "social bookmarking" huuhaatyyppien jauhamista, eikä varsinkaan semantic web "tietojenkäsittelytieteilijöiden" läppää. Ei myöskään kannata kuunnella/katsella institutionaalisten informaatiotietelijöiden, kuten kirjaston- tai arkistonhoitajien juttuja eikä ammattilais- tai asiantuntijanäkökulmaa tiedon organisointiin edustavien tyyppien juttuja. Ketä sitten kuunnella? :)
Jos haluaa oikeasti ymmärtää, voi lukea Bowkerin ja Starin loistavan teoksen "Sorting Things Out" (pitäen mielessä, että kyseessä on jälleen yksi ammattikontekstiin sijoitettu tutkimus, jolla ei kovinkaan paljon ole tekemistä perustallaajan kanssa - tai ehkä onkin). Jos haluaa ymmärtää enemmän, voi lukea Bowkerin teoksen "Memory practices in the sciences".
Joopa, joo. Jos nyt ensin
Joopa, joo. Jos nyt ensin muut kun tehokäyttäjät tägittäisi esim Flickr kuvia. Ja kun puhutaan jostain Flickr tägittämisestä niin ei tosiaan ole kyse ihan samasta asiasta kun kansallisaarteimme meta-tiedoista ja dokumentinhallinnasta :-). Riittä jos kuvalla on esim tagit inkoo ja kalastus (http://www.flickr.com/search/?w=all&q=inkoo%2C+kalastus&m=tags) että joku muu inkoolainen mökkikalasstaja löytää minut. Flickr on verkkoyhteisö ei arkisto.
Saavutus tuokin, Anssi...
Muun muassa viiman esiinnostaman tägispämmin vuoksi vastaan itse omaan retoriseen kysymykseeni semanttisesta webistä: ei.
Anssi, saavutus tuokin lajissaan :)
Pirjo, totta, toisten tägien perässä kulkeminen on hauska löytöretki
PerttuT, täytyy kompana v:tä siinä, että eikö kieli itsessään jo perustu yhteisesti sovittuihin merkityksiin - miksi mitäkin asiaa kutsutaan? Jos osa ihmisistä kutsuu farkkuja denim-housuiksi ja toiset dongareiksi, niin henkilöt itse näkevät asian niin eri näkökulmista että ero on tarpeen. Miksi luoda verkkoa varten rajallisempi merkitysmaailma.
v, kiitos kirjavinkistä, pannaan korvan taa
Nicolas, ei ole Flickr suomen museot online, mutta kumman verkkopalvelussa on enemmän kävijöitä ja kiinnostavampaa sisältöä?
Ei ratkaisuja vaan parannuksia
Niin, no minä edustankin juuri noita erilaisia v:n mainitsemia ammattikuntia joilla on paha taipumus yrittää parannella systeemejä ja työkaluja. Ratkaisua en hakenutkaan, vaan parannuksia nykyiseen systeemiin. Semanttisen webinkin ongelmana näen sen, että siinä tavoitellaan jotain sellaista joka tarvitsee vielä muutaman väliasteen kehityksessä. Tietysti tämä koko "kehitys" on helppo leimata turhaksi toteamalla että maailmasta ei täydellistä tietomallia ole mahdollista rakentaa - eikä se ole järkevääkään, kuten tulikin todettua niin selkeästi. Ontologioihin liittyvä haaste on toki olemassa, mutta ei se estä parantamasta nykyisiä systeemejä. On selvää, että luonnollisen kielen kohdalla eivät standardimääritykset toimi eikä maailmamalleja voi työryhmissä tehdä. Kuitenkin olen sitä mieltä että eri aihealueiden käsitteistön tarkemmalla määrittelyllä ja käytön yhtenäistämisellä voidaan saavuttaa tarkoituksenmukaisempia järjestelmiä ja tehokkaampaa tiedonhakua. Tästähän on kyse.
Ymmärrän hyvin mitä tarkoitat osallistuvien ihmisten ennakko-oletuksilla ja sillä kuinka nämä vaikuttaisivat asiaan. Totta kai nämä vaikuttavat - mutta niinhän niiden pitääkin - niinhän ne vaikuttavat mainitsemissasi matalamman tason malleissakin. Mutta edelleen painotan, että en todellakaan tarkoita "sanastotyöllä" sitä että kasataan työryhmä ja päätetään "viralliset käsitteet" tälle maailman "kansiorakenteelle". Tarkoitan sitä, että haettaisiin rohkeammin välimuotoja näille kahdelle maailmalle (valmiit sanastot vs. käyttäjien tekemä viidakko). Konseptit eivät ole vastakkaiset, vaan toisiaan täydentävät (siis silloin kun halutaan kehittää jotain ratkaisuja esim tiedonhaun ongelmiin... mitään maailma-utopiaa ei edelleenkään olla tekemässä...).
Lähinnä yritin miettiä sitä, että mitä tarvitaan jotta täggäämisestä saadaan astetta hyödyllisempi konsepti. Automaattisella tagittamisella haen mallia jossa laajojen massojen tekemää tagityötä hyödynnettäisiin automaattisesti uusien sisältöjen tunnistamiseen ja luokitteluun. Eli ihmismassaa hyödynnettäisiin täydentävänä ja tarkentavana tietopohjana. Se, että miten tämä ensimmäinen kategorisointi (eli se kiinteä sanasto) tehtäisiin on tietysti edelleen ongelma, mutta ei kovin suuri mielestäni, koska massojen tekemä arviointi ja kategorisointi voisi korjata virheet alkuperäisessä lähtökohdassa aika nopeasti. Käytetäänkö farkuista sitten denim vai dongarit, niin on toki tärkeätä enkä tätä vastustakaan, mutta ajatuksena olikin se, että jos kerran tiedetään että farkkuja voi kutsua kummallakin termillä, niin tätä tietoa olisi järkevää hyödyntää myös seuraavan farkkumalliston kohdalla. Vai?
Ei tietenkään aina, mutta kun sekin on ennakko-oletus, että sitä laajennusta ei pystyisi tekemään. Ennakko-oletuksia ja maailman malleja on vain mielestäni pakko tehdä. Minun ajatukseni on vain se, että niitä voi a) tehdä yhdestä pienestä alueesta kerrallaan, b) antaa käyttäjien tekemän luokittelun täydentää ja korjata mallia jatkuvasti sekä c) yhdistellä eri alueiden ja eri näkökulmien malleja toisiinsa automaattisesti.
ESP Game on yks
ESP Game on yks mielenkiintoinen kokeilu tagittaa kuvia. Siinä on netissä peli, jossa kaksi satunnaista pelaajaa näkee saman kuvan ja yrittää sen perusteella arvata saman sanan == tagi kuvalle. Pisteitä saa sen perusteella kuinka nopeasti sen pystyy tekemään. Toimii ilmeisesti suhteellisen hyvin, tai ainakin paljon paremmin kuin automaagiset systeemit.
- Kuvahaku joka perustuu ESP Gamen indeksiin.
- The ESP Game
- ESP Game wikipediassa
- Google Tech Talk Video: Human Computation (juttu ESP Gamesta alkaa 8min 30sek kohdalta)
Tuija: katos muuten toi google tech talk video, se on jännä.
Minusta Flickrin
Minusta Flickrin tagijärjestelmä on "semanttisen webin näkökulmasta" älyttömän huono, sillä samaa järjestelmää käytetään yksilön henkilökohtaiseen kuvanhallintaan ja yleiseen kuvahakuun. Tageista ei käy selvästi ilmi kuvaavatko ne valokuvien ekplisiittistä sisältöä vai kertovatko ne kuvaustilanteen taustoista vai onko kyseessä vain kuvaajan henkilökohtaisiin merkityksiin perustuvia merkintöjä.
Esimerksi kun kuvassa pelataan pelataan golfia, niin tagiksi tulee luonnollisesti "golf" - kuvan ja tagin yhteys on ilmeinen. Mutta jos peli pelattiin vaikkapa Vuokatissa saatetaan paikannimi laittaa tagiksi, tällöin ongelmana on, että jos tagien avulla kuvia etsivä haluaa nähdä Vuokatista otettuja kuvia, niin hän saakin ruudulleen tukun Vuokatissa otettuja kuvia - huomaatte varmaan eron. Sitten jos pelipäivä oli sattumoisin kuvaajan syntymäpäivä, hän saattaa lisätä tagiksi "synttärit", mikä on hänen kannaltaan luonnollista, mutta synttärikemuista kuvia etsivä saa ruudulleen tukun golffareita.
Haluasin siis erotella ekplisiittiset tiedot, taustatiedot ja henkilökohtaiset merkitykset erilleen. Haluan siis metadataa metadatasta... argh.
Keskustelua..
Erkka, juuri mainitsemasi yksityisten kuvien ja kuvahaun mahdollistaminen samalla järjestelmällä on syy siihen, miksi Flickr on niin menestynyt! Mietipä populaarimusiikin kenttää ja erityisesti genren käsitettä: jokaineinen meistä omaa henkilökohtaisen käsityksen esim. siitä, mitä pop genre pitää sisällään. Tai rock-genre. Kuitenkin joku pop-genreen kuuluva kappale voikin todellisuudessa olla vaikkapa räpiä, soulia, discoa ja vielä jotain muuta.
Kun säveltäjä säveltää kappaleen, hän on tietoinen tästä genrejärjestelmästä ja genrejen konventioista. Siksi hän pyrkii noudattamaan niitä, mutta hieman rikkomaan niitä. KUN hän luovuttaa nuotit muusikolle, muusikko saattaakin soittaa oman osuutensa kappaleesta hieman jazzahtavasti. Kappaleen päädyttyä musiikkikriitikolle, tämä määrittelee sen eri tavalla. Levykauppias laittaa sen johonkin sopivaan hyllyynsä. Ja jokaisen kuluttajan mielestä se kuuluu johonkin kummalliseen kategoriaan, kuten kutumusaan. :)
(OK, ei välttämättä paras esimerkki, mutta ei jaksanut miettiä parempaa)
Pointti on se, että luokittelut/nimeämiset ovat konventioista ja (ammatti)käytännöistä riippuvaisia. Jos lukee tuon Bowkerin ja Starin kirjan, ymmärtää, mikä rooli luokittelujärjestelmillä on: miksi ne ovat olemassa ja mitä niiden olemassaolo edellyttää. Ei ole olemassa all-inclusiivisia luokittelujärjestelmiä, vaan konventionaalisia ja rajattuja sellaisia, jokaiseen kontekstiin on olemassa siihen hyvin sopiva luokittelujärjestelmä.
Flickr pystyy vastaamaan tähän potentiaaliseen sekasoppaan EI keksimällä maailman parhaan luokittelujärjestelmän VAAN riittävän hyvän järjestelmän, joka hyödyntää ymmärrystä luokittelusta ja (ihmisten ja kuvien) ryhmittymisistä ja linkkejä.
Flickrin toimivuus perustuu hypoteesille epätäydellisestä maailmasta, jossa on epätäydellisiä ihmisiä ja epätäydellistä metadataa ja epätäydellistä kieltä. Kun tämä on hypoteesi, miten voimme luokitella ja ryhmitellä kuvia? Tai oikeammin, miten kuvat ja ihmiset järjestyvät tai ne voidaan järjestää parhaiten ja mikä on työnjako käyttäjien ja informaatiojärjestelmän välillä? Ja kun kokoelma kasvaa ja sen sisältö muuttuu ja laajenee diversiteetiltään niin entäs sitten? :)
Nykypäivänä vaan kieleen liittyvät jutskat otetaan niin itsestään selväksi. Kaikki on kielen kanssa tekemisissä lapsuudesta asti. Esimerkkinä nimeäminen. Kaikilla asioilla on nimi. Ihmisilläkin on nimi. Mutta entäs jos ei oliskaan nimiä tai nimeämiskäytöntöä? Mitenkäs sitten järjesteltäisiin juttuja? Jotta nää asiat voisi kelata uusiksi bittipuolelle, pitää tajuta, miksi nykysysteemit on rakennettu, mihin sosiokulttuurillisiin konteksteihin ne on rakennettu ja kuka ne on rakentanut. Eli miksi asioita nimetään.
Puuh. Tais tulla sanottua kaikki.
PS. Tässä pari kriittistä (ja hauskaa) artikkelia metadatasta:
Dick Bulterman: Is it time for a moratorium for metadata?
Cory Doctorow: Putting the torch to seven straw-men of the meta-utopia
Clay Shirky: Ontology is overrated.
Kannattaa lukea noi jutut ja miettiä, että mitä niillä on yhteistä. Sieltä se vyyhti lähtee avautumaan.
PPS. Googlen PageRank on kans aika siisti juttu, mutta se onki toinen tarina. :)
hauska video
Tässä hauska video, joka viittaa myös tähän luokittelujuttuun.
http://www.youtube.com/watch?v=6gmP4nk0EOE&eurl=
Human computation onkin
Human computation onkin vinkeä juttu, katsoin videon ja leukani loksahteli silleen että "no hei, tietysti noinhan se pitää tehdä". Kiitos linkeistä Zache :)
mystinen v (-), oletko kuulolla
Tämä ei ole kontaktipalsta, mutta kysyn silti voisitko nimimerkki "v (-)" ottaa yhteyttä. Kirjoitit asiantuntevasti aiheesta, joka liippaa läheltä tutkimusaluettani, joten olisin kiinnostunut vaihtamaan ajatuksia.
Kirjoita uusi kommentti