Kustannukset ja laatukriteerit>><<Tiedostomuodot ja tallennusmediat


Metatieto ja dokumentointi

Metadata eli metatieto on digitaalisesta aineistosta tallennettua tietoa, joka on järjestelty koneelliseen käsittelyyn sopivaan muotoon. Lyhyesti sanottuna metatieto on tietoa tiedosta, eli se kertoo aineiston kontekstista, sisällöstä ja rakenteesta sekä kuvailee niiden hallintaa ja käsittelyä koko aineiston elinkaaren ajan. Metatietoa voi käyttää esimerkiksi aineiston hakuun ja tunnistamiseen (http://digitalpreservation.fi/specifications/sanasto).

Metadatan tarkoitus pitkäaikaissäilytyksessä on

  • säilyttää tietoa aineistoon kohdistuneista toimenpiteistä
  • tukea aineiston löydettävyyttä ja käytettävyyttä
  • tukea pitkäaikaissäilytyksen tavoitteita, eli tiedon saatavuuden, ymmärrettävyyden, oikeellisuuden ja eheyden varmistamista.

Lisäksi metadatan keskeisiä tehtäviä on kertoa, kuka aineiston on luonut sekä milloin ja mihin tarkoitukseen aineisto on luotu.

Metatietoa voi havainnollistaa parhaiten alla olevan esimerkin avulla. Avataan ”dokumentti”-niminen pdf-tiedosto ja katsellaan tiedoston ominaisuuksia.

Tiedosto sisältää seuraavat metatiedot: otsikko, tekijä, aihe ja avainsanat. Nämä ovat tietoja, joita ei voi heti päätellä pelkästään tiedoston nimen perusteella, vaikka ne tarjoavat tärkeää tietoa dokumentin sisältämästä tiedosta. Esimerkiksi tekijän perusteella dokumentti näkyisi hakutuloksissa, jos käyttäjä hakee sellaista aineistoa, jonka tekijänä on Matti Meikäläinen. ”Avainsanat”-kenttä puolestaan sisältää sanoja, jotka kuvailevat dokumentin sisältöä. Käyttäjä voisi esimerkiksi etsiä aiheeseen ”metadata” liittyvää aineistoa, jolloin esimerkkidokumenttimme ilmaantuisi hakutuloksiin. Ilman metadataa aineiston haettavuus olisi siis huomattavasti suppeampaa.

Metatietoja varten on olemassa erilaisia standardeja, jotka määrittelevät tiedostoon liitettävät metatietokentät. Metatietostandardit parantavat tiedon yhtenäisyyttä ja helpottavat tiedostojen siirrettävyyttä ja yhteentoimivuutta eri järjestelmien välillä. Yksi tällaisista standardeista on hyvin yleisesti käytetty Dublin Core, joka määrittelee 15 erilaista metatietokenttää:

  • Title(nimeke)
  • Creator(tekijä)
  • Subject(aihe)
  • Description(kuvaus)
  • Publisher (julkaisija)
  • Contributor(muu tekijä)
  • Date(aikamääre)
  • Type(laji)
  • Format(formaatti)
  • Identifier(tunniste)
  • Source(lähde)
  • Language(kieli)
  • Relation(suhde)
  • Coverage(kattavuus, esimerkiksi ajallinen tai maantieteellinen)
  • Rights (käyttöoikeudet)
Dublin Core -metadataformaatista on olemassa myös suomalainen versio, joka tunnetaan SFS 5895 -standardina. Tästä on edelleen jatkokehitetty SFS 5914 -standardi, joka sisältää lisäksi SFS-ISO 23081-1:2007 -metatiedot:

  • Audience
  • Location
  • Disposition
  • Agent
  • Function
  • RecordType
  • Mandate
  • Status
  • AuditTrail

Lisäksi laajalti käytössä olevia muita standardeja ovat esimerkiksi ISO 23081 ja JHS 143. Nämä ovat kuitenkin Dublin Corea ja sen sukulaisia järeämpiä standardeja, ja pienempiin arkistoihin Dublin Coren tarjoamat metatietokentät ovat usein riittävän kattavia.

Metatiedon luominen manuaalisesti vaatii aikaa ja vaivaa, ja se saattaa viedä jopa enemmän aikaa kuin aineiston muuntaminen digitaaliseen muotoon. Metatiedot kannattaa aina lisätä samalla kun digitaalinen tiedosto luodaan. Kuville ja videoille tarpeellisia metatietoja ovat ainakin kuvaaja, kuvassa tai videolla esiintyvät henkilöt, aika ja paikka. Nämä tiedot ovat tärkeitä, koska pelkästään ihmisen muistiin ei voi luottaa, ja vuosien kuluttua kun digiarkiston uumenista kaivellaan vanhaa kuvamateriaalia eikä kukaan enää muistakaan henkilöiden tai paikan nimiä ajankohdasta puhumattakaan, niin aineisto on lähes hyödytöntä. Metadata on yhtä tärkeää kuin tiedostojen nimeäminen kuvaavasti.

  Sisäinen metatieto sisältyy tiedostoon, kun ulkoinen metatieto sijaitsee erillisessä tiedostossa.


Dokumentointi täydentää metadataa ja tarjoaa tietoa, joka edesauttaa aineiston käytettävyyttä ja saatavuutta kolmannelle osapuolelle. Dokumentointi tarjoaa tarkkaa tietoa aineiston tekijän suorittamista toimenpiteistä ja ohjeistaa muita aineiston käytössä. Dokumentointi on tärkeää, koska digitaaliset aineistot ovat riippuvaisia laitteistosta ja ohjelmistoista, joten dokumentoinnilla varmistetaan, että jälkipolvilla on aineiston säilyttämiseen ja käsittelyyn riittävästi tietoa.

Dokumentointi on metadatan ohella käytännössä ainoa keino varmistaa aineiston oikeellisuus. Digitaalisia aineistoja on usein välttämätöntä kopioida niiden saatavuuden takaamiseksi, ja siksi dokumentoinnilla myös selvennetään aineistoon liittyviä tekijänoikeuksia. Dokumentoinnissa tuodaan myös esille, että aineistoon on kohdistettu seulonta ennen arkistointia, mikä takaa sen, että arkistoidun aineiston arvo on varmistettu.

Kattavan dokumentoinnin laatiminen onnistuu parhaiten, kun dokumentointi aloitetaan samaan aikaan digitointiprojektin kanssa ja viedään loppuun yhtä aikaa muun projektin kanssa. Hyvä dokumentointi kertoo kattavasti projektin eri vaiheista niin että projektia koskeva tieto on saatavilla, ymmärrettävissä ja käytettävissä. Hyvä dokumentointi myös elää jatkuvasti projektin muutosten mukana, ja sitä päivitetään säännöllisesti jotta tieto pysyy ajan tasalla.

  Metadata on tietoa tiedosta

Metadata eli metatieto kuvailee esimerkiksi aineiston kontekstia, sisältöä ja rakennetta.


  Metadata parantaa aineiston käytettävyyttä

Metatietoa voi hyödyntää esimerkiksi aineiston hakuun ja tunnistamiseen.


  Dokumentointi täydentää metadataa

Dokumentointi tarjoaa tarkkaa tietoa aineiston tekijän suorittamista toimenpiteistä ja ohjeistaa muita aineiston käytössä.


  Dokumentointiin kannattaa panostaa

Hyvä dokumentointi kertoo kattavasti projektin eri vaiheista niin että projektia koskeva tieto on saatavilla, ymmärrettävissä ja käytettävissä.



Testaa, kuinka hyvin hallitset tämän aihepiirin.

Jatka lukemista