Kohti Kansallisarkiston asiakirjojen vapaaehtoisdigitointia

Vapaaehtoisuus on nouseva trendi

Kansallisarkisto on päivittämässä digitointistrategiaansa, jossa kahtena keskeisenä tavoitteena on edistää asiakirjallisen kulttuuriperinnön käyttöä digitoimalla asiakaslähtöisesti sekä edistää digitoitujen aineistojen avointa saatavuutta. Samalla Kansallisarkisto on laajentamassa takautuvan digitoinnin toimintatapoja. Digitoinnissa kumppanuusyhteistyö monella eri tavalla on jo arkea.

Yksi uusista toimintatavoista on digitoinnin toteuttaminen vapaaehtoistoiminnan kautta. Vapaaehtoistoiminnan tavoitteena on saada digitoitua tutkimukselle keskeisiä julkisia aineistoja, joiden digitointi aineistojen ominaisuuksien puolesta on hidasta ja Kansallisarkiston omien resurssien ulkopuolella. Vapaaehtoistoiminta ei siis vie yhtään työpaikkaa, mutta mahdollistaa tutkimukselle tärkeiden aineistojen saamisen vapaasti Digitaaliarkiston kautta kaikkien ilmaiskäyttöön avoimen datan periaatteiden mukaisesti.

Vapaaehtoistoimintaa digitoinnissa ja metatietotyössä toteutetaan useissa muissa keskeisissä Kansallisarkistoissa ja monet ovat kehittämässä toimintaa. Esimerkiksi Yhdysvaltain, Tanskan, Viron ja Hollannin Kansallisarkistoissa asiakkaat voivat skannata itseään kiinnostavia asiakirjoja tutkijasalissa olevalla skannerilla myös julkiseen käyttöön laitoksen järjestelmien kautta. Tanskassa vapaaehtoisdigitointia toteutetaan myös antamalla vapaaehtoisten digitoida asiakirjoja Kansallisarkiston laitteilla ja tiloissa. Norjassa ja Iso-Britanniassa osa metatietojen rikastamisesta toteutetaan vapaaehtoisvoimin.

Kansalliasrkisto tarjoaa aineistojen käyttäjille mahdollisuuden tulla
mukaan niiden digitointiin. Kuvassa kumppanuusyhteistyömuotoinen
digitointiprojekti digitoimassa alkuperäisiä sidoksia.
Vapaaehtoistoimintaa varten Kansallisarkisto on hankkimassa uusia kamerapöytiä ja kirjahissillä varustettuja kameralaitteistoja, joiden käyttö on nopeaa ja laadun puolesta täyttävät Kansallisarkiston laatukriteerit. Näillä laitteilla digitointi on nopeampaa kuin perinteisillä kirjaskannereilla, ja laite mahdollistaa alkuperäisten aineistojen, myös paksujen sidostenkin digitoinnin kohdetta vaurioittamatta parhaalla mahdollisella teknisellä laadulla.

Kyselyllä suuntaviivoja kehittämiselle

Suunnittelun pohjaksi järjestettiin tammikuun lopulla kysely, jolla selvitettiin ihmisten halukkuutta ja mahdollisuuksia vapaaehtoiseen digitointiin Kansallisarkiston tiloissa. Vastauksia saatiin noin 70 kappaletta.

Kyselyyn vastanneista noin puolet arveli voivansa käydä digitoimassa kerran viikossa tai useammin toisen puolen uskoessa voivansa tehdä työtä harvemmin kuin kerran viikossa. Samoin puolet vastaajista arvioi, että työjakson sopivin kesto olisi enintään muutamia tunteja kerrallaan, kolmannes arvioi voivansa tehdä työtä vähän useammankin tunnin kerrallaan ja hieman harvempi kuin joka viides mietti, että voisi työskennellä kerralla jopa kahdeksan tuntia.

Sopivien aineistojen suhteen monella vastaajalla oli mielessään ajallisia ja alueellisia rajauksia koskien aineistoja, joita he haluaisivat mieluiten digitoida. Uudemmat aineistot kiinnostivat useampaa vastaajaa kuin vanhemmat: itsenäisyyden ajan aineistoista oli kiinnostunut noin 70 % vastaajista, kun Ruotsin ajan aineistojen (vuoteen 1808 saakka) digitointi keräsi noin 50 % kannatuksen.

Tehty kysely ei sitonut vastaajia mihinkään mutta antoi tärkeää ennakkotietoa työjaksojen määrästä ja kestosta sekä vastaajien aineistoihin liittyvistä mieltymyksistä. Suunnittelun edetessä, kevään aikana, on määrä käynnistää vielä toinen kysely, jolla jo etsitään vapaaehtoisia uuden digitointitavan pilotointia varten.

Mitä tehdään seuraavaksi

Kansallisarkisto pyrkii käynnistämään vapaaehtoisdigitoinnin pilotoinnin huhtikuun aikana. Pilotti toteutetaan Helsingissä ja työskentely tapahtuu arkipäivisin klo 8-16. Pilotoinnissa selvitetään vapaaehtoisdigitointiin liittyviä käytänteitä ja pyritään siihen, että kehitettävät toimintatavat ovat mahdollisimman toimivat. Pilottiaineistot on valittu tehdyn kyselyn tulosten pohjalta.

Liikkeelle lähdetään pilottiin osallistuvien vapaaehtoisten valinnan mukaan joko Tilattoman väestön alakomitean tai Suomen Vapaussodan itsenäisyysarkiston materiaalista. Edellinen sisältää kyselykaavakkeet vuonna 1901 suoritetusta maaseudun ruokakuntia koskeneesta tutkimuksesta ja jälkimmäinen on kokoelma vuosiin 1899–1922 liittyviä muistelmatekstejä, joissa kuvataan Suomen itsenäisyyteen johtaneita vaiheita sekä sisällissotaa ja heimosotia. Myös jatkossa päätökset digitoitavasta aineistosta tehdään yhdessä osallistuvien vapaaehtoisten kanssa.

Havainnekuva vapaaehtoiskäyttöön rakennettavasta digitointipöydästä.
Pöytien määrää kasvatetaan niiden käytön lisääntymisen mukaan.
Mitä vapaaehtoisdigitointi voi tuoda tullessaan?

Vapaaehtoisdigitoinnin tärkeimmät edunsaajat ovat arkistoaineistoja käyttävät tutkijat. Jo digitoinnin alkuajoista lähtien on keskusteltu siitä, miten ja missä määrin digitointi vaikuttaa historiantutkimuksen menetelmiin, aihevalintoihin ja tutkimusprosessiin. Tähän saakka digitointi on vaikuttanut lähinnä vain niiden tutkijoiden työhön, joiden käyttämät aineistot ovat olleet digitoitujen joukossa. Aika näyttää, onko historiantutkimuksen uusi normaali se, että tutkijoilta odotetaan käyttämiensä aineistojen digitointia niissä tapauksissa, joissa työmäärä ei ole kohtuuton. Tai näemmekö jatkossa tutkimusprojekteja, joiden suunnittelussa huomioidaan tutkittavan aineiston digitointiin tarvittavat resurssit?

Toiseksi vapaaehtoisdigitoinnista hyötyvät ne kansalaiset, joiden aikataulut mahdollistavat omatoimisen aineistojen digitoinnin. Ajan mittaan esimerkiksi omaa sukua, kotiseutua tai tutkimusaihetta koskevat asiakirjat voi saattaa käytettäväksi ajasta ja paikasta riippumatta.

Lopuksi tulevaisuuden visiota hahmotellessa on syytä nostaa esiin horisontissa jo siintävät uuden teknologian mahdollisuudet, jotka myös vapaaehtoisdigitoitua aineistoa koskevat. Konekirjoitetun tekstin koneellinen tunnistus (OCR) on jo aloitettu ja kaiketi muutamassa vuodessa myös käsinkirjoitetun tekstin koneellinen tunnistus (HTR) saadaan mukaan digitointiprosessiin. Kun nämä tekniikat on saatu osaksi jokapäiväistä toimintaa, lisääntyvät aineistojen käyttömahdollisuudet oleellisesti. Jo yksittäisen tuhatsivuisen tuomiokirjan kattava vapaasanahaku on houkutteleva, mutta entäpä kokonaiseen hyllylliseen tai huoneelliseen aineistoa kohdistuva vapaa sisältöhaku? Tähän suuntaan olemme matkalla.

Tulevaisuus voi siis olla sukututkijoita ja historianopiskelijoita digitoimassa tutkimusaineistojaan ja vanhojen autojen tai lääketieteen historian harrastajia digitoimassa niihin liittyviä asiakirjoja. Tällaisista toiveista saatiin viitteitä jo edellä mainitussa kyselyssä. Myös puhtaita kulttuuritekojen tekijöitä lienee tulevien digitoijien joukossa. Kaikkia tarvitaan, jotta arkistoon tallentunut kulttuuriperintö tulisi yhä useamman saataville. Tällä hetkellä Kansallisarkiston aineistoja on digitoitu 68,6 miljoonaa tiedostoa, mikä on noin 4-5 prosenttia aineistoista. Työsarkaa on vielä runsaasti jäljellä.

Tomi Ahoranta, kehittämispäällikkö
Juho Haavisto, ylitarkastaja
István Kecskeméti, johtaja
Markku Mäenpää, erityisasiantuntija

Eurooppa-projekti toi ratkaisun paikalliskulttuurin säilyttämiseen ja esittämiseen verkossa

Topoteekki tulee Itävallasta

Vuonna 2014 käynnistettiin Itävallassa toimivan Kansainvälisen arkistotutkimuksen keskuksen (ICARUS) johdolla Community as Opportunity (CO:OP) –niminen projekti, jonka yhtenä päämääränä oli löytää ratkaisu kotiseutuyhdistyksiä ja muita paikallistoimijoita vaivanneeseen pulmaan siitä, miten kotiseutuaineistoja voisi säilyttää, esittää ja tarvittaessa jakaakin verkon välityksellä. Marraskuun loppuun jatkuva projekti on osa Luova Eurooppa –ohjelmaa ja siihen osallistuu 17 arkistoa ja yliopistoa 11 Euroopan maasta. Suomesta mukana on Kansallisarkisto.

Projektin aikana on luotu Topoteekki-niminen käyttöliittymä, jonka kautta kotiseututoimijat tai vaikka tietystä historian teemasta (esim. sotahistoria tai hautausmaat) kiinnostuneet voivat esittää kuvia, videoita tai ääntä sekä halutessaan myös saattaa sen topoteekin käyttäjien ladattavaksi. 

Topoteekit valloittavat Eurooppaa. Suomessa niitä on
tällä hetkellä kuusi.
Suomalaiset topoteekit

Keski-Euroopassa topoteekkeja on jo runsaasti ja Suomessakin niitä on jo kuusi kappaletta: Kaarinan Piikkiö, Mikkeli, Mäntsälä, Saamenmaa (Sápmi), Sastamalan Suodenniemi ja Säkylä. Neljää topoteekkia ylläpitää paikallinen kotiseutuyhdistys, yhtä kaupunginmuseo ja yhtä Kansallisarkisto itse.

Topoteekkien aineistot on etupäässä digitoitu ihmisten kotiarkistoista, mutta mukana on jonkin verran myös museoiden ja arkistojen kokoelmiin sisältyviä kuvia ja asiakirjoja. Kaikkiaan suomalaisiin topoteekkeihin on tallennettu jo tuhansia paikalliskulttuurin kuvia ja asiakirjasivuja ja muutama äänitiedostokin niistä löytyy. ICARUS on luvannut säilyttää pysyvästi CO:OP-projektin kestäessä topoteekkeihin ladatut kohteet ja niiden metatiedot.

Ensimmäiset kokemukset topoteekeista ovat olleet rohkaisevia ja nyt voimmekin tarjota uusia topoteekkeja avattavaksi mihin päin Suomea tahansa.

Miten topoteekki perustetaan?

Topoteekkia perustettaessa sille valitaan enintään viisi ylläpitäjää, joiden tehtävänä on viedä julkaistavaksi tarkoitetut aineistot topoteekkiin ja lisätä niihin tietyt metatiedot (mm. paikalliset ja yleiset tunnisteet, laatimisajankohta, aineistotyyppi, aineiston omistaja ja käyttölisenssi). Metatietotyö on ajoittain koettu työlääksi mutta toisaalta rutiinin muodostumisen on todettu nopeuttavan työskentelyä. Lisäksi ylläpitäjien tehtävänä on yleisön kommenttien (mikäli niitä vastaanotetaan) käsittely ja julkaisu.

Liikkuvia digitointiasemia on käytetty eri puolilla Suomea. Tässä
niitä viritellään Mäntsälän Pitäjäntuvalla.
Aineiston topoteekkiin digitoitavaksi luovuttanut omistaja päättää aineistonsa käyttölisenssistä ja jatkokäyttöoikeudesta. Käytössä ovat globaalisti tunnetut Creative Commons (CC) –lisenssit, joilla uudelleenkäyttöä säädellään. Vanhat aineistot ovat yleensä helposti julkaistavissa mutta uudemmissa on huomioitava tekijänoikeus- ja henkilörekisterikysymykset. Uuttakin aineistoa voi julkaista, jos aineiston luovuttaja on myös tekijänoikeuden haltija ja jos julkaisusta on sovittu kuvissa esiintyvien henkilöiden kanssa.

Topoteekki-sopimuksen ICARUKSEN kanssa tehneillä on mahdollisuus lainata Kansallisarkistosta liikkuvia digitointiasemia aineiston topoteekkiin digitoimista varten. Laitteita lainataan niiden edestakaisten rahtikustannusten hinnalla. Asemia on neljä, joista yksi sopii enintään A3-kokoisen aineiston digitointiin, kaksi (koko A4) erityisesti valokuvien, diojen ja negatiivien digitointiin sekä yksi hyväkuntoisen paperiaineiston läpisyöttödigitointiin. Ääntä ja liikkuvaa kuvaa laitteilla ei voi digitoida, mutta monet kirjastot tarjoavat mahdollisuuksia niiden saattamiseen sähköiseen muotoon ja sittemmin siirrettäviksi topoteekkiin yleisön katsottavaksi ja kuultavaksi.

Topoteekin kustannukset

Topoteekin avaaminen on vielä tänä vuonna maksutonta, mutta ensi vuodesta (2019) alkaen ICARUS perii tänä vuonna avatuista topoteekeista 300 euron vuosimaksun. Kustannustaso (25 €/kk) vastaa siis suunnilleen yhtä kiinteähintaista laajakaistaliittymää. Ensi vuonna avattavista uusista topoteekeista peritään puolestaan kyseisen EU-maan varallisuuteen (BKT/asukas) perustuvaa vuosimaksua, joka alustavien arvioiden mukaan olisi Suomen kohdalla noin 450 euron suuruinen. Topoteekeista kiinnostuneiden kannattaakin siis toimia nopeasti päästäkseen tuohon edullisempaan maksuluokkaan.

Kannattaakin tutustua yllä linkitettyihin suomalaisiin ja eurooppalaisiin topoteekkeihin, kokeilla niiden monia ominaisuuksia hakutulosten lajittelusta kuvien katseluun ja miettiä, palvelisivatko ne oman kotiseutuyhdistyksen tai muun historian harrastuspiirin tarpeita. Myönteisessä tapauksessa omaa topoteekkia avaamaan pääsee ottamalla yhteyttä meihin allekirjoittaneisiin ja joulukuusta 2018 lähtien suoraan ICARUKSEEN. Itse uskomme ja toivomme, että Topoteekki on vastaus monen yhdistyksen tarpeisiin ja että sille olisi Suomessakin yhä useampia kiinnostuneita käyttäjiä.

Tomi Ahoranta
kehittämispäällikkö, CO:OP-projektipäällikkö Kansallisarkistossa

Markku Mäenpää
erityisasiantuntija, Kansallisarkisto

sähköpostiosoitteet muotoa etunimi.sukunimi@arkisto.fi