EnglishLink to English version
Digitalt arkiv over Edvard Munchs tekster

Teknisk

Under denne overskriften samler vi stort og smått av teknisk dokumentasjon og av planer for den tekniske siden ved dette nettstedet.

Internasjonalt anerkjente standarder

Vi legger vekt på å bruke internasjonalt anerkjente standarder i arbeidet og på å følge dem. Vi koder alt materialet vårt — både primærkilder og ny tekst produsert i prosjektet — i xml-standarden fra Text Encoding Initiative (TEI), se nærmere om denne nedenfor. xml-filene blir transformert til xhtml ved hjelp av et xslt-stilark. xhtml-visningen blir formatert ved hjelp av et css-stilark. Alle våre filer skal være valide i henhold til standardene.

TEI P5, en internasjonal tekstkodestandard for humaniora

Til kodingen av Munchs tekster bruker vi den internasjonale, xml-baserte tekstkodestandarden som er utviklet av Text Encoding Initiative (TEI). Vi bruker den nyeste versjonen, P5. Siktemålet med å kode tekster ved hjelp av TEI P5 er å lage maskinleselige tekster som kan behandles digitalt og brukes i nettbasert forskning, undervisning og bevaring.

TEI-kodestandarden er modifiserbar, men vi har satt oss som mål at vi skal holde oss til standarden uten å foreta endringer eller tillegg. Vi dokumenterer vår bruk av standarden og kommer til å publisere vårt sett med TEI P5-koderetningslinjer her på nettsidene etter hvert som de blir mer fullstendige.

XInclude

Et ferdigkodet tekstobjekt hos oss består av én xml-fil for hver faksimile og en felles xml-fil som samler de øvrige filene til en helhet. For å knytte sammen tekstobjektet bruker vi XInclude, en W3C-standard for xml. XInclude er «a processing model and syntax for general purpose inclusion. Inclusion is accomplished by merging a number of XML information sets into a single composite infoset. Specification of the XML documents (infosets) to be merged and control over the merging process is expressed in XML-friendly syntax (elements, attributes, URI references).» Ved hjelp av XInclude kan man altså knytte sammen både hele filer og deler av dem eller en kombinasjon av filer og fildeler.

Andre standarder og xml-teknologier

Vi bruker flere andre standarder også:

  • xslt
  • javaskript
  • css

Vi bestreber oss på å følge standardene.

Gratis programvare og åpen kildekode

Vi legger vekt på å bruke programvare som er gratis tilgjengelig samt programvare som har åpen kildekode. Vi forsøker å finne gode løsninger som er i bruk av andre og hvor det er enkelt å finne dokumentasjon og få hjelp.

Programvare på nettsidene

Her en en oversikt over programvare som er i bruk på nettsidene våre.

AddThis — del med andre, lag bokmerke...

AddThis er en av utallige tilbydere av såkalt «deleknapp» til nettsteder. Vi valgte AddThis fordi den er gratis og ser ut til å være mye brukt og derfor sannsynligvis stabil. Den var enkel å tilrettelegge for sidene våre, og tilbyr jevnlig statistikk på bruken av dele-funksjonen, noe vi syns er fint.

— tilbakemeldinger og gode idéer

Vi vil gjerne ha tilbakemeldinger fra dere. I høyre marg på alle sider ligger det en -tagg. Trykk på denne og velg mellom å sende oss en melding om feil eller gå til det tilknyttede diskusjonsforumet for å legge inn kommentarer, spørsmål eller idéer til funksjoner osv.

Hvis dere har faglige spørsmål eller kommentarer må dere gjerne ta kontakt med prosjektmedarbeiderne direkte.

Vi blir veldig glad for tilbakemeldinger!

Programvaren for tilbakemeldinger er gratis tilgjengelig fra UserVoice, se http://uservoice.com/.

Snap Shots — forhåndsvisning av lenkemål

Ved hjelp av programvaren Snap Shots vil alle eksterne lenker samt et utvalg av de interne lenkene vise lenkemålet i et lite sprett-opp-vindu når man peker på lenken med musepekeren.

Google Analytics

Vi analyserer trafikken på nettstedet ved hjelp av Google Analytics.

Nettleser-begrensninger

Disse sidene er så langt utarbeidet for Mozilla Firefox, og en del av løsningene fungerer ikke i andre nettlesere, f.eks. Internet Explorer. For IEs del skyldes det at IE ikke følger standarder som css. Det fører til at sidene ikke vises slik de skulle vært vist.

Hvis du vil prøve Firefox kan det lastes ned herfra. Programmet er gratis og velfungerende og har mange interessante tilleggsfunksjoner. Det finnes mange gode programtillegg, bla. Rotate Image, som gjør det mulig å rotere bilder på nettsider.

Når dette nettstedet er ferdigutviklet og blir lansert, skal det imidlertid fungere i alle de vanlige nettleserne.

timeline — tidslinje

Den eksperimentelle tidslinje- og kartvisningen er laget ved hjelp av programmet Timeline laget i prosjektet Simile, og Google Maps. Oppsettet kan lastes ned gratis fra http://code.google.com/. Fakta og informasjon kan lagres ved hjelp av flere forskjellige formater, bla. direkte i javaskript, i xml eller json.

Programvare i arbeidet med materialet

Her er en oversikt over programvare som prosjektet bruker internt.

Filemaker Pro

Filemaker er et databaseprogram, og det er lisensbelagt.

Vi lagrer det meste av vårt selvproduserte materiale i databaser. Vi har baser for hendelser, personer, institusjoner, steder og tekstobjekter. I tillegg drar vi nytte av museets andre databaser. Det materialet som skal publiseres i nettarkivet vil bli eksportert fra databasene og over i TEI P5-format.

<oXygen/> XML Editor

<oXygen/> er en xml-editor, og den er lisensbelagt. Det finnes imidlertid rimelige lisenser for akademia.

<oXygen/>-miljøet er opptatt av å legge til rette for det internasjonale fagmiljøet innenfor digital humaniora, og det er derfor bygget inn støtte for tekstkodestandarden fra Text Encoding Initiative.

Vi bruker <oXygen/> til å kode og validere xml-filene våre og til å transformere dem til xhtml. Vi redigerer også xslt- og css-stilarkene våre i <oXygen/>. Det er enkelt å lage valide filer i <oXygen/> for programmet leser kodestandarden som ligger til grunn for filen og gir kontinuerlig tilbakemelding om koden man skriver. Programmet viser mulige tagger (ved hjelp av nedrullsmenyer) når man begynner å skrive en kodeklamme slik at man unngår kode- og skrivefeil og slik at selve kodingen går raskere.

Image Markup Tool

Image Markup Tool (IMT) er utviklet av Image Markup Tool Initiative ved Martin Holmes, Humanities Computing and Media Centre (HCMC) og Text Analysis Portal for Research (TAPoR) ved University of Victoria i Canada.

I IMT kan man markere områder på et bilde, transkribere teksten eller lage en note om noe innenfor dette området, lagre dette som TEI P5-filer og generere en nettvisning. IMT arbeider foreløpig bare med et og et bilde om gangen, men bortsett fra dette er det et veldig brukervennlig program som er særdeles nyttig for oss.

IMT er gratis tilgjengelig og kildekoden er fritt tilgjengelig.

eXist-db. Open Source Native XML Database

Vi lagrer og ordner xml-filene våre ved hjelp av xml-databasen eXist-db.

eXist-db er gratis tilgjengelig og også kildekoden er fritt tilgjengelig.

Det digitale arkivet

Selve arkivet, en forhåndstestet løsning

Til byggingen av selve det digitale arkivet, har vi bestemt oss for å bruke en nett-teknologisk løsning som andre med hell har brukt før oss. Den består av nettstedstjeneren Apache Tomcat, xml-databasen eXist og nettstedsrammeverket Apache Cocoon.

Dem vi mest direkte går i fotsporene til er Humanities Computing and Media Centre (HCMC) ved University of Victoria i Canada, og utvikleren deres, Martin Holmes. Ved HCMC har de bygd flere nettsteder over samme lest, se f.eks. Colonial Despatches og Robert Graves Diary Project. Andre som bruker en liknende løsning (bla. uten eXist) er prosjektet Henry III Fine Rolls, som er et samarbeid mellom The National Archives, History Department og Centre for Computing in the Humanities ved King's College London samt Department of History and American Studies ved Canterbury Christ Church University i Kent.

Den store fordelen ved å bruke noe som andre har brukt før oss, er selvfølgelig at vi vet at det virker og at vi kan få råd og hjelp underveis i arbeidet vårt.

Her er en oversikt over programvaren som prosjektet skal bruke i det digitale arkivet:

Grunnlaget for arkivet er xml-databasen eXist som skal inneholde Munchs tekster og prosjektets tilleggsressurser. Alle filene kommer til å være kodet i TEI XML P5. Nettstedet blir administrert og gjengitt ved hjelp av Apache Cocoon, nettstedsrammeverket som kjøres oppå nettstedstjeneren Apache Tomcat. Alle programvare-delene av nettstedet er åpen kildekode og de er gratis tilgjengelig. Nettstedet kan drives på hvilket som helst operativsystem som har Java virtual machine installert. Vårt nettsted skal kjøres på en tjener med Ubuntu Linux-operativsystem.

Tekstene blir hentet ut av samlingen ved at Xquery-forespørsler blir sendt til databasen. Databasen sender deretter tilbake resultatet av forespørselen i form av xml-fragmenter eller -dokumenter. Resultatet blir så transformert til en xhtml-nettside ved hjelp av xslt og så til slutt vist i en nettleser. Design, typografi og interaktive funksjoner legges til ved hjelp av css og javascript.

Tidslinje

Se ovenfor.

Annotasjons- og taggeverktøy

Vi planlegger et verktøy som skal gjøre det mulig å arbeide direkte i tekstene. Verktøyet skal gjøre det mulig å skrive notater og publisere kommentarer, tagge med emneord og lenke sammen tekster man er interessert i.