Rapport om åpne og lenkede data
Offentlig sektor deltar i økende grad i elektronisk samhandling. Dette er samhandling mellom offentlige enheter samt mellom offentlig sektor og borgere og næringsliv. Semantisk teknologi er en nyvinning innen IKT som gjør det mulig å tilby åpne data i nye former og dette gir andre fordeler enn tidligere teknologier. Det viktigste nye momentet i denne teknologien er bruk av formelle modeller av datas betydning. Dette gjør det mulig å slå sammen data fra ulike kilder, gjenfinne, manipulere og visualisere på nye måter.
Semicolon-prosjektet har gjennomført flere piloter for å teste ut semantiske teknologier og for å forstå mer av organisatoriske og juridiske forhold rundt åpne data.
Konkret har prosjektet laget flere tekniske piloter, gjennomført litteraturstudie og diskutert muligheter og resultater med en rekke aktører. Resultatene har ført til samarbeid med andre forskningsprosjekter og inngått som sentralt tema i Semicolon II prosjektet.
Aktiviteten har fått stor oppmerksomhet og resultatene er blitt presentert i en rekke nasjonale og internasjonale fora.
Semicolon har laget en rapport som diskuterer muligheter og utfordringer ved åpne data primært fra offentlig sektor og avsluttes med en punktliste med anbefalinger.
Robert Engels og Per Myrseth: Åpne og lenkede data. En informasjonsinfrastruktur for elektronisk samhandling. Rapport nr. 2011-276, revisjon nr. 1. Det Norske Veritas, februar 2011.
Semicolons metode for tilgjengeliggjøring av lenkede åpne data
Semicolon har gjennom arbeid med Brønnøysundregistrene utviklet en metode for tilgjengeliggjøring av åpne lenkede data.
Metoden er en prosess for å ta master data eller andre datakilder fra dagens isolerte relasjonsdatabaser med tilhørende webtjenester til lett tilgjengelige, lenkede (web) og selv-beskrivende (semantikk) data.
Målet er å vise
- hvordan man kan senke terskelen for bruk av dataene utenfor det formål de er skapt for
- hvordan semantiske standarder sikre riktig tolkning av data ved gjenbruk
- at økt bruk vil øke datakvaliteten på kilden
Semicolons metode bygger på prinsippene bak lenkede data og et samspill med andre teknologier.
Et viktig poeng i metoden er at dataene som lenkes og tilgjengeliggjøres skal være selvbeskrivende og kunne tolkes av mennesker som maskiner, benytte vokabularer som også er oppslagbare og selv returnerer definisjoner. Metadata knyttet til kvalitet på dataene, eierskap til dataene osv. skal også returneres. SERES brukes som repository for begrepsdefinisjoner.
Mer detaljer finner du her.
URI-regime
Et viktig element i metoden er at det fins en mekanisme som viser hvor data er lokalisert. Vi kaller det et regime for URI-er. URI-er er identifikatorer for ting som gjør oss i stand til å snakke om noe. URI-er er den beste garanti for riktig bruk og at både mennesker og maskiner kan benytte en identifikator som er stabil og entydig. Rapporten for URI-regime finner du her.
URI-regimet skal standardiseres av DIFI.
Foredrag om lenkede åpne data
Semicolon har holdt mange foredrag og demonstrasjoner av åpne lenkede data.
Her er noen:
Per Myrseth: Linked open data. Track Informasjonshåndtering, Software 2010, DND, Oslo 9. – 11. februar 2010. *
Dumitru Roman og David Norheim: An Overview of Norwegian Linked Open Data. Applications in Regional Development and Environmentally Friendly Behavior. Akseptert for publisering i The proceedings of The Fourth International Conference on Information, Process, and Knowledge Management (eKNOW 2012), January 30 – February 4, 2012 – Valencia, Spain.
Per Myrseth, Jens Kilde Mjelva, David Norheim, Thom-Kåre Granli. National master data as 5 star Linked Open Data, Presentation
IFIP EGOV 2012. 3-5. September 2012, Kristiansand, Norway.
David Norheim, Computas:Öppna upp företagsdata. Sundsvall 42. Sundsvall, 17. oktober 2012.
Svein Erik Grønmo, Brønnøysundregistrene og David Norheim, Computas: Åpne data, Semicolon II med Demonstrasjon av Enhetsregisteret og Regnskapsregisteret. Nokios 2012, Trondheim, 31. oktober 2012.