torsdag den 20. oktober 2011

Åbne Offentlige Data - Hvad skal der til?


(Fra data.gov.uk - åbne offentlige data)

En række lande har haft stor opmærksomhed på at gøre offentligt indsamlede og registrerede data tilgængelige for borgere og erhvervsliv. Det gælder primært UK, US, Canada, Australien, Holland, Norge – og i EU er det blevet en del af den strategiske målsætning for den fremtidige udvikling af eGovernment.

Set i international perspektiv ligger Danmark langt efter se f.eks. - -http://blog.okfn.org/2011/08/26/introducing-the-open-knowledge-index/ Men på trods af den beskedne placering har man faktisk forsøgt med diverse tiltag at åbne de offentlige danske data, især tidligere Videnskabsminister Charlotte Sahl-Madsen stillede sig i spidsen for at kortlægge de offentlige data, og ikke mindst 25 af de dataset, som den hedengang IT og Telestyrelse havde direkte kontrol med

I indeværende år er Zangenberg og Co. barslet med en rapport om værdien af at åbne offentlige data. Denne rapport er baseret på interviews med en række brancher og organisationer, og peger især på værdien for følgende brancher:

  • Banksektoren, hvor en øget adgang til borgernes indkomstforhold vil kunne medføre besparelser og mulige, undgåede tab på 'mindst 500 mio'

  • Energisektoren, hvor en øget adgang og en bedre kvalitet af offentlige bygningsdata m.v. og viden om energiforbrug og isolering ville kunne give en samfundsmæssig besparelse på måske op mod 4 – 20 mia om året

  • Den Farmaceutiske industri, hvor bedre adgang også til anonymiserede sundhedsdata kan medføre mere effektive lanceringer af nye præparater, ligeledes 'i milliard-klassen'

  • Turisterhvervet peger på mulige bedre skræddersyede data til at tiltrække kulturelle turister eller bedre totalinformation, uden dog at sætte størrelse på mulig indtjenening.

  • Detailhandelen synes ikke umiddelbart at kunne se behovet for adgang til flere data, mens

  • Forsikringsbranchen mener at se et potentiale i bedre rådgivning i forbindelse med ændring i boligforhold, indkomst, familie medens

  • Kommunerne ser 2 områder: Fortsat reduktion af socialt bedrageri og en langt bedre adgang til sundhedsdata til at kunne optimere behandling, pleje m.v.

Hertil kommer ODIS initiativet, der bl.a. har resulteret i oversigten over offentlige datakilder, der er udgivet her: http://digitaliser.dk/ressourcer?tabContainerResources=tabDatakildeResources#

Problemet med navnlig den sidste oversigt er, at den omfatter revl og krat, virker vanskelig at gå til, og skal sammenholdes med formater (f.eks. OIO, XML m.v.) før den rigtigt kan udnyttes.

Sammenligner man med de erfaringer, man har haft i andre lande, specielt UK, er det klart at grundindstillingen og tilgangen har været en noget anden; for det første har et af hovedformålene i andre lande været 'Open Government' , d.v.s. Man har set det som et middel til at øge regeringens/forvaltningernes troværdighed ved at gøre beslutninger, resultater etc. transparent, medens den danske tilgang i henhold til den tidligere regerings udmeldinger har været at slippe data løs, så de kunne benyttes innovativt og dermed være medvirkende til at skabe ny vækst og beskæftigelse.

Og her kommer Zangenbergs rapport til kort, i den forstand at det er de bestående erhverv og den etablerede industri, der er fokus for hans undersøgelse. Det betyder ikke, at resultatet nødvendigvis er forkert, men kun at erfaringerne fra de andre lande tyder på, at de bedste ideer opstår i et samspil, en 'mash up' mellem forskellige datakilder, som branchens etablerede specialister muligvis overser.

Et punkt, hvor Zangenbergs rapport imidlertid rammer plet, er at sætte fokus på hvor privacy-begrebet sætter grænser – eller rettere: hvor pseudonymisering af data er en væsentlig forudsætning for udnyttelse af data.

Ser vi på tiltag i EU, er det værd at bemærke, at de nuværende måder at sammenligne de enkelte landes eGovernment performance på, er ved at 'løbe tør' – i den forstand, at EU siden 2001 har målt udbud, 'take up' af 20 nøgleapplikationer, og mange lande har nu nået op på tæt på 100%.

Allerede for et par siden advokerede David Osimo for, at næste fase af sammenligninger mellem EU-lande skulle foregå baseret på tilgangen til åbne, offentlige data – både ud fra et vækst synspunkt og ud fra et transparens-synspunkt. (Se hans anbefalinger her.). Han foreslog udvælgelsen af 20 'arketyper' af data, som hver skulle vurderes efter følgende skala:

0 - no information available 1 - description of the procedure to obtain the information through FOI

2 - information available in non reusable, non-machine readable format

3 - information available in reusable and machine readable format such as xml or dbase

4 - information available as per stage 3 and visualizable through predefined tools (georeferencing, histogram etc.

Synspunktet er fortsat validt, men for at komme til en meningsfyldt oversigt og tilgang til de danske, offentlige data kræver det mere end bare en oversigt over hvilke formater, selve databassen er lagret i. Det vil kræve en adgang til en meta-databeskrivelse, så også nye brugere, nye initiativtagere og eksisterende virksomheder kan få en let tilgængelig oversigt over hvilket interface, hvilke datatyper, der kan gives adgang til. (Det er ikke altid en enkel opgave – f.eks. har sundhedsområdet i mange år døjet med at standardisere begreber på tværs af kliniske specialer.)

Det forekommer nærliggende at tage udgangspunkt i de såkaldte domænebestyrelsers arbejde med kortlægningen af arbejdsopgaver og sammenhænge mellem grunddata for at komme skridtet længere. Domænebestyrelsen for boliger og bygninger vil således mere målrettet kunne arbejde med bl.a. de anbefalinger, som Zangenberg er kommet med vedr. energi og isolering. Tilsvarende ville en revurdering af det arbejde, som Erhvervs- og Selskabsstyrelsen laver for domænet 'Erhverv' passende kunne udvides, så det bliver muligt at lave et sammenhængende informationsflow for hele beskæftigelsesområdet: Data fra virksomheder, der planlægger at opsige folk, data om pågældendes skills, erfaring, uddannelse, data fra virksomheder, der søger folk, hvilke skills, erfaringer og uddannelser, der er behov for, match af 'gaps' mellem de to som input for korterevarende efteruddannelser og match med eksisterende udbud af efteruddannelser – og så naturligvis kobling til A-kasser og ledighed, jobkontorer m.v. Desværre fokuserer den netop vedtagne fællesoffentlige IT strategi på effektivisering af de administrative opgaver i forbindelse med ledighed og ikke på at løse det grundlæggende problem.

Som opsummering har vi behov for følgende analyser og anbefalinger vedr. åbne, offentlige data:

  • Pr. domæne (der er kun 4!) en oversigt over grunddata og dynamiske data, ejer, format, metadata

  • Kortlagte arbejdsgange i det offentlige, der føder/benytter disse data (FORM/STORM)

  • Specificerede behov for beskyttelse af private data og behov for samtykkestyring

  • Mulighed for pseudonymisering (f.eks. af medicinske data til forskningsbrug)

  • Potentialer – sammenligning med udlandet

  • Barrierer – hvor kræver det en ekstra indsats for at kunne opstille metadata, åbne databaserne og synliggøre mulighederne for relevante nationale og internationale spillere?

Ingen kommentarer: