POSTLISTE: Verkty for søking i offentlege postjournalar

Studentar ved bachelorprogrammet nye medier gjennomførar kvar vår ein praksisperiode hos mediebedrifter i Bergen. Studentgruppa var praktikantar hos Bergens Tidende våren 2013 og utvikla eit søkjesystem for søk i offentlege journalar, postliste.no.
Publisert: 13. juni 2016

Studentgruppa utvikla eit system, Postliste, for søk i offentlege journalar for Bergens Tidende. Systemet er laga for journalistar i nyheitsredaksjonar for å gjøre søk i offentlege postjournalar enklare for journalisten. — Vi fokuserte på dei etatane som er i BT sitt nedslagsfelt, seier Rune Gulbrandsøy.

Funksjonar i Postliste

— Fleire funksjonar er tilgjengelege, då ein del av funksjonen vart implementert etter innleveringa av bacheloroppgåva til universitetet. Gulbrandsøy fortel også at systemet er innstallert hos Bergens Tidende tidleg haust 2013.

Maskinlesbart format

All dataflyt frå eksterne kjelder som kommunar, fylke og mattilsynet vart «levert» av etatanes eigne dokumenthandteringssytem. Gulbrandsøy fortel at systemet fokuserte på journalar frå kommunar som Bergen, Askøy, Øygarden, Sund, Os, Hordaland fylke og Mattilsynet i Hordaland og Sogn og Fjordane.

— For dei fleste dokumentsystema var oversettinga av informasjon til maskinlesbart format ein automatisk prosess. For Mattilsynet var denne delvis manuell, då dei leverte listene sine som PDF. Dette kravde at ein brukar måtte kopiere lenka, URI, og lime den inn i eit felt i postlistesystemet, fortel Gulbrandsøy.

Front-end

(1) Push varsling til smarttelefon.

(3 og 5) Enkel eller avansert søk.

(6) Push varsling til e-post.

(4) Abonnere på søk, abonnere på ein eller fleire saker, felles og private notatar.

Automatisk generering av søknadar for innsyn i dokument.

Back-end

(3) Oppsett av skrapefrekvens.

(2) Administrator-funksjon for kontroll over alle brukarar, og logg-funksjon for innsyn i: skraping, innsynskrav, og diverse systeminnstillingar.

Indeksering av informasjon

— Vi brukte ein mySQL database med fulltekst indeksering og stoppordliste for å lagra og strukturere all informasjonen, fortel Gulbrandsøy. For å kunne lagra og strukturere informasjonen måtte dei laga samansette nøklar for unik identifisering av dei enkelte journalane, sakene og dokumenta.

Gulbrandsøy seier at han lærde mykje om SQL databasar og koding i JavaScript, PHP, og Regex.

“Skraping” av postjournalar

Systemet brukar metoden «skraping» for henting av datasett frå dei ulike etatane journalisten trong å lesa. — Hovudutfordringa var å oversette resultata vi fekk frå dei eksterne systema over til noko som vi kunne sette inn i databasen, då indeksert sjølvsagt, utdjupar Gulbrandsøy.

Dei andre utfordringane var faren for å overbelaste systema dei skulle «skrape». — Det skjedde nokre gongar under testing av denne funksjonaliteten, då servarane blei overbelasta og gjekk ned grunna «skrapinga».

Grunna testinga fekk studentgruppa erfara korleis ein måtte sette fornuftige rammer for denne «skrape» aktiviteten, slik at serverane ikkje blei overbelasta.

Fakta om “Postliste”

Postliste er eit søkjeverkty for innsamling av offentlege postjournalar for journalistar.

Postliste lar journalisten søkje på tvers av etatar, gjøre avanserte søk, og få push varsling på e-post og smarttelefon.

Systemet er produsert av Hilde Skjong, Niklas W. Iversen, Renate Bratseth, og Rune Gulbrandsøy.


Publisert: 13. juni 2016
linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram