
Sprogmodeller i det offentlige: Åbne sprogdata fra kommuner har stor værdi.
- Nyheder
- Sprogdata til AI
Kunstig intelligens kan understøtte kommunale arbejdsopgaver og løfte fremtidens velfærd. Men for at AI-løsninger kan forstå dansk i en kommunal kontekst, kræves åbne og tilgængelige datasæt – også fra kommuner.Open Data DK arbejder for at muliggøre netop dette ved at understøtte kommunernes arbejde med datadeling og juridisk afklaring om åbne sprogdata.
**Denne artikel er udgivet i Ingeniørens nichemedie Digitech** Du kan derfor også finde artiklen her. Det kræver abonnement at læse artiklen.
Kommunale sprogdata styrker AI-løsninger
I Regeringens Strategiske Indsats for kunstig intelligens (december 2024) afsættes 21,1 millioner kroner til at gøre offentlige sprogdata frit tilgængelige. Tilgængeliggørelsen af sprogdatasæt fra Rigsarkivet, Det Kongelige Bibliotek og Folketinget danner fundamentet for danske sprogressourcer, men også kommunale data rummer et stort potentiale.
Arbejdet med sagsbehandling er et konkret eksempel. På byggesagsområdet kan ventetiden reduceres, hvis AI hjælper med straks-afklaringer for både borgere og sagsbehandlere. Der findes allerede skræddersyede AI-løsninger i nogle kommuner, der er trænet på lokale kommunedata, men hvorfor udvikle den samme model 98 gange?
Hvis kommunale sprogdata gøres frit tilgængelige, kan flere kommuner drage fordel af fælles datasæt, hvilket både kan spare ressourcer og sikre bedre løsninger.
Selvfølgelig kan vi ikke blot frigøre data som borgerhenvendelser, journalnotater og høringssvar. Den tekniske udstilling skal gennemtænkes, og de juridiske rammer – særligt i forhold til ophavsret og GDPR – skal være på plads.
Projekt om åbne byrådsdata baner vejen
Kommuner offentliggør allerede dagsordener og referater fra byrådsmøder som følge af kommunestyrelsesloven. Oftest er de at finde på kommuners egen hjemmeside, men det betyder ikke, at disse tekster lovligt kan bruges til AI-træning.
Derfor undersøger Tønder, Aarhus, Kalundborg, Favrskov og Vejle Kommune i samarbejde med Open Data DK og Digitaliseringsstyrelsen juridiske spørgsmål på området, som nu ligger til afklaring hos Kammeradvokaten.
Målet er at skabe standardafklaringer, som kan hjælpe dataejere og dataanvendere med at forstå, hvordan sprogdata – herunder byrådsdata – kan anvendes i AI-udvikling. Resultaterne kan også bane vejen for lignende initiativer, f.eks. på byggesagsområdet eller i borgerservice.
AI skal kunne forstå alle borgere
Kommuner har interne begreber og udtryk, der skal overføres til sprogmodeller, så medarbejdere og borgere kan bruge AI-løsninger effektivt. Derudover er det vigtigt, at AI forstår dialekter og accenter, så alle borgere kan kommunikere med digitale services.
For mange myndigheder er AI allerede en del af borgerkontakten via chatbots eller stemmeaktiverede services. Men ofte mødes borgerne med beskeden:
“Beklager, det forstod jeg ikke. Vil du gentage?”
Dette er særligt et problem, hvis AI’en ikke er trænet i at forstå forskellige dialekter eller accenter.
Donér din stemme – bedre taledata til AI
“Donér din stemme” er et initiativ fra Open Data DK, der skaber en landsdækkende samling af taledata fra borgernes stemmer. Gennem oplæsning af tekststykker om fiktive kommunale situationer i “Vildby Kommune” – fx affaldssortering, anlægning af ny cykelsti eller placering i dagtilbud – opbygges et datasæt til AI-træning.
De indsamlede stemmer udstilles åbent på Open Data DK. Kommuner med særlige dialekter eller accenter kan bidrage til at sikre et mere repræsentativt datasæt, og har modtaget materiale til at udbrede initiativet lokalt.
Åbne sprogdata styrker innovation og velfærd
Når data gøres frit tilgængelige, skaber det nye muligheder for innovation – både i den offentlige og private sektor. Åbne kommunale sprogressourcer bidrager ikke kun til bedre AI-løsninger, men også til en stærkere digital infrastruktur i velfærdssamfundet. Hvis vi vil fastholde et højt serviceniveau, må vi sikre, at fremtidens teknologi bygger på data, der repræsenterer hele samfundet – herunder de danske kommuner.
Læs mere om projekterne og arbejdet med åbne kommunale sprogdata i Open Data DK her.