
Podcast om åbne danske sprogdata til træning AI
- Nyheder
- Sprogdata til AI
Open Data DK gæster podcasten AI Denmark, hvor vært Anders Høgh Nissen interviewer sekretariatet om åbne offentlige sprogdata til træning af kunstig intelligens.
I episoden fortæller sekretariatet, hvordan indsamling af dansk sprogdata i en kommunal kontekst kan skabe samfundsværdi. For når fremtidens AI-løsninger bliver bedre til at forstå alle varianter af dansk tale, bliver teknologien mere inkluderende og brugbar for borgere.
Et nyt tiltag i projektet Donér din stemme er muligheden for at angive, om man har en accent – ikke kun en dialekt som sønderjysk eller bornholmsk. Det bidrager til at skabe mere mangfoldige og repræsentative datasæt til sprogteknologisk udvikling.
Anders Høgh Nissen prøver selv kræfter med at donere sin stemme, og du kan se, hvordan det går, på Linkedin, hvor han deler oplevelsen.
Samtalen kredser desuden om det juridiske arbejde, som foreningen er i gang med i et projekt om byrådsdata. I samarbejde med Digitaliseringsstyrelsen, fem kommuner og Kammeradvokaten arbejdes der på at skabe nogle standardafklaringer for, hvordan byrådsdata kan anvendes til træning af AI. Når de juridiske rammer er på plads, kan det tekniske arbejde med at tilgængeliggøre de kommunale tekstdata begynde.
Byrådsdata er særligt interessante, fordi de repræsenterer mange forskellige typer forvaltninger og fagområder i kommunen. Samtidig er det data, som allerede bliver indsamlet og udstillet i en vis form, hvilket kan gøre arbejdet mindre komplekst – både juridisk og teknisk – i forhold til AI-brug.
🎧 Lyt til hele interviewet dér, hvor du plejer at høre podcasts: AI Denmark
Episode: “Åbne danske data til træning af AI”