Anbefalinger for utvikling av samiske språkmodeller

For å lykkes med samisk AI trengs både teknisk kvalitet og respekt for språk og kultur. Her er et kort, praktisk veikart for 2026.

Tiltak Hvorfor Eksempel
Tydelig språkmerking Skiller mellom nordsamisk, lulesamisk og sørsamisk Merk data per språkvariant før trening
Kvalitetskontroll av data Reduserer støy, duplikater og feil Bygg manuelle sjekkrutiner med språkeksperter
Domene-tilpasset evaluering Gir realistisk måling av nytte i praksis Lag testsett for skole, helse og offentlig språk
Åpen dokumentasjon Skaper tillit og gjør modellgrenser synlige Publiser modellkort med svakheter og lisens
Lokalt samarbeid Bedre forankring i reelle språkbehov Jobb med samiske institusjoner og læringsmiljøer

Tre prinsipper som bør ligge fast

1. Kvalitet før skala

Små, gode datasett med høy presisjon er ofte bedre enn store, uklare datasett med mye feil.

2. Samarbeid fra start

Involver språkbrukere og fagmiljø tidlig, ikke bare i sluttfasen.

3. Drift over tid

Sett av ressurser til forbedring, feilretting og nye evalueringer etter lansering.

Status i mai/juni 2026

Det er fortsatt behov for mer systematisk arbeid med samiske data, evaluering og drift. De mest realistiske gevinstene kommer når man bygger trinnvis og tett med språkfaglige miljøer.

Se også

Gå tilbake til oversikten om samiske språkmodeller eller les utfordringene i detalj.