1. Kvalitet før skala
Små, gode datasett med høy presisjon er ofte bedre enn store, uklare datasett med mye feil.
For å lykkes med samisk AI trengs både teknisk kvalitet og respekt for språk og kultur. Her er et kort, praktisk veikart for 2026.
| Tiltak | Hvorfor | Eksempel |
|---|---|---|
| Tydelig språkmerking | Skiller mellom nordsamisk, lulesamisk og sørsamisk | Merk data per språkvariant før trening |
| Kvalitetskontroll av data | Reduserer støy, duplikater og feil | Bygg manuelle sjekkrutiner med språkeksperter |
| Domene-tilpasset evaluering | Gir realistisk måling av nytte i praksis | Lag testsett for skole, helse og offentlig språk |
| Åpen dokumentasjon | Skaper tillit og gjør modellgrenser synlige | Publiser modellkort med svakheter og lisens |
| Lokalt samarbeid | Bedre forankring i reelle språkbehov | Jobb med samiske institusjoner og læringsmiljøer |
Små, gode datasett med høy presisjon er ofte bedre enn store, uklare datasett med mye feil.
Involver språkbrukere og fagmiljø tidlig, ikke bare i sluttfasen.
Sett av ressurser til forbedring, feilretting og nye evalueringer etter lansering.
Det er fortsatt behov for mer systematisk arbeid med samiske data, evaluering og drift. De mest realistiske gevinstene kommer når man bygger trinnvis og tett med språkfaglige miljøer.
Gå tilbake til oversikten om samiske språkmodeller eller les utfordringene i detalj.