1. Kvalitet før skala
Små, gode datasett med høy presisjon er ofte bedre enn store, uklare datasett med mye feil.
For å lykkes med samisk AI trengs både teknisk kvalitet og respekt for språk og kultur. Her er et kort, praktisk veikart.
| Tiltak | Hvorfor | Eksempel |
|---|---|---|
| Tydelig språkmerking | Skiller mellom nordsamisk, lulesamisk og sørsamisk | Merk data per språkvariant før trening |
| Kvalitetskontroll av data | Reduserer støy, duplikater og feil | Bygg manuelle sjekkrutiner med språkeksperter |
| Domene-tilpasset evaluering | Gir realistisk måling av nytte i praksis | Lag testsett for skole, helse, offentlig språk |
| Åpen dokumentasjon | Skaper tillit og gjør modellgrenser synlige | Publiser modellkort med svakheter og lisens |
| Lokalt samarbeid | Bedre forankring i reelle språkbehov | Jobb med samiske institusjoner og læringsmiljøer |
Små, gode datasett med høy presisjon er ofte bedre enn store, uklare datasett med mye feil.
Involver språkbrukere og fagmiljø tidlig, ikke bare i sluttfasen.
Sett av ressurser til forbedring, feilretting og nye evalueringer etter lansering.
Gå tilbake til oversikten om samiske språkmodeller eller les utfordringene i detalj.