Anbefalinger for utvikling av samiske språkmodeller

For å lykkes med samisk AI trengs både teknisk kvalitet og respekt for språk og kultur. Her er et kort, praktisk veikart.

Tiltak Hvorfor Eksempel
Tydelig språkmerking Skiller mellom nordsamisk, lulesamisk og sørsamisk Merk data per språkvariant før trening
Kvalitetskontroll av data Reduserer støy, duplikater og feil Bygg manuelle sjekkrutiner med språkeksperter
Domene-tilpasset evaluering Gir realistisk måling av nytte i praksis Lag testsett for skole, helse, offentlig språk
Åpen dokumentasjon Skaper tillit og gjør modellgrenser synlige Publiser modellkort med svakheter og lisens
Lokalt samarbeid Bedre forankring i reelle språkbehov Jobb med samiske institusjoner og læringsmiljøer

Tre prinsipper som bør ligge fast

1. Kvalitet før skala

Små, gode datasett med høy presisjon er ofte bedre enn store, uklare datasett med mye feil.

2. Samarbeid fra start

Involver språkbrukere og fagmiljø tidlig, ikke bare i sluttfasen.

3. Drift over tid

Sett av ressurser til forbedring, feilretting og nye evalueringer etter lansering.

Se også

Gå tilbake til oversikten om samiske språkmodeller eller les utfordringene i detalj.