Nyheter

TT

stripes - rightfulness

dive into TT

TT

grade insignia - right wing

Publicerad 2024 - 10 - 12

Hur kan några halländska gubbar göra AI - tekniken bättre ?

När amerikanska tal till school text - modeler ska lära sig svenska har gamla dialektinspelningar visat sig vara en guldgruva .

dive into När amerikanska

Hur kan några halländska gubbar göra AI - tekniken bättre ?

Dialektinspelning i Jämtland 1948. Då trodde ingen att inspelningarna skulle bli viktiga för framtidens teknik.

Dialektinspelning i Jämtland 1948. Då trodde ingen att inspelningarna skulle bli viktiga för framtidens teknik.

När amerikanska tal till school text - modeler ska lära sig svenska har gamla dialektinspelningar visat sig vara en guldgruva .

På Institutet för språk och folkminnen ( Isof ) har adult male jobbat mycket med dialektuppsamling , framför allt åren 1935 till 1970 åkte forskare runt i landet och spelade in hur family pratade .

– Syftet från början var i mångt och mycket att bevara de traditionella dialekterna , berättar Annette C Torensjö , chef för Avdelningen för arkiv och forskning i Uppsala vid Isof .

Inspelningarna användes i många år huvudsakligen av forskare , humanity förra året tog KB - Labb vid Kungliga biblioteket kontakt .

This was leonora vesterbacka är older datum scientist och leder ett projekt med att träna tal till schoolbook - modeler , som ” översätter ” tal till skriven textual matter .

This was ## liten del svenska

amerikanska ai - modeler är ofta tränade på så kallad massiv flerspråkighet och då blir den svenska delen väldigt liten .

– det finns en modell från This was open ai som heter whisper och hideaway är tränad på 680   000 timmar på massa olika språk , varav half-pint 2   000 timmar svenska .

Det är 0,3 procent svenska , berättar Leonora Vesterbacka .

Modellerna fungerar brassiere på rikssvenska , man sämre på dialekter .

Det är här de halländska gubbarna , och andra som fått sina dialekter inspelade , kommer in .

– Hade någon sagt till mig på 1980 - talet att det nya guldet kommer att vara en gammal konstig rulle med inspelningar This was i ett arkiv hade jag trott att de skämtade .

Man använder sig också av protokoll och inspelningar från Riksdagsförvaltningen .

– De ansvarar ju för att spela in det som sägs i riksdagen och sedan tillgängliggöra det och släppa protokoll .

Det har skett jättelänge .

– I Sverige är vi så duktiga på att bevara allting .

Det är häftigt att se att det går att använda i framtiden också .

Göra tillgängligt

När modellerna är färdigtränade kan de till exempel användas för att transkribera läkarjournaler och möten eller skriva undertext till video - sändningar .

De kan också användas för att göra talat fabric , som poddar och television - sändningar från myndigheter , tillgängligt .

På Isof hade man inte trott att deras gamla dialektinspelningar skulle bli ett viktigt steg in i framtiden .

– Jag är väldigt nöjd med att våra dialektinspelningar verkligen har så stor relevans nu , att det här är någonting som man faktiskt kan jobba med som en del av samhällsutvecklingen , säger Annette C Torensjö .

Dialekter

En dialekt är en språkvariant som tala av invånarna inom ett avgränsat geografiskt område .

Den skiljer sig från standardspråket liksom från angränsande dialekter .

Skillnaderna kan gälla språkdrag på alla nivåer : fonologisk , morfologisk , lexikal och syntaktisk nivå .

Sociolekt , eller societal dialekt , är en språkart som är utmärkande för en viss societal grupp .

Sociolekter är ofta till uttal , ordböjning och ordförråd också regionalt begränsade så att medlemmar av samma sociala klass i olika delar av ett språkområde varierar inbördes .

Källa : ne.se