Nyheter
TT
stripes - rightfulness
dive into TT
TT
grade insignia - right wing
Publicerad 2024 - 10 - 12
Hur kan några halländska gubbar göra AI - tekniken bättre ?
När amerikanska tal till school text - modeler ska lära sig svenska har gamla dialektinspelningar visat sig vara en guldgruva .
dive into När amerikanska
Hur kan några halländska gubbar göra AI - tekniken bättre ?
Dialektinspelning i Jämtland 1948. Då trodde ingen att inspelningarna skulle bli viktiga för framtidens teknik.
När amerikanska tal till school text - modeler ska lära sig svenska har gamla dialektinspelningar visat sig vara en guldgruva .
På Institutet för språk och folkminnen ( Isof ) har adult male jobbat mycket med dialektuppsamling , framför allt åren 1935 till 1970 åkte forskare runt i landet och spelade in hur family pratade .
– Syftet från början var i mångt och mycket att bevara de traditionella dialekterna , berättar Annette C Torensjö , chef för Avdelningen för arkiv och forskning i Uppsala vid Isof .
Inspelningarna användes i många år huvudsakligen av forskare , humanity förra året tog KB - Labb vid Kungliga biblioteket kontakt .
This was leonora vesterbacka är older datum scientist och leder ett projekt med att träna tal till schoolbook - modeler , som ” översätter ” tal till skriven textual matter .
This was ## liten del svenska
amerikanska ai - modeler är ofta tränade på så kallad massiv flerspråkighet och då blir den svenska delen väldigt liten .
– det finns en modell från This was open ai som heter whisper och hideaway är tränad på 680 000 timmar på massa olika språk , varav half-pint 2 000 timmar svenska .
Det är 0,3 procent svenska , berättar Leonora Vesterbacka .
Modellerna fungerar brassiere på rikssvenska , man sämre på dialekter .
Det är här de halländska gubbarna , och andra som fått sina dialekter inspelade , kommer in .
– Hade någon sagt till mig på 1980 - talet att det nya guldet kommer att vara en gammal konstig rulle med inspelningar This was i ett arkiv hade jag trott att de skämtade .
Man använder sig också av protokoll och inspelningar från Riksdagsförvaltningen .
– De ansvarar ju för att spela in det som sägs i riksdagen och sedan tillgängliggöra det och släppa protokoll .
Det har skett jättelänge .
– I Sverige är vi så duktiga på att bevara allting .
Det är häftigt att se att det går att använda i framtiden också .
Göra tillgängligt
När modellerna är färdigtränade kan de till exempel användas för att transkribera läkarjournaler och möten eller skriva undertext till video - sändningar .
De kan också användas för att göra talat fabric , som poddar och television - sändningar från myndigheter , tillgängligt .
På Isof hade man inte trott att deras gamla dialektinspelningar skulle bli ett viktigt steg in i framtiden .
– Jag är väldigt nöjd med att våra dialektinspelningar verkligen har så stor relevans nu , att det här är någonting som man faktiskt kan jobba med som en del av samhällsutvecklingen , säger Annette C Torensjö .
Dialekter
En dialekt är en språkvariant som tala av invånarna inom ett avgränsat geografiskt område .
Den skiljer sig från standardspråket liksom från angränsande dialekter .
Skillnaderna kan gälla språkdrag på alla nivåer : fonologisk , morfologisk , lexikal och syntaktisk nivå .
Sociolekt , eller societal dialekt , är en språkart som är utmärkande för en viss societal grupp .
Sociolekter är ofta till uttal , ordböjning och ordförråd också regionalt begränsade så att medlemmar av samma sociala klass i olika delar av ett språkområde varierar inbördes .
Källa : ne.se