Hoppa till huvudinnehåll

Svensk språkmodell sätter fart på AI i vården

fredag, november 8, 2024

En nyhet som vi alla kunnat ta del av under våren var att AI Sweden, tillsammans med RISE och WASP WARA Media & Language, har utvecklat en storskalig generativ språkmodell för de nordiska språken, främst svenska. GPT-SW3, som språkmodellen heter, är den första riktigt stora generativa språkmodellen för svenska och den är baserad på samma tekniska principer som OpenAI GPT-4. Men den stora skillnaden är att genom den öppna licensen gör modellen det möjligt för svenska organisationer att bygga tillämpningar som tidigare inte var möjliga.

Ariel E

I projektet GPT-SW3: en basmodell för svensk texthantering har man undersökt just dessa möjligheter. Huvudparter är AI Sweden, RISE och WARA Media and Language. Det Vinnova-finansierade projektet startade 2022 och avslutas i höst.  Vi har pratat med projektledare Ariel Ekgren på AI Sweden som är ett systerprogram till PICTA, och Hanna Maurin Söderholm, programansvarig på PICTA.

 

Kan du berätta lite om det här projektet, Ariel?
 

Det här projektet har undersökt möjligheten att använda en storskalig svensk generativ språkmodell för att skapa en generell lösning för texthanteringsuppgifter som kan användas av många olika behovsägare. Projektet utgår från GPT-SW3 som ju gjort det möjligt för oss att börja utveckla en mer generell användning än vi tidigare haft möjlighet till. Inom projektet finns behovsägare från både privat sektor, alltså såväl startups som som större företag, och offentlig sektor genom exempelvis Tillväxtverket, Västra Götalandsregionen och Region Halland. Vi har även haft med behovsägare från forskningsvärlden. 

Hur kan språkmodellen användas?

Här är det svårt att ge exempel, eftersom det kan handla om så otroligt mycket! Men alla typer av tillämpningar som är möjliga att bygga med storskaliga språkmodeller kan vara lämpliga, exempelvis lösningar för textanalys, klassificering, textgenerering, textbearbetning, innehållsmoderering, chattfunktioner och så vidare.

Kan du berätta om några specifika tillämpningar?

En tillämpning som ser lovande ut är om detta kan användas för att förbättra prediktion av fallolyckor hos inlagda patienter på sjukhus. Ett annat område där några regioner har tagit första steget är för journaler och journalanteckningar, där de lägst hängande frukterna handlar om automatisk transkribering och summering av journalanteckningar, till exempel epikriser. 

Vad händer nu, Hanna?

– Vi på PICTA har följt projektet med stort intresse och arbetar med att sprida resultaten till fler aktörer, främst inom prehospital vård och larmsjukvård, säger Hanna Maurin Söderholm. Det finns en enorm potential som inte bara är kopplad till hantering av journaler, men också till användning vid inkommande samtal till larmcentraler, exempelvis för att simultant transkribera och summera samtalet. Eller uppmärksamma särskilda värdeord som en larmoperatör kan missa i en stressig eller komplex larmsituation.  Vi planerar att tillsammans med AI Sweden arrangera ett öppet digitalt lunchseminarium om GPT-SW3, chatGPT och möjligheterna för larmsjukvården och den prehospitala vården. Om du vill få en inbjudan till detta, har en egen idé, eller bara vill veta mer kan du kontakta oss. (Maila: helene.lindstrom@lindholmen.se)
 

Faktaruta

GPT-SW3 är släppt med en öppen licens och finns tillgänglig i sex olika storlekar. 126 miljoner, 356 miljon, 1,3 miljarder, 6,7 miljarder, 20 miljarder och 40 miljarder parametrar. Storleken på modellen innebär att det krävs rejält med beräkningskapacitet för att kunna använda den. De nuvarande GPT-SW3-modellerna är tränade på Linköpings universitets superdator, Berzelius, med hjälp av Nemo Megatron-ramverket från NVIDIA.