Generativ KI i norskfaget

Her kan du lese Siv Sørås Valands tekst om bruk av KI i norskfaget.

Hvordan kan vi bruke generativ KI på læringsfremmende måter? llustrasjon: Colourbox

[Denne teksten er en lett redigert versjon av en artikkel Valand skrev da hun fortsatt jobbet som norsklærer i videregående skole. Opprinnelig versjon er publisert i tidsskriftet Norsklæreren nr. 3-2023]

Flere har brukt metaforen om tannkremtuben i beskrivelsen av generativ kunstig intelligens. Når tannkremen er ute, er det vanskelig å få den inn igjen. Språkmodellene er her og kommer ikke til å forsvinne. Om vi forfølger metaforen, kan vi også tilføye at tannkrem kan være skadelig om den inntas i for store doser. Enkelte tannkremer skal til og med unngås, særlig til de minste, ifølge Forbrukerrådet. På den andre siden, med tilpasset, riktig bruk, kan tannkrem gi både økt folkehelse og livsmestring. I denne teksten skriver jeg om hvordan jeg tror vi kan bruke generativ KI på læringsfremmende måter, og om hva som skal til for at vi skal kunne utnytte mulighetene til elevenes beste.

DALL-E

DALL-E er en av flere KI-drevne bildegeneratorer. På nettstedet openai.com/dall-e-2 kan man legge inn instruksjoner om innhold, farge, form, stilretning og teknikk. DALL-E krever innlogging og personopplysninger, så når jeg har brukt appen i klasserommet, har elevene skrevet instruksene (promptene), men vi har brukt min DALL-E-bruker til å generere bildene. Her presenteres noen eksempler på bruk av DALL-E i norsk på vg2.

Til nærlesing av klassisk litteratur

I en vg2-klasse jobbet vi i vår med Mary Shelleys Frankenstein. Vi leste avsnittene der skapningen vekkes til liv og hvor det står detaljerte skildringer av hvordan han ser ut. Mens vi leste, noterte elevene alt som stod om skapningens utseende. Deretter lagde de i grupper, instruksjoner til DALL-E der målet var å få den til å generere det mest «troverdige» Frankensteins monster. Jeg matet min DALL-E-bruker med elevenes instrukser mens alle fulgte med «live» på storskjerm. Spennende å vente på hva som dukket opp!

Denne høsten har jeg gjort omtrent det samme med min nye vg2-klasse, men ved lesing av Gunnlaug Ormstunges saga. Vi leste sagaen høyt sammen, og da elevene etter ca. 30 minutter begynte å bli glassaktige i blikket, stoppet vi opp ved den detaljerte skildringen av hovedpersonen Gunnlaug. I grupper lagde elevene instrukser til DALL-E der de prøvde å «prompte» frem en Gunnlaug, slik han står beskrevet i teksten. Igjen stort engasjement og ivrig nærlesing, samtidig som elevene fikk med seg ett og annet om mannsidealet i sagatiden.

Til å illustrere

Ellers bruker jeg DALL-E til å illustrere tekster og presentasjoner til bruk i undervisningen, til å illustrere elevskrevne dikt med mer. Med kunst og håndverk i fagbakgrunnen, har jeg klokkertro på bruk av bilder, ikke minst som støtte for hukommelsen. Med DALL-E kan man generere bilder som gjør tekster mer tilgjengelige, og lettere å huske. Med bilde og verbalspråk kan vi eksperimentere med form, utforske effekter og hvilken påvirkning bilder har på tolkning og meningsskaping.

ChatGPT

Til muntlige aktiviteter

Generativ KI kan rydde rom for målrettet trening i spesifikke ferdigheter. ChatGPT kan for eksempel være et verdifullt hjelpemiddel å bruke når poenget ikke (!) er å lære ved å produsere tekst selv.

Pecha kucha

I vår gjennomførte vg2-elevene mine en oppgave der hovedmålet var å øve på muntlighet og muntlige ferdigheter. Det er viktig å nevne at målet ikke var produksjon av innhold, men trening i en krevende muntlig øvelse.

Oppgaven var å lage en pecha kucha, som er et foredragsformat der man presenterer et emne muntlig, sammen med lysbilder som er forhåndsinnstilt på tid. Hvert lysbilde står i 20 sekunder før det skifter av seg selv til neste bilde. Poenget er at dette formatet gir trening i planlegging, timing og fremføring av en muntlig presentasjon. For å lykkes, er man nødt til å øve.

Elevene kunne velge mellom fire ulike problemstillinger/overskrifter, og innholdet skulle aktualisere litteratur vi hadde jobbet med i løpet av året. Elevene lastet ned ferdig tidsinnstilte powerpointer. Åpningssiden var laget på forhånd, og elevene skulle fylle på med resten. De kunne velge mellom fire forsider/overskrifter:

Hva betyr «ære» i dag? (norrøn litteratur)
Finnes egentlig fri vilje? Kan vi selv påvirke vår skjebne? (renessanse, Hamlet)
Kan vi få for mye informasjon? (opplysningstid og klassisisme)
Når mennesket leker gud (romantikk, Frankenstein)

Dette er en kompleks og krevende oppgave med mange komponenter. Jeg ville øve elevene i muntlige ferdigheter og lot dem som ville benytte ChatGPT til hjelp med innholdet. Elever som allerede hadde private kontoer, kunne bruke disse, mens andre leverte instruksene (promptene) til meg. Jeg modellerte en instruks som alle kunne tilpasse og bruke:

Jeg har fått i oppgave å holde en pecha kucha med 10-15 lysbilder. Tittelen på presentasjonen er: "Kan vi få for mye informasjon"? Et hovedpoeng er at vi skal vise at vi kan anvende kunnskaper og ferdigheter vi har tilegnet oss i norskfaget i vg2. Vi har blant annet lest Holberg-dramaet Erasmus Montanus og lært om opplysningstid og klassisisme. Følgende kompetansemål er særlig relevant: 1. lese og tolke tekster fra 1500 til 1850 i kulturhistorisk kontekst og drøfte hvordan de er relevante i dag. Har du et kort innspill til hvordan jeg kan vinkle oppgaven, og i tillegg gi meg forslag til bildemotiver i presentasjonen? Jeg vil også at presentasjonen skal være underholdende å se/høre på og at den fremstår som kreativ og original.

Åpningen for bruk av ChatGPT viste seg å ha både fordeler og ulemper. Fordelen var at elevene relativt raskt fikk generert innhold til presentasjonen som de kunne begynne å øve på. Den store ulempen var at mange fikk et svakt eierforhold til innholdet. De brukte det ChatGPT foreslo temmelig ukritisk.

Det bør legges til at oppgaven ble gjennomført på slutten av skoleåret, der avgangsfag og eksamener gjorde krav på størstedelen av elevenes oppmerksomhet. Motivasjonen for hardt arbeid med en krevende norskfaglig oppgave var skjør. Erfaringen med oppgaven tilsa at elevene burde ha grundigere med bearbeiding og tilegnelse av innholdet i presentasjonene. Form og innhold henger som kjent sammen, og det svake eierskapet til innholdet, gikk selvsagt ut over hva elevene presterte muntlig.

Generere skuespill

En annen måte jeg har brukt ChatGPT på, er å få den til å generere skuespill. Få av elevene mine hadde referanser til den tidligere nevnte romanen Frankenstein. Derfor brukte vi litt tid på å jobbe oss inn i tematikk før vi gikk løs på teksten. Vi startet med at jeg gav fire elever et manus som de leste og fremførte i klassen. Ingen av elevene hadde lest det på forhånd. Instruksen jeg hadde gitt til GPT var følgende:

Lag et skuespill på omtrent 800 ord med fire skuespillere. Det skal handle om en overivrig norsklærer. Læreren lager en oppfinnelse som gjør at alles favorittfag blir norsk. Hun klarer ved hjelp av kunstig intelligens å lage en maskin som elevene sendes gjennom. Ved hjelp av moderne bioteknologi manipuleres elevenes hjerner slik at de etter behandlingen elsker norskfaget og bare vil ha norsk, norsk, norsk hele tiden. Alle elever som er behandlet av maskinen går plutselig over til å snakke nynorsk [bokmål var elevenes hovedmål]. Men som i fortellingen om Frankensteins monster, mister læreren kontrollen over det hun har skapt, og det viser seg at hun har skapt et sant monster. Skuespillet ender med tragedie.

Fremføringen ble en artig opplevelse. Oppgaven elevene fikk var deretter som følger:

Lag tilsvarende instruksjoner til et skuespill om teknologi som er utviklet med gode intensjoner. Handlingen ender likevel med tragedie. Gjør det dagsaktuelt. Start instruksjonen med "Lag en moderne frankensteinhistorie".

Oppgaven ble løst i grupper og førte til svært gode samtaler om Frankensteins aktualitet. Underveis fikk klassen utdelt en fagartikkel som aktualiserer romanen. Der trekkes paralleller til mulige menneskeskapte «monstre». Artikkelen nevner eksempler fra moderne bioteknologi, fra forskning på kryonisk nedfrysning (der målet er at fremtidens teknologi skal gjenopplive døde personer), sosiale medier, kjernefysiske og biologiske våpen, teknologi som har medført klimaendringer, med flere. Jeg nevner det siden dette var et tidspunkt der elevene var svært mottakelige for å lese fagtekst. Innholdet kunne de la seg inspirere av i sine egne dramatiske plott. Gruppene lagde detaljerte instrukser som jeg matet min egen GPT-bruker med. Manusene ble deretter skrevet ut, øvd på og fremført. Mye latter, mye eierskap til tematikk i Frankenstein, og god motivasjon for å lese lengre utdrag og å lytte til NRKs hørespill Frankenstein eller den nye Prometevs.

Perplexity

Til informasjonsinnhenting og øving i kildekritikk

Perplexity.ai er en generativ KI som skiller seg fra tjenester som ChatGPT og Bing ved at man kan bruke chatboten uten innlogging, og den skiller seg fra ChatGPT ved at den viser tydelig til hvilke kilder den har brukt, og hvor i teksten den har brukt dem¹.

Siden det var valghøst, brukte vi i vg2 starten av skoleåret på politikk, retorikk og argumentasjon. Vi startet med noen innledende oppgaver der målet var bevisstgjøring, refleksjon og øvelse i kildekritikk. Jeg viste hvordan Perplexity fungerer, med eksempler på svakheter. Blant annet ba jeg chatboten om å beskrive Gunnlaug i Gunnlaug Ormstunges saga. Poenget var ikke svaret, men å modellere en vurdering av kildene verktøyet viste til. Kildene varierte med alt fra Daria (med elevskrevne tekster) til vitenskapelige avhandlinger.

Så ville jeg vise svakheter i innhold generert av generativ KI. Jeg stilte Perplexity spørsmålet «Hva er det viktigste innholdet i norskfaget på vg2?». Svaret var som følger: «Ifølge Udir skal elevene ha hele opplæringen i engelsk på vg1, mens opplæringen i norsk er lagt til vg2». Det er jo ikke feil, men chatboten unnlater å nevne at dette bare gjelder for yrkesfag. Dermed blir svaret villedende og et godt eksempel på hvorfor man skal være kritisk til svar fra avanserte språkmodeller.

Deretter fikk elevene parvis i oppgave å bruke Perplexity til å søke etter informasjon om et emne de selv hadde god greie på, for at det skulle bli mulig for dem å vurdere svar og kilder. I OneNote klassenotatbok svarte de på følgende spørsmål:

Hva spurte dere om?
Hvordan vurderer dere svarene dere fikk?
Hva slags kilder viste Perplexity til? Hvordan vurderer du kildene? Vær konkret i svaret
Hvorfor kan man ikke stole på det avanserte språkmodeller (KI-baserte chatbots) skriver?

Svarene ble brukt til repetisjon av kildekritikk. Hvorfor er ikke et leserinnlegg en god kilde til faktainformasjon, selv om det står i Aftenposten? Hvorfor er ikke verken YouTube eller Wikipedia nødvendigvis dårlige kilder? Hvorfor bør ikke kommersielle nettsider med produktsalg brukes som faktakilde? Hvorfor er Fandom.com en svak faktakilde? Osv. Igjen en erkjennelse av at kildevurdering er noe av det mest krevende vi driver med i skolen.

Etter en økt om argumentasjon, fikk grupper på fire i oppgave å lage en pecha kucha som skulle brukes til å overbevise om fortreffeligheten til et bestemt politisk parti. Gruppene fikk lenke til stortingspartienes partiprogram og kunne vinkle appellen mot et bestemt tema (helse, utdanningspolitikk, klima osv.). Til hjelp fikk de bruke Perplexity.ai. Der kan man legge inn nettadressen til et politisk parti og stille spørsmål til innholdet. Eksempel:

Bruk denne kilden til å skrive om Rødts skolepolitikk: https://roedt.no/.

Perplexity brukte utelukkende Rødts hjemmeside som kilde til å skrive om partiets skolepolitikk. Og for hver påstand, viste den til hvor i partiprogrammet den hadde hentet informasjonen fra. Man kan også legge inn partiprogrammene til eksempelvis FRP og SV og be Perplexity om å sammenlikne partienes skole- klima- eller kulturpolitikk. Til dette synes jeg verktøyet fungerte godt.

Jeg har over prøvd å vise eksempler på hvordan man innenfor dagens rammer (høsten 2023, Viken) kan bruke generativ KI i norskfaget, uten å bli forgiftet. Det er viktig å legge til at siden verktøyene er så nye, er det jeg har beskrevet førstegangserfaringer som vil ligge til grunn for videre praksis. Videre deler jeg noen tanker om videre utvikling.

Forslag til læringsfremmende bruk av generativ KI i skriveopplæringen (i fremtiden)

Som norsklærer er jeg særlig interessert i skriveopplæring. Siden antall karakterer ble redusert fra tre til to på vg1 og vg2, har jeg som mange andre i større grad praktisert prosessorientert skrivepedagogikk. Men det er likevel krevende å skulle følge 30 elevers skriveprosesser samtidig. Elevene gir respons på hverandres tekster, men det er fremdeles læreren som sitter på den viktigste vurderingskompetansen. Hverandre- og egenvurdering er fint, men fører ikke elevens skriveutvikling fremover på samme måte som norsklærerblikket. Forskning på respons sier dessuten at eleven bør få responsen mens hen er i prosessen. Det er ikke lett å få til! Og jeg må innrømme at det blir mest skriving i prosess på vg1 og vg2. Med vurderingsjaget på vg3, må til tider den gode skrivepedagogikken vike. Kan vi bruke generativ KI som bestanddel i en mer bærekraftig vurderingspraksis?

Respons til elever

Det er allerede publisert en del forskning som undersøker hvordan avanserte språkmodeller kan bidra til læring i utdanningssammenheng. Særlig fremheves språkmodellenes evne til å kunne gi umiddelbar respons på elevenes/studentenes arbeider (Adiguzel, T. et al., 2023, Hartono, W. et al., 2023). Som nevnt over har mange norsklærere vegret seg for prosessorientert skriving, siden det er så arbeidskrevende. Kan smarte chatboter bidra til å lette lærerens arbeid med underveisvurderinger?

Kan KI gi elevene mer umiddelbar respons og dermed bidra til mer læringsfremmende timing av responsen? Håpet er at språkmodellene skal kunne øve elevene i god tekstorganisering, i å trene opp mottakerbevissthet, i kildeføring, språkvariasjon og bruk av kommunikasjonsfremmende tekstbindere, med mer. Men det går et viktig skille mellom å bruke teknologien til å trene elever i selvstendig skriving og revidering av tekst, og det å bruke teknologien til å fikse på tekstene uten at eleven er direkte involvert i revideringsarbeidet. Derfor trenger vi programmer som er mer pedagogisk innrettet enn ChatGPT, Bing, Bard osv. Det er ikke realistisk at alle elever bruker verdens kraftigste universalverktøy til bare å utføre isolerte oppgaver, når det samme verktøyet kan skrive hele teksten for dem.

Det finnes heldigvis flere tilløp til utvikling av verktøy som kan gi tilbakemeldinger og hjelp, men uten å gjøre jobben som eleven bør gjøre selv. På ai.randabergskolen.no finnes et verktøy der elever kan legge inn målene for en oppgave i tillegg til oppgaveformuleringen og sin egen besvarelse². Så får de en tilbakemelding på hva de har fått til og på hva de bør forbedre, med utgangspunkt i kriteriene/målene og oppgaveformuleringen.

Jeg testet tjenesten og syntes den fungerte sånn passe bra. Man får noen gode, litt generelle råd og en del unyttig «fyllstoff», men det er også mye chatboten ikke fanger opp. Til en tekst proppfull av nynorskfeil gav den for eksempel tilbakemelding om at nynorsken var svært god. Samtidig glimter den tidvis til og trekker frem relevante eksempler fra besvarelsen for å forklare konkret hva skribenten selv bør endre på.

Jeg tror elever kan ha nytte av slike verktøy ved å bruke dem i egen skriveprosess. Helst bør læreren selv kunne legge inn instrukser om hva chatboten skal gi tilbakemelding på ³ Uansett er min vurdering at lærerens tilbakemeldinger går chatbotene en høy gang. Feedback fra språkmodeller kan være et nyttig tillegg, men kan foreløpig ikke erstatte lærerens personlig tilpassede respons. Læreren kjenner elevens relevante kontekst, det gjør ikke chatboten. Ellers er det avgjørende viktig at lærere får teste ut og vurdere slike verktøy grundig, før de implementeres i skoler, kommuner og fylker.

Et hjertesukk rettet mot kommersielle aktører og tilbydere av digitale verktøy, er at de begynner å være mer rundhåndede med prøvelisenser til lærere. Slik det er en selvfølge at vi får vurdere forlagenes læreverk, bør det være selvsagt at vi får teste ut digitale læringsverktøy i ro og mak, uten å måtte delta på visninger og salgsmøter.

Rammefaktorer

MEN! Før vi kan komme skikkelig i gang med læringsfremmende bruk av generativ KI, er det noen rammefaktorer som må på plass. I dag er forskjeller mellom fylker og kommuner påtakelige når det gjelder muligheter lærere har for å «lykkes» med KI i klasserommet.

I noen fylker har lærerne gode, fleksible løsninger for tilgangsstyring (nettstyring) der de ikke bare kan skru nettet på og av, men i tillegg styre hvilke nettsider elever skal ha tilgang til. Andre steder har man dårlig fungerende-, eller ingen tilgangsstyring i det hele tatt. I noen fylker/kommuner er man i full gang med å utvikle egne KI-baserte chatboter elevene skal kunne bruke, uten bekymring for manglende personvern. I Vestfold og Telemark er en slik løsning allerede klar⁴. Andre steder er ikke jobben påbegynt. Noen skoler har tilgang på verktøy og hjelpemidler andre bare kan drømme om.

Dersom generativ kunstig intelligens faktisk vil transformere skolen, slik mange hevder, må vi i det minste få mulighet til å delta i forvandlingsprosessen på like vilkår. Vi trenger med andre ord politisk satsning på en likeverdig, digital infrastruktur, og fagdidaktisk tilpassede verktøy som virker læringsfremmende, heller enn læringshemmende, for alle. ChatGPT er uredigert et dårlige verktøy i klasserom som ikke har mulighet til å styre elevenes digitale tilganger.

Avslutningsvis. Det er vanskelig å beskrive pedagogisk bruk av KI isolert. For verktøyene hentes alltid inn som del av et faglig opplegg der målet ikke er bruk av generativ KI i seg selv. Kunstig intelligente verktøy bør brukes slik vi bruker alle typer pedagogiske ressurser, digitale som analoge: Vi trekker dem inn etter behov og når det tjener formålet. Jeg tror det er viktig å ikke tenke at KI skal ha som primærfunksjon å erstatte, eller å effektivisere. Derimot ligger potensialet til generativ KI i at teknologien utvider lærerens muligheter.

Fotnoter

ChatGPT kunne på dette tidspunktet ikke legge ved kilder, slik den kan i dag
På tidspunktet da artikkelen ble skrevet, var nettstedet åpent for utprøving for lærere, også utenfor Randaberg
Denne muligheten har man i dag i Osloskolen
Siden teksten ble publisert, har stadig flere kommuner og fylker utviklet egne chatboter som oppfyller krav til personvern.

Kilder

Adiguzel, T., Kaya, M. H., & Cansu, F. K. (2023). Revolutionizing education with AI: Exploring the transformative potential of ChatGPT. Contemporary Educational Technology, 15(3), ep429. https://doi.org/10.30935/cedtech/13152

Hartono, W., Nurfitri, N., Ridwan, R., Kase, E., Lake, F., & Y. Zebua, R. (2023). Artificial Intelligence (AI) solutions in English language teaching: Teachers-Students Perceptions And Experiences. Journal on Education, 6(1), 1452 -1461.

Av Siv Sørås Valand, doktorgradsstipendiat ved UiO, tilknyttet FIKS, mangeårig norsklærer

Publisert 6. mars 2024 10:54 - Sist endret 13. juni 2024 12:24