AI och stora datamängder – så kartlägger William Lidberg skogen

Senast ändrad: 07 mars 2025
Ung man med i keps och blå stickad tröja. Foto.

William Lidberg använder AI-modeller i sin forskning om skogen, vilket kräver stora datamängder för att träna modellerna och gott om lagringsutrymme. Öppna data från NASA och en hemsnickrad serverhall är lösningen.

William Lidberg använde AI-modeller redan i arbetet med sin doktorsavhandling som publicerades 2019. Avhandlingen handlar om metoder för att göra kartor över små vattendrag och fuktiga marker i skogen, för att kunna skydda dessa vid avverkningar. Att kunna använda öppna data var en förutsättning för kartorna som William tog fram som doktorand.

Du använder mycket öppna data. Betyder det att du också delar data du tagit fram öppet?

– Jag tycker om att dela data. Kan man inte återskapa resultaten, då är det inte forskning man gör. Så jag är mycket för öppna data, öppna programvaror, öppen kod och sådant.

Data kan tillgängliggöras på många olika sätt. Svensk nationell datatjänst (SND) erbjuder en forskningsdatakatalog som de senaste åren används allt oftare på SLU. William Lidberg har publicerat flera dataset i SND:s forskningsdatakatalog. Publikationen från 2023 är speciell, inte minst för datavolymen.

- Jag jobbar med väldigt stora datamängder. Jag jobbar med den nationella laserskanningen och i ett projekt där jag hade samlat in allt geografiskt data i Sverige – i princip. Det blir hundratals terabyte och att dela det är lite av en utmaning.

Vad är det för ett projekt som du publicerade data ifrån 2023?

– Det var ett lite kul projekt som gick ut på att hitta fångstgropar. Fångstgropar förstörs i ganska rask takt av skogsbruket. Så det är lite bråttom att hitta dem innan alla är borta – och de syns ju faktiskt inte, säger William.

Vad är en fångstgrop?

– En fångstgrop är egentligen ett hål i marken. Oftast ligger de inte ensamma, det är ett system av hål i marken som ligger på en lång rad och de kan vara miltals långa. Man har försökt valla älgarna mot systemet för att fånga dem i groparna, som ett sätt att jaga älg. Det är kulturlämningar som ligger kvar ute i skogen.

För att hitta fångstgroparna har William tränat en AI-modell.

Hur utvecklade du AI-modellen?

– Första försöket gick sådär, för AI kräver mycket data, alltså i form av träningsdata. Vi hade kanske 2 000 fångstgropar som någon människa har suttit och ritat ut. Men det räckte inte så jag fick plocka data från NASA i stället på månkratrar och träna modellen. Sedan flyttade jag modellen till Sverige och tränade den, liksom finjusterade på de data vi hade på fångstgropar.

Kan AI-modellen hitta alla fångstgropar?

– Kanske inte alla, men många fångstgropar.

Har NASA skannat månen på samma sätt som Skogsstyrelsen skannar den svenska skogen?

– Skogsstyrelsen flyger med flygplan ungefär 3 km över marken, skjuter laserpulser mot marken och räknar hur lång tid det tar tillbaka till planet. NASA har flugit med en rymdfarkost med radar som skannat månen. Det är inte alls samma upplösning, men eftersom en månkrater kan vara flera kilometer stor så blir det ungefär samma skala. Så jag tog ungefär en miljon av de här kratrarna och tränade min modell på.

Hur tränar man en AI-modell och hur lång tid tar det?

– Det är ett tvådelat arbete, dels beräkningstiden som det tar att träna modellen, dels datahantering och förberedelser, som är den stora biten. Att träna modellen tog kanske en dag eller någonting. Det är inte alls farligt. Alla misstag och felsökande som måste göras tar typ 99 procent av tiden. Man kan rita på någon parameter som inte funkar alls och så försöker man i flera dagar att få det att funka.  Så det är lite som alkemi, man får testa och försöka sig fram tills det funkar och den biten tycker jag inte riktigt om. Alltså, det är roligt att bygga och experimentera, men det är frustrerande.

Du har också ett projekt där du använder AI för att hitta vägtrummor. Berätta mer.

– Ibland så lyckas saker som är riktigt häftiga! Jag har en modell som lyckas ganska bra faktiskt. Jag begriper inte riktigt hur den gör det. Fångstgropar och diken syns ju tydligt i höjdmodellen. Men vägtrumman syns inte. Man får bara vägbanan när man flyger, men sedan kombinerar jag flygbilder, IR bilder och laser. Jag har tränat en modell som hittar kanske 85 procent av vägtrummorna i Sverige, men jag vet inte exakt vad i terrängen modellen går på. Det finns någon systematik som den har lärt sig.

Vad krävs det för datorutrustning för att bygga AI-modeller?

– Man behöver hundratals terabyte i lagring. Jag har byggt på sidan om IT:s lösningar. Jag har nog mer lagring än resten av universitetet tillsammans, en petabyte nu. Jag får agera IT-tekniker på halvtid nu för tiden, för vi har fem–sex doktorander och postdoktorer som också jobbar mot mina lösningar och då ska ju allting snurra där och funka, så jag har tagit den rollen i vår forskargrupp.

Realiserade resultat

Under sin forskarkarriär har William sökt sig till undersökningsområden där resultaten kan omsättas till praktik. Han samarbetar med Skogsstyrelsen för att hans forskning ska kunna användas så snabbt som möjligt, och inte bara redovisas i en vetenskaplig artikel:

– Fångstgroparna håller vi på att implementera tillsammans med Skogsstyrelsen just nu. Mina gamla dikeskartor och markskador kunde vi också direkt få in till verkligheten på samma sätt. Det är en viktig aspekt av arbetet, annars skulle jag inte orka hålla på.

Undervisningsmaterial från verkligheten

William håller en masterskurs som handlar om geografiska data och maskininlärning, där studenterna får arbeta med kod (i programspråket Python). Då använder han SND i undervisningen:

– Jag behöver aldrig förse studenterna med data själv, för där finns massor av förberedda data som man kan hämta ner. Det är ganska smidigt faktiskt.

Ofta är det nödvändigt att bearbeta de data man laddar ned, men det blir samtidigt någonting studenterna får lära sig:

– Allt ska vara på riktigt, data från verkligheten, så att säga.

Fakta:

Svensk nationell datatjänst (SND)

SND har som huvuduppgift att stödja tillgänglighet, bevarande och återanvändning av forskningsdata och relaterat material. Närmare 40 lärosäten och andra forskande organisationer bildar tillsammans med SND en nationell infrastruktur för forskningsdata. SND drivs av ett konsortium av nio lärosäten, där SLU ingår.

Den nationella laserskanningen

Skogsstyrelsen och SLU ska på regeringens uppdrag uppdatera, utveckla och tillgängliggöra skogliga grunddata. Uppdraget utförs via Lantmäteriets laserskanning av Sveriges skogsmark, som innebär att skogsmarken kartläggs med hjälp av flygplan och att olika slags data samlas in.