Tomas Klingström
Presentation
Digitaliseringen av samhället innebär att vi kan samla in allt större datamängder från olika källor. Det här innebär att "Big data” (stora datamängder) och olika metoder kopplade till AI (Artificiell Intelligens) blir en allt viktigare del av vårt arbete inom både forskning och jordbruk. För att data ska vara meningsfulla är det viktigt att de ger en rättvisande bild av verkligheten och även att våra analysmodeller uppfyller krav på transparens och reproducerbarhet. Min forskning är därför i stor utsträckning fokuserad på att skapa effektiva system för datainsamling och att säkerställa att data hanteras på ett sätt som är validerat och spårbart. På så sätt ökar vi möjligheten att omsätta avancerade teoretiska modeller till användbara applikationer som kan bidra till bättre kunskap inom genetik och bättre djuravel anpassad för moderna produktionsmodeller. Just nu bedrivs min forskning inom ramen för två projekt, Gigacow och Defend2020.
Undervisning
Jag håller vissa föresläsningar på kursen Bioinformatik 15 HP på men arbetar just nu främst med att bidra till the Galaxy Training Network som är en öppen resurs för att lära sig bioinformatik med hjälp av Galaxy.
Forskning
Gigacow
Gigacow är SLUs satsning på storskalig datainsamling från mjölkgårdar. Det är en universitetsgemensam resurs som även kan nyttjas av utomstående forskare. Som koordinator är min uppgift att fånga upp så många mätbara egenskaper (fenotyper) som möjligt från korna på de gårdar som deltar i nätverket. Vi kompletterar sedan dessa mätningar med genetisk information från varje djur samt annan information om gårdarna i syfte att bättre förstå samspelet mellan djur, människor och produktionsmetoder. Mitt eget forskningsfokus ligger på att utforska kors genetiska egenskaper och potentialen för att öka djurhälsa, produktivitet samt resurseffektiviteten på våra kor. En viktig del av arbetet i Gigacow är även att samarbeta med andra parter i syfte att stödja arbete med teknik- och metodutveckling där vår plattform gör Gigacow till en naturlig testbädd för nya sensorer och maskiner. Metodutveckling är även en viktig del av genetiken där både maskiner som analyserar arvsmassa och mjukvaran som analyserar data hela tiden utvecklas.
Defend2020
Defend2020 är ett EU-projekt där vi samarbetar med forskare i Europa och Afrika i syfte att stoppa spridningen av Lumpy Skin Disease och Afrikansk svinpest. SLU är i projektet ansvarigt för arbetet med att studera interaktionen mellan virus och värddjur i syfte att bättre hantera och bekämpa de två virusen. En viktig del i arbetet är även att säkerställa att de verktyg som projektet tar fram kan användas av många forskare och veterinärer över hela världen. I Defend2020 använder vi därför en plattform som heter Galaxy i syfte att skapa reproducerbara analysflöden och kunna träna veterinärer och biologer som arbetar med Lumpy Skin Disease och Afrikansk svinpest. Under utbrottet av Covid-19 har andra medlemmar av Galaxy-teamet byggt upp en plattform för dataanalys av Covid-19 över hela världen och målet är att vi ska kunna använda samma tekniska plattform även för andra sjukdomar.
Forskningsagenda
För att utveckla arbetet med storskalig genotypering och fenotypering arbetar jag med utveckling på tre fronter.
1. Bättre verktyg för storskalig mätning av djurs egenskaper.
2. Mer detaljerade kartor över genetisk mångfald hos olika (ko)raser.
3. Bättre verktyg för att återanvända och dela analysflöden som används för att analysera data.
Genom att integrera nya mätmetoder med effektivt stöd för dataanalys kan vi öka kunskapen inom både genetik och hur vi bäst kan utnyttja ny teknik. Det här kräver nära samarbete mellan jordbrukare, genetiker och specialister inom datavetenskap, bioteknik och bioinformatik. För att uppnå detta använder jag Galaxy som en plattform för datahantering och analys för att dela och utveckla det arbete som vi genomför kopplat till genetik, Gigacow och Defend2020.
Samverkan
Som koordinator för Gigacow är jag beroende av ett nära samarbete med både de mjölkbönder som ingår i nätverket och de organisationer som de arbetar med. Förutom SLUs egna nätverk har kontakter via Växa Sverige, AgroÖst och Vreta Kluster varit en viktig del av infrastrukturens uppbyggnad. Just nu är mitt mål att så ofta vi kan åka ut för att träffa våra bönder antingen på gårdarna eller i samband med lantbruksdagar och andra möten.
Gigacow är även aktivt i arbetet med att både utveckla ny teknik och tillämpa den. Vi är medlemmar i the Nordic Testbed Network som arbetar för att stödja digital utveckling och följer teknikutvecklingen för att kunna delta i nya projekt som ökar vår förmåga att samla in och tillhandahålla data. Utveckling av nya metoder inom genetik har även det en viktig roll och vi samarbetar därför bland annat med National Genomics Infrastructure of Sweden på SciLife lab som är en av världens ledande infrastrukturer för DNA sekvensering med ny teknik såsom Oxford Nanopore Technology och Single Molecule, Real Time sequencing vilket skapar nya möjligheter att bättre kartlägga genomet både hos våra kor och de mikroorganismer som lever i eller omkring dem.
Internationell samverkan
Med globalisering och klimatförändringar har internationellt kunskapsutbyte en viktig roll för att klara ökande utmaningar såsom torka, översvämningar och djursjukdomar. Via SLU Global och olika gemensamma projekt har vi ett nära samarbete med många andra länder och sedan jag började arbeta på SLU har jag besökt cirka 30 olika länder på tre olika kontinenter. Förutom Defend2020 och Galaxy projektet arbetar jag just nu främst i nordiska samarbeten finansierade av Nordic Joint Committee for Agricultural and Food Research samt i samarbeten med afrikanska kollegor vid the International Livestock Research Institute i Kenya & Etiopien och Agricultural Research Council i Sydafrika. Målet är att vi med hjälp av nya referensgenom och förbättrad datainsamling ska kunna överföra både kunskap och metoder mellan de olika länderna. En liten reserapport med fokus på hur Galaxy och bioinformatik kan bidra till jordbruksforskningen i globala samarbeten finns här.
Är man intresserad av något av mina projekt eller något annat i gränslandet mellan genetik, bioinformatik och teknikutveckling är det bara höra av sig på mejl (tomas.klingstrom@slu.se) oavsett om man är bonde, forskare, student eller har en annan bakgrund.
Bakgrund
Grundutbildning
Jag är civilingenjör i molekylär bioteknik och från början var mitt mål att fokusera på bioteknik men komplettera med kunskaper i bioinformatik för att kunna ha en helhetsbild av forskningskedjan från provtagning till resultat. Tack vare professor Jan Komorowski på Linnécentrum för bioinformatik fick jag chansen att göra forskningspraktik hos Dariusz Plewczynski på Warsawas universitet med fokus på proteininteraktioner och strukturbiologi. Arbetet där blev starten på mitt intresse för data kvalitet och storskalig datainsamling då jag insåg att nya mer effektiva algoritmer inom maskininlärning var sekundärt i förhållande till behovet av tillgång till kvalitetssäkrade data som kunde utgöra ett pålitligt dataunderlag för maskininlärning. Mitt arbete i Polen bidrog även till att jag erhöll Anders Walls stipendium inom Unga Forskare och skiftade mitt forskningsfokus från bioteknik med bioinformatik som komplement till att arbeta mer med applicerad bioinformaik.
Doktorandutbildning
Jag doktorerade på vad som idag kallas SLU Global Bioinformatics Centre med professor Erik Bongcam-Rudloff som huvudhandledare. Det som från början intresserade mig var hans arbete med eBiokit som är en bärbar plattform för utbildning och grundläggande dataanalys som sköts med bärbara servrar och är väl lämpade för arbete i utvecklingsländer. Som doktorand arbetade jag inledningsvis med the Molecular Methods database som var ett projekt inom the Biobank and Biomolecular Research Infrastructure of Sweden (BBMRI.se) för att minimera påverkan av pre-analytiska variabler orsakade av bristfällig dokumentation och skillnader i metodval vid provinsamling och provanalyser. Under doktorandperioden stoppades finansieringen av BBMRI.se av Vetenskapsrådet (länk) samtidigt som jag tillhörde teamet som skrev ansökan för B3Africa som var ett projekt där vi kombinerade eBiokit med andra IT-lösningar för att skapa en plattform för dataintegrerade biobanker i låg och medelinkomstländer. Resultatet blev att min doktorsavhandling fick ett fokus på hela kedjan från provinsamling till dataanalys och även de juridiska hinder som ofta begränsar datainsamling och datadelning. Det här blev även starten för mitt engagemang inom Galaxyprojektet då Galaxy en plattform som gör det lättare för forskare inom medicin och biolog att snabbt kunna genomföra reproducerbara analyser med hjälp av plattformen där olika bioinformatiska verktyg integreras.
Postdokperiod
Jag är anställd som koordinator för Gigacow och forskare i Defend2020 med professor Dirk-Jan de Koning som vetenskapligt ansvarig i båda projekten. I arbetet med storskalig fenotypering och utforskandet av genetiska egenskaper hos värddjur som infekteras med lumpy skin disease återanvänder vi många av de slutsatser som vi dragit i B3Africa. Det långsiktiga målet är att inom projekten och de samarbeten vi arbetar med kunna bidra till en harmoniseringe av hur vi arbetar med bioinformatik inom husdjursgenetik i syfte att maximera utbytet av metoder och resultat mellan olika länder.
Handledning
Jag är just nu bihandledare för en doktorand, Renaud van Damme på SLU Global Bioinformatics Centre och löpande olika examensprojekt på kandidat- och mastersnivå.
Publikationer i urval
I syfte att skapa uppmärksamhet för the Molecular Methods database startade vi ett samarbete med tidskriften Biorpreservation & Biobanking där jag tjänstgjorde som gästredaktör för ett specialavsnitt om biobanksarbete för utvecklingsländer där metoder delades via the Molecular Methods database[1]. Kontakterna och erfarenheterna från det arbetet tillsammans med Erik Bongcam-Rudloffs tidigare arbete med the eBiokit[2] gav det oss möjligheten att sätta samman B3Africa projektet[3] där jag designade och ansvarade för arbetet att skapa en användarvänlig plattform för bioinformatik som skulle integreras med andra moduler för provinsamling och datainsamling.
Det arbetet och lärdomarna jag drog utifrån de två projekten finns beskrivna i min doktorsavhandling[4] som ligger till grunden för hur vi nu valt att utveckla Gigacow och min nuvarande forskningsagenda med fokus på metodutveckling för genetik[5], datainsamling och mer effektiv dataanalys med hjälp av Galaxy[6]
[1]Klingström, T. (2013) ‘Biobanking in Emerging Countries’, Biopreservation and Biobanking, vol. 11, no. 6, pp. 329–330. DOI: 10.1089/bio.2013.1161.
[2]Hernández-de-Diego, R., de Villiers, E. P., Klingström, T., Gourlé, H., Conesa, A. and Bongcam-Rudloff, E. (2017) ‘The eBioKit, a stand-alone educational platform for bioinformatics’, Ouellette, F. (ed), PLOS Computational Biology, vol. 13, no. 9, p. e1005616. DOI: 10.1371/journal.pcbi.1005616.
[3]Klingstrom, T., Mendy, M., Meunier, D., Berger, A., Reichel, J., Christoffels, A., Bendou, H., Swanepoel, C., Smit, L., Mckellar-Basset, C., Bongcam-Rudloff, E., Soderberg, J., Merino-Martinez, R., Amatya, S., Kihara, A., Kemp, S., Reihs, R. and Muller, H. (2016) ‘Supporting the development of biobanks in low and medium income countries’, IEEE, pp. 1–10. DOI: 10.1109/ISTAFRICA.2016.7530672. (Open access version of paper in PhD thesis)
[4]Klingström, T. (2017) ‘Data integration and handling’, Uppsala, Swedish University of Agricultural Sciences. Acta Universitatis agriculturae Sueciae, 1652-6880 ; 2017:99. Available at https://pub.epsilon.slu.se/14669/.
[5]Klingstrom, T., Bongcam-Rudloff, E. and Vinnere Pettersson, O. (2018) ‘A comprehensive model of DNA fragmentation for the preservation of High Molecular Weight DNA’, bioRxiv 254276; DOI: 10.1101/254276.
[6]Fallmann, J., Videm, P., Bagnacani, A., Batut, B., Doyle, M. A., Klingstrom, T., Eggenhofer, F., Stadler, P. F., Backofen, R. and Grüning, B. (2019) ‘The RNA workbench 2.0: next generation RNA data analysis’, Nucleic Acids Research, vol. 47, no. W1, pp. W511–W515 [Online]. DOI: 10.1093/nar/gkz353.
Publikationslista: