Dataanalys och statistik

IVL har lång erfarenhet av att analysera olika typer av data och kan fungera som analyscoach eller statistikkonsult. Vi erbjuder stöd i hela processen, från att planera försök och att samla in och analysera data, till att visualisera och presentera resultatet på ett lättillgängligt sätt.

Våra specialister har goda kunskaper i att hantera och analysera miljörelaterad data och processindustriell data. Data kan bestå av allt från små till mycket stora datatabeller (Big data) och kan komma från exempelvis enkäter, experiment, mätningar eller databaser.

Exempel på områden där IVL har utfört dataanalys:

  • Miljöövervakning. Miljöövervakningsprogram genererar ofta mycket omfattande och komplex data. På IVL kan vi analysera trender och göra receptormodelleringar. Vi använder till exempel multivariat receptormodellering för att identifiera vilken andel av partiklar och metaller i luftprover som kommer från vägtrafik.
  • Mark. Vi modellerar totalhalter av olika ämnen i jordprover för att undersöka samband mellan olika parametrar som geokemi eller föroreningssituation och till exempel provtagningsområde, provtagare eller laboratorieanalys.
  • Information och instruktioner kring användande av statistik. IVL har bland annat bidragit med samtliga delar kopplade till multivariat dataanalys på Miljostatistik.se.

Olika problem kräver olika ansatser och verktyg

Försök kan göras med en eller flera variabler och med allt från små till mycket stora datamängder (så kallad Big data).

Exempel på klassisk statistik som vi använder för en eller få variabler:

  • centralmått (typvärde, medelvärde, median)
  • spridningsmått (varians, standardavvikelse)
  • osäkerhet i data (standardfel, konfidensintervall)
  • hypotesprövningar (t-test, ANOVA)
  • korrelationsanalyser
  • regressionsanalys


Exempel på multivariat statistik som vi använder för många variabler samtidigt:

  • PCA, (principalkomponentanalys) för att sammafatta och utvärdera data
  • PLS, (Partial Least Squares regression to Latent Structures) för regression
  • PMF (Positive Matrix Factorization) eller COPREM (Constrained Physical Receptor Model) för faktoranalys och receptormodellering, det vill säga att identifiera och kvantifiera källorna till exempelvis luftföroreningar

Om du är intresserad av att få hjälp med att analysera och extrahera information från dina data från processindustri eller från vatten- och avloppsverk, läs mer på sidan Industriell modellering.

Kontaktperson
Anders Björk Tel. 010-788 65 72 E-post: anders.bjork@ivl.se
Magnus Rahmberg Tel. 010-788 65 63 E-post: magnus.rahmberg@ivl.se
Linus Bergfors Tel. 010-788 65 67 E-post: linus.bergfors@ivl.se