Du har koblet til datakilden, trykket «Last inn» og ser med ett at tabellen er full av tomme celler, duplikater og kolonner med navn som «Column1». Tallene stemmer ikke når du prøver å summere, og datoene oppfører seg merkelig i diagrammene. Problemet er sjelden selve dataene — det er at de ikke er klargjort for analyse.
Datarensing er steget de fleste hopper over fordi det føles kjedelig, men det er her du legger grunnlaget for alt som kommer etterpå. En rapport bygget på urensede data gir deg svar du ikke kan stole på. Og da er hele poenget med Power BI borte.
Filtrer så tidlig som mulig
Første regel er enkel: fjern data du ikke trenger, og gjør det så nær datakilden som mulig. Hvis du henter fra en SQL-database, filtrer i spørringen før dataene når Power BI. Hvis du jobber med en Excel-fil, bruk Power Query til å filtrere bort irrelevante rader med en gang.
Hvorfor er dette så viktig? Fordi hver rad du drar inn i modellen bruker minne og gjør oppdateringer tregere. Har du en salgstabell med ti års historikk, men bare trenger de siste tre årene, filtrer bort resten i Power Query. Du kan alltid justere filteret senere hvis behovet endrer seg.
I praksis høyreklikker du på kolonnen du vil filtrere, velger tallfilter eller tekstfilter, og setter betingelsen. Power Query registrerer dette som et steg i «Applied Steps»-panelet, slik at du alltid kan se hva du har gjort — og angre det.
Håndter nullverdier med kontekst
Nullverdier er ikke alltid feil. En null i kolonnen «Avsluttet dato» kan bety at prosjektet fortsatt pågår. En null i «Omsetning» betyr sannsynligvis at noe mangler. Du må forstå hva nullen betyr i akkurat din kontekst før du bestemmer deg for hva du gjør med den.
De vanligste strategiene er å erstatte null med en standardverdi, fjerne raden helt, eller la nullen stå. For numeriske kolonner der null betyr «ingen verdi registrert», er det ofte riktig å erstatte med 0. For tekstkolonner kan du erstatte med «Ukjent» slik at verdien dukker opp i filtre og diagrammer i stedet for å forsvinne.
I Power Query markerer du kolonnen, går til «Transform»-fanen og velger «Replace Values». Skriv inn «null» i feltet for gammel verdi, og din erstatning i feltet for ny verdi. Gjør du dette konsekvent, slipper du overraskelser når DAX-formlene dine plutselig returnerer blanke resultater.
Fjern duplikater riktig
Duplikater i datakildene er overraskende vanlig. Kanskje en kunde er registrert to ganger med litt forskjellig stavemåte, eller en transaksjon har blitt lagt inn dobbelt. Power Query har en innebygd funksjon for å fjerne duplikater — du markerer kolonnen og velger «Remove Duplicates» fra høyreklikkmenyen.
Men vær forsiktig. Å fjerne duplikater basert på bare én kolonne kan slette rader du faktisk trenger. Hvis to forskjellige kunder heter «Erik Hansen», mister du én av dem ved å fjerne duplikater kun på navnekolonnen. Vurder i stedet å bruke en kombinasjon av kolonner — for eksempel navn og e-postadresse sammen — for å identifisere ekte duplikater.
En god praksis er å alltid sjekke antall rader før og etter du fjerner duplikater. Hvis tallet endrer seg mer enn du forventet, bør du undersøke nærmere før du går videre.
Gi kolonnene fornuftige navn
Kolonnenavn som «Cust_ID_ext_v2» eller «Column7» gjør rapporten vanskelig å jobbe med, både for deg selv og andre. Bruk Power Query til å gi kolonnene beskrivende, norske navn der det gir mening. «Kunde-ID», «Produktnavn», «Salgsdato» — navnene skal fortelle deg hva kolonnen inneholder uten at du trenger å sjekke dataene.
Dobbeltklikk på kolonneoverskriften i Power Query for å endre navnet. Steget dukker opp i «Applied Steps» som «Renamed Columns», og du kan alltid gå tilbake og justere. Gode kolonnenavn sparer deg for mye tid når du senere skal lage DAX-formler og bygge visualiseringer.
Velg riktig datatype
Datatyper er det steget som har størst konsekvens for resten av arbeidet ditt. En datokolonne som Power BI tolker som tekst, vil ikke fungere med tidsintelligens-funksjoner. En tallkolonne som er lagret som tekst, kan ikke summeres. Og en desimalkolonne satt til heltall vil avrunde verdiene dine uten forvarsel.
Sjekk datatypene for hver kolonne med en gang du åpner Power Query. Du ser ikonet til venstre for kolonnenavnet — et kalenderikon betyr dato, «123» betyr heltall, «1.2» betyr desimaltall, og «ABC» betyr tekst. Klikk på ikonet for å endre typen.
De viktigste datatypene å få riktig er:
- Dato — alle kolonner som inneholder datoer må settes til datatypen «Date» eller «Date/Time». Uten dette fungerer ikke tidsintelligens i DAX.
- Desimaltall — bruk dette for beløp, priser og andre verdier som kan ha desimaler. Unngå «Fixed Decimal» med mindre du jobber med valuta og trenger nøyaktig to desimaler.
- Heltall — for ID-kolonner, antall og andre verdier som aldri har desimaler.
- Tekst — for kategoriske verdier som navn, produktkategorier og koder. Selv om en kode ser ut som et tall (for eksempel postnummer), bør den lagres som tekst hvis du aldri skal regne på den.
Power Query prøver å gjette datatypen automatisk når du kobler til en kilde. Disse gjetningene er ofte feil, spesielt for datoer i norsk format og for kolonner som inneholder en blanding av tall og tekst. Gå gjennom hver kolonne manuelt for å være sikker.
Bygg en renserutine
Erfarne Power BI-brukere følger gjerne en fast rekkefølge når de renser data. En typisk rutine ser slik ut:
- Fjern kolonner du ikke trenger
- Filtrer bort irrelevante rader
- Håndter nullverdier
- Fjern duplikater
- Gi kolonner beskrivende navn
- Sett riktige datatyper
Rekkefølgen har noe å si. Ved å fjerne unødvendige kolonner og rader først, går de påfølgende stegene raskere fordi Power Query jobber med mindre data. Og ved å sette datatyper til slutt unngår du at Power Query automatisk endrer typen tilbake når du gjør andre transformasjoner.
Vanlige feil og hvordan du unngår dem
Den vanligste feilen er å hoppe over rensing helt og gå rett til å bygge visualiseringer. Resultatet er diagrammer som viser feil tall og filtre som ikke oppfører seg som forventet. Den nest vanligste feilen er å rense data manuelt i kildefilen i stedet for i Power Query — da må du gjøre jobben på nytt hver gang dataene oppdateres.
En annen klassiker er å sette feil datatype på beløpskolonner. Hvis en kolonne med salgstall er satt til tekst, vil SUM-funksjonen i DAX returnere en feil. Og hvis datokolonnen er tekst, vil tidsrelaterte filtre og sammenligninger slutte å virke. Microsofts dokumentasjon om datatyper gir en god oversikt over når du bruker hvilken type.
Datarensing er ikke glamorøst, men det er det viktigste steget mellom rådata og pålitelige beslutninger. Vil du se hele prosessen i praksis med ekte datasett, tar Power BI-kurset for nybegynnere deg gjennom rensing steg for steg i Power Query.




