Forside / Blogg / Hvorfor er direktetrafikken så mye høyere i nytt analyseverktøy?

Hvorfor er direktetrafikken så mye høyere i nytt analyseverktøy?

Dato publisert:

21.03.24
Jørgen Brunborg Næss med sitatet "Data quality sucks - Get over it" fra Avinash Kaushik

Sitter du i nytt analyseverktøy og lurer på hvorfor det er så stor forskjell mellom direkte trafikk i gammelt og nytt system? Svaret er kanskje noe annet enn det du tror.

Alle har de siste årene skiftet analyseverktøy vekk fra Google Universal Analytics (GA3), og da har du kanskje lekt litt med å sammenligne gammel data med nytt system. Kanskje du klør deg i hodet og forsøker å finne svar på forskjellene du kan se i datamaterialet. Forskjeller finner du gjerne uansett om du har skiftet til Google Analytics 4, Piwik Pro, Matomo, Fathom eller Plausible, eller noe annet.

En av forskjellene du mest sannsynlig har hengt deg opp i er en signifikant endring i direkte trafikk. Mange følger med på direktetrafikken som en indikasjon på merkevarestyrke, posisjon og lojalitet. Tanken er at hvis flere besøkende over tid kommer direkte til nettstedet ditt uten å gå via andre kilder, så gjør du sannsynligvis noe riktig. Da er det irriterende når du oppdager en stor forskjell mellom verktøyene.

Men akkurat forskjellen i direkte trafikk har en veldig logisk forklaring.

Direktetrafikk i Google Analytics er basert på en løgn

De fleste vil oppdage at direktetrafikken til nettstedet ser ut til å være mye høyere i nytt verktøy enn i GA3. Samtidig ser du gjerne at det er en del andre kilder som har mye lavere trafikk. Ofte er det trafikk fra organisk søk og nyhetsbrev som har den største nedgangen.

Årsaken til dette er en ubehagelig sannhet som du må forsone deg med: GA3 har løyet til deg i alle år, men det har vært godt ment!

GA3 har underrapportert direktetrafikk ved å tilordne besøk til tidligere trafikkilder der det var mulig.

MEN: It’s not a bug, it’s a feature!

Direktetrafikk er ikke en trafikkilde

Først må du være klar over at “direkte” ikke er en trafikkilde, det er snarere fravær av trafikkilde.

All sporing av trafikkilder baserer seg på at brukerens nettleser rapporterer inn en referent, altså f.eks. et nettsted som brukeren har klikket fra for å komme til deg. Det kan også være kampanjekoder eller andre UTM-haler som du har laget selv.

Ved fravær av denne informasjonen så blir besøket regnet som “direkte”.

Hvorfor er det ofte mer interessant å se forrige trafikkilde?

I mange tilfeller vil det være uinteressant eller direkte misvisende å kategorisere et besøk som direktetrafikk.

For eksempel: Se for deg at du klikker på en annonse og kommer deg inn i en nettbutikk på formiddagen. På kvelden henter du opp den fanen igjen, og klikker deg mer rundt i nettbutikken. Kveldsøkten vil da bli regnet som et nytt besøk, uten å ta høyde for annonsen du først trykket på.

Altså direktetrafikk.

Eller hvis du gjør et søk i Google og lander i nettbutikken. Du gjør litt research av ulike produkter, og til slutt bokmerker du det produktet du var mest interessert i. Uka etter, når du går inn på det samme bokmerket og kjøper produktet, vil kjøpet registreres som et besøk uten trafikkilde.

I begge disse tilfellene er det mer interessant om besøkene blir tilordnet den opprinnelige trafikkilden, henholdsvis annonseringskanalen og Google organisk søk. Og det er akkurat dette Google Analytics gjør, både i GA3 og i GA4.

I noen tilfeller kan dette være misvisende

I en del andre tilfeller er ikke det å tilordne besøk til tidligere trafikkilde like logisk. Det slår ulikt ut for ulike typer nettsteder, særlig hvis nettstedet ditt har høy lojalitet og jevnlige besøk fra de samme brukerne.

For eksempel: Tenk deg at du leverer et økonomisystem. Kundene dine kommer ofte direkte til forsiden for å logge seg inn.

Du sender selvsagt jevnlig ut nyhetsbrev, og en gang i blant klikker kundene på noe interessant der. Etter et slikt besøk fra en “ekstern” kilde vil alle nye besøk direkte til nettsiden din bli tilskrevet den eksterne kilden – altså i dette tilfellet “nyhetsbrev”. Det vil si at hvis en kunde klikker én gang på et nyhetsbrev, og deretter kommer hundre ganger inn direkte, så blir det totalt registrert som hundre-og-ett besøk fra nyhetsbrevet.

Det kan fort bli et misvisende bilde av hvor betydningsfulle nyhetsbrevene dine er.

Hvor lenge “husker” Google Analytics forrige trafikkilde?

I praksis vil Google Analytics huske den forrige trafikkilden til brukernes cookies utløper eller forsvinner.

I GA3 fantes det en innstilling som het “Campaign Timeout”. Som standard var den satt til 6 måneder. Det vil si at nye besøk direkte til nettsiden ble satt til forrige trafikkilde, dersom det var mindre enn 6 måneder siden forrige besøk. Men, forrige besøk kunne også ha “arvet” sin kilde fra den før der igjen. Dermed var varigheten i praksis ubegrenset, så lenge cookien som identifiserte brukeren fortsatt eksisterte.

GA4 har ingen slik innstilling som kan justeres på. I hvert fall ikke en vi har funnet til nå. Derfor går vi ut fra at tilordningen skjer i ubegrenset tidsrom så lenge cookien eksisterer.

Hvorfor blir det avvik når begge verktøyene gjør det?

Hvis både GA3 og GA4 gjør denne tilordningen på samme måte, hvorfor blir det da fremdeles avvik mellom verktøyene?

Avviket vil først og fremst skyldes at GA4 ikke har bygget opp den samme historikken som du hadde i GA3 enda. Når du starter et nytt analyseverktøy vil alle brukerne dine være nye, fordi ingen har cookies liggende fra før. Da vil heller ingen ha noe historikk på trafikkilder fra tidligere besøk.

Etter hvert som månedene går, vil flere og flere brukere få slik historikk, og andelen direktetrafikk vil bli lavere. Da GA4 først ble lansert, var trafikkildene “Direct” og “Organic” nesten like store. Over tid har de skilt lag og stabilisert seg på ulike nivåer.

Her ser du et eksempel fra GA4-kontoen til en stor handelsaktør. Direktetrafikken går ned og organisk trafikk opp etter hvert som GA4 får mer historikk:

Graf som viser fordeling mellom organisk og direkte trafikk i GA4 og hvordan den endrer seg over tid for en stor handelsaktør

Hvis vi ser på samme tidsperiode fra GA3 ser vi at avstanden mellom de to kildene har vært stabil hele veien:

Graf som viser stabil fordeling mellom organisk og direkte trafikk i GA3 for en stor handelsaktør

Den samme tendensen kan du tydelig se på email-trafikken.

I grafen under kan du se at GA4 startet å rapportere trafikk i slutten av januar. På det tidspunktet er det ingen trafikk fra kilden “Email”. Etter det første nyhetsbrevet blir sendt ut i mars – som er den første høye toppen i grafen – kan vi se at det kommer inn en jevn strøm av trafikk fra “Email” mellom utsendelsene (de tre høye toppene):

Graf som viser utviklingen i trafikk fra Email i GA4 for stor handelsaktør

I GA3 kan du se at det finnes lav og stabil trafikk fra nyhetsbrev også før den høye toppen som kom i mars:

Graf som viser utviklingen i trafikk fra Email i GA3 for stor handelsaktør

De første dagene med helt ny GA4 vil du altså se den “ekte” fordelingen av trafikkilder. Du må la det gå noen måneder før du kan sammenligne data med GA3.

Hva med andre systemer som Piwik Pro og Matomo?

De fleste andre analyseverktøy vil rapportere den “ekte” trafikkilden til hvert enkelt besøk. Det vil si at hvis et besøk starter uten ekstern kilde så blir det kategorisert som direkte, uavhengig av hva som tidligere er registrert for samme bruker.

Sammenlignet med Google Analytics betyr dette at direktetrafikken som hovedregel vil være betydelig høyere, mens stort sett alle andre trafikkilder vil være lavere enn det du er vant til.

Her er et eksempel fra en veldedig organisasjon som har mange faste støttespillere. Data viser samme periode fra både GA3 og Piwik Pro:

Fordeling på 5 viktigste trafikkilder for en veldedighetsorganisasjon både fra GA3 og Piwik Pro

Her kan du se at det er betydelig høyere direktetrafikk rapportert i Piwik Pro enn det er i GA3.

Et annet eksempel, med ikke fullt så drastiske forskjeller, er våre egne data fra synlighet.no:

Fordeling på 5 viktigste trafikkilder for synlighet.no fra GA3, GA4 og Piwik Pro

Synlighet.no har ikke like mange besøkende som returnerer ofte, og dermed blir også avstanden i direkte trafikk mindre. I denne tidsperioden har Synlighet sin GA4-konto vært aktiv lenge, og da kan du se at den i store trekk er enig med GA3.

Finnes det andre feilkilder?

Så absolutt!

Dette avviket på trafikkilder skyldes ulike målemetoder i ulike systemer. Dette er jo ikke en “feil” som sådan, det er bare ulikt utslag som følge av hvordan systemene er bygget.

Men det er en rekke ting som kan forårsake avvik og feil i hvordan trafikkilder rapporteres, og så lenge direktetrafikk er “fravær av trafikkilde”, vil denne kunne være kraftig påvirket av mange ulike ting.

Eksempler på avvik i trafikkilder:

  • Referenten har forsvunnet: Som følge av bare teknisk feil i nettleseren, eller redirects i mange steg, eller strenge sikkerhetsinnstillinger, så kan det være at nettleseren ikke klarer å sende inn informasjon om referent. Hvis trafikken da heller ikke har kampanjekoder, så vil den bli stående som direkte.
  • Det var aldri noen referent: Enkelte applikasjoner med innebygde nettlesere vil kanskje ikke operere med konseptet “referent” når de skal vise en nettside. Dette gjelder for eksempel de fleste e-postlesere, men også enkelte sosiale medier og andre applikasjoner. Da vil du igjen få trafikk som blir kategorisert som direkte, med mindre lenkene har kampanjekoder.
  • Samtykkebokser og adblockere: Verktøy som blokkerer eller påvirker sporing og cookies vil på ulike måter kunne påvirke hvordan trafikkilder fanges opp. Det er ikke unormalt å se at det oppstår avvik etter at en samtykkeløsning er implementert eller endret. Disse tingene kan også slå ulikt ut for ulike verktøy og dermed gi opphav til flere avvik.
  • Apples trackingbeskyttelse: Både iOS og Safari har innebygde mekanismer som påvirker hvilke data som kan samles og levetiden på cookies. Dette vil i sin tur gjøre at sammensetningen av trafikkilder og andelen direktetrafikk kan være ulik mellom iOS og Android-brukere. Dette kan påvirke forskjellige systemer på ulike måter.

Data Quality Sucks - Get over it!

Hvis du er en av dem som er frustrert over at det er forskjell, så må du først trekke pusten dypt og tenke på noe hyggelig. To målesystemer for nettrafikk vil aldri gi deg samme svar. Derfor gjentar vi ofte dette sitatet fra Avinash Kaushik som et mantra: “Data Quality Sucks - Get over it!”

Det som er viktigere enn om data er "riktig", er om det er “nyttig”.

Avvik og feil som er stabile over tid kan du ignorere, fordi det da fremdeles vil være verdifullt å se på utvikling over tid. Det vil også være nyttig å se på relative størrelser i form av prosentvis endring, og forskjellene i volum og kvalitet mellom ulike kilder, ulike kampanjer, ulike landingssider osv.

Problemet når du har skiftet system, er at du får et brudd i tidslinjen som det er vanskelig å fikse. Forhåpentligvis satte du opp nytt analyseverktøy tidlig nok slik at du har en periode med overlapp mellom gammelt og nytt system. Da kan du kikke tilbake og få et grep om forventet størrelse på avvikene. Slik kan du danne et nytt bilde av hva som er forventning og baseline for ulike tall. Kanskje kan du finne en nøkkel for omregning slik at de historiske tallene blir sammenlignbare med de nye.

Men ikke bruk masse ressurser på å “rette feilen” mellom nytt og gammelt system, for du kommer uansett aldri til å komme 100% i mål. Bli heller vant til at det nye systemet opererer litt ulikt. Bruddet i tidslinjen vil blekne over tid.

Følg utviklingen i forsidetrafikk

Som sagt er det mange som følger med på direktetrafikken som en indikasjon på merkevarestyrke, posisjon og lojalitet. Dette er en god tilnærming, men blir dessverre forstyrret av dårlig data.

På den ene siden har vi konstatert at direktetrafikken rapporteres alt for lavt, fordi mye tilskrives andre trafikkilder. På den andre siden rapporteres direktetrafikken ofte alt for høyt, fordi alle de andre feilkildene ender opp kategorisert som direktetrafikk.

En bedre løsning er å følge utviklingen i forsidetrafikk, eller mer presist antall besøk som har forsiden som landingsside. I mange tilfeller vil det faktum at folk oppsøker forsiden din være en indikasjon på at de vet hvor de skal, og de kjenner navnet ditt fra før. Uavhengig av hva som rapporteres som trafikkilde, så tyder høy forsidetrafikk på at du har en sterk posisjon.

Og økning i denne trafikken over tid er en god indikasjon på at du gjør noe riktig.

Det beste av alt er at du kan forvente at forsidetrafikken er den samme i alle verktøy. Hvis den ikke er det så har du sannsynligvis et teknisk problem som kan fikses.

Lyst å lære mer om analyseverktøy og innsikt? Finn flere artikler om innsikt og analyse her!