Kostforskning 4 – Evidensgradering av forskningsresultat och exempel på epidemiologiska studier

Den här artikeln tillhör en artikelserie på 5. Det här är del 5. Du hittar alla artiklarna i serien här: Kostforskning

Då var det dags för mitt fjärde inlägg kring kostforskning. Jag kommer i detta inlägg inte förtydliga massa terminologi om den redan finns beskriven i någon av mina tidigare texter. Alla nyuppkomna begrepp och termer ges dock en förklaring. Så finner du terminologi du inte alls känner igen bör den hittas i någon av mina tidigare texter i serien. Om inte så lägg gärna en blänkare i kommentarsfältet så ska jag förklara eller hänvisa till var jag nämnt det tidigare (vilket ju lätt kan missas).

Två typer av statistik med olika innebörd

Deskriptiv statistik

Den här typen av statistik är enbart beskrivande, alltså siffror svart på vitt som visar att någonting är på ett visst sätt. Det kan vara en undersökning i en kommun som visar att 60 % av eleverna på en skola äter skollunchen varje dag. Den statistiken säger inget mer än just det. Den kan ställas mot annan deskriptiv statistik, kanske samma undersökning för tio år sedan. Om man då ser att år 2000 åt 87 % av alla elever i den lilla kommunens gymnasieskola kan man dra slutsatsen en lägre andel elever idag äter skollunchen dagligen. Men fortfarande kan vi bara titta på siffror och se trender, vi kan inte säga ett dugg om eventuella orsaker. Den deskriptiva statistiken har dock ett värde då den kan väcka frågor. Siffrorna kan även ligga till grund för vidare forskning där man vill analysera djupare.

Analytisk statistik

Här kommer analysen av fynden in i bilden. Analytisk statistik är den typen som strävar efter att undersöka flera faktorer för att kunna se hur olika saker korrelerar med varandra. Du som läst min förra text vet att korrelation per automatik inte innebär kausalitet och i den texten kan du även läsa om olika faktorer att beakta för att utvärdera kausaliteten i sambanden.

Låt oss kalla kommunen från det nämnda skollunchexemplet för Nicklasfors och skolan för Jacobskolan. Tack vare den deskriptiva statistiken över det fallande deltagandet i skollunchen bland gymnasieelever vill man nu undersöka varför. Många hävdar att maten är för äcklig, vissa hävdar att de sett barn på pizzerior och menar att ungarna numera bara äter ute på stan. Alla de här spekulationerna är dock ovetenskapliga. Forskaren väljer här en kvantitativ metodik i form av en enkätstudie (mer om kvalitativ och kvantitativ kostforskning). Där frågas om matens smak, hur ofta skolmaten äts, var man äter om man väljer bort skolmat och så vidare.

Vid den statistiska analysen hittas inga statistiskt signifikanta samband mellan varken frekvens av att hellre välja utemat eller osmaklig skolmat. Dock visar det sig att undvikande av skollunch korrelerade med statistisk signifikans för vantrivsel i matsalen. Studiens resultat kan nu tas till vara av kommunen som varken behöver lägga ökade resurser på skolmaten som sådan (eftersom den uppenbarligen smakar bra) och inte behöver man oroa sig allt för mycket över snabbmatsätande till lunch bland genomsnittet av elever. Men däremot finns vetenskapligt underlag för att prioritera insatser mot en förbättrad måltidsmiljö i matsalen.

Den här typen av analytisk statistik är den vi får från epidemiologiska vetenskapliga studier men hur starka sambanden är värderas olika beroende på design (vilket jag också tog upp som en av punkterna i förra texten) och vi ska nu först gå igenom hur studieresultat värderas enligt en evidensgradering och sedan gå in på vilka typer av studier som värderas högst utifrån möjligheten att påvisa orsak och verkan.

Hur graderas evidensstyrka i olika studier?

Bilden här under är från artikeln ”Evidence-based nutrition: Does it differ from evidence-based medicine?” som publicerades i Annals of Medicine i juli 2010 (1). I tabellen kan du se en schematisk och kortfattad bild av hur studier inom kostområdet anses ge vetenskapliga svar. Högst ligger de randomiserade experimenten och därefter observationerna och kvalitén för evidensen kategoriseras som ”High”, ”Moderate”, ”Low” och ”Very low”. De mer ingående beskrivningarna av vad kategoriseringen innebär framgår i bilden och även i texten.

Sinsemellan finns dessutom kriterium för vad som ger interventionsstudien eller observationsstudien mer eller mindre kvalité. För en kontrollerad studie (CT) eller randomiserad kontrollerad studie (RCT) är det först en fråga om eventuella begränsningar i studieupplägget som påverkar om resultaten får ”High” eller ”Moderate” värde. Även inkonsekventa resultat sänker trovärdigheten i resultateten. Hur pass starka sambanden är sett till relativ risk och oddskvoter och hur pass tydligt man kan avgöra effekten av dos-respons är de faktorer som stärker resultatens kvalité.

De epidemiologiska studierna (observationsstudierna) placeras, som du ser, automatiskt i kategorin ”Low” eller ”Very Low”. Det kan vara bra att redan nu ha det i åtanke utifrån min diskussion om hur resultaten från observationsstudierna ofta kan ligga till grund för rekommendationer och även väcka mycket massmedial uppmärksamhet.

De epidemiologiska fyndens styrka sjunker om resultaten inte är direkta och stärks om man genom kontroll av alla tänkbara confounders (vilket i praktiken är omöjligt men det kan göras mer eller mindre noggrant). Om precisionen i resultaten brister samt om publication bias förekommer sjunker de ännu mer. Ett publication bias innebär att positiva resultaten från studier hanteras annorlunda än negativa när de skal publiceras. Alltså att man helt enkelt hellre publicerar en studie som visar positiva effekter än studier som visar negativa eller inga effekter. Om det sker ofta kommer den sammantagna evidensen bli skev och påvisa effekt i flera publikationer samtidigt som kanske motstridiga resultat förlorats. Men om fler studier som även visar negativa resultat, och resultat från vilka man omöjligt kan dra slutsats, framgår tydligare att teorin om ett visst samband har lägre evidens.

I en artikel från 2001, publicerad i British Journal of Medicine, gjordes en liknande genomgång för hur olika studieresultat skall tolkas i fråga om officiella rekommendationer. Artikeln, som du kan läsa i sin helhet här, har titeln ”A new system for grading recommendations in evidence based guidelines.” och en tabell från den artikeln ser du här under (2):

Box 3 Revised grading system for recommendations in evidence based guidelines

Levels of evidence

1++ High quality meta-analyses, systematic reviews of RCTs, or RCTs with a very low risk of bias

1+ Well conducted meta-analyses, systematic reviews of RCTs, or RCTs with a low risk of bias

1- Meta-analyses, systematic reviews or RCTs, or RCTs with a high risk of bias

2++ High quality systematic reviews of case-control or cohort studies or High quality case-control or cohort studies with a very low risk of confounding, bias, or chance and a high probability that the relationship is causal

2+ Well conducted case-control or cohort studies with a low risk of confounding, bias, or chance and a moderate probability that the relationship is causal

2- Case-control or cohort studies with a high risk of confounding, bias, or chance and a significant risk that the relationship is not causal

3 Non-analytic studies, eg case reports, case series

4 Expert opinion

Grades of recommendations

A At least one meta-analysis, systematic review, or RCT rated as 1++ and directly applicable to the target population or

A systematic review of RCTs or a body of evidence consisting principally of studies rated as 1+ directly applicable to the target population and demonstrating overall consistency of results

B A body of evidence including studies rated as 2++ directly applicable to the target population and demonstrating overall consistency of results or

Extrapolated evidence from studies rated as 1++ or 1+

C A body of evidence including studies rated as 2+ directly applicable to the target population and demonstrating overall consistency of results or

Extrapolated evidence from studies rated as 2++

D Evidence level 3 or 4 or

Extrapolated evidence from studies rated as 2+ (2)

Hierarkin för evidensvärde är följande: Meta-analyser, randomiserade kontrollerade studier, icke-randomiserade studier, observationsstudier, deskriptiva studier (icke-analytiska) samt experters utlåtande i frågor. Den här typen av underlag värderas utifrån kvalité för att så småningom leda till råd och rekommendationer. Evidensnivåerna delas in i 1++, 1+ 1-, 2++, 2+, 2´, 3 och 4 där observationsstudierna först kommer in i 2++. Evidensgraden ges sedan kategoriseringen A, B, C och D. Se citatet ovan för med detaljerad information om de olika nivåerna och graderingarna:

Olika typer av epidemiologiska observationsstudier

Jag nämnde i min förra del om epidemiologi att man bör beakta flera olika faktorer av ett resultat för att kunna anta ett kausalt samband. Sista punkten av dessa faktorer var ”Studiedesignens evidensgrad”. Något mer konkret än det faktum att studiens metodik påverkar hur trovärdigt ett resultat är för att påvisa orsak och verkan nämnde jag inte. Bara att det är så. Men inte vilka typer av studier som inom epidemiologin anses ha högre evidensgrad än andra och inte heller varför. Jag hänvisade istället till den här texten och nu ska jag gå igenom fyra olika typer av studiemetodik, vad som karaktäriserar dem, styrkor och svagheter, vilken evidensgrad de tillskrivs och varför.

Kohortstudie

Kohortstudien är prospektiv, den följer populationen framåt i tiden från baseline till avslutandet. Man studerar olika variabler och följer sedan kohortens utveckling av vissa sjukdomar. Därför kallas de även för incidensstudier. Men är studien för kort, eller kohorten för liten, riskerar incidensen bli låg och resultatet svårtolkat. Man använder sig av end points för att avgöra incidens och den bästa av dessa end points är så klart död men även sjukhusinläggning och diagnostisering för just den undersökta sjukdomen.

I kortare studier tittar man istället på surrogat end points som snarare är indikatorer på ökad risk. Om personerna dör i hjärtinfarkt så är ju det tydligt. Men om studien är för kort kanske man istället kollar blodvärden, blodtryck och ser skillnader mellan vissa livsstilsmönster kan man, om man anser sin surrogat end point vara pålitlig, ana en ökad risk för att i framtiden dö av hjärtinfarkt. Tar vi diabetes typ 2 som exempel kanske inte individerna hinner få diagnosen men istället mäts fastenivåer av glukos och insulin i blodet, man tar ett glukostoleranstest och man testar exempelvis akut insulinkänslighet.

Detta är den typ av observationsstudie som ges bäst evidensvärde. Men som du förstår krävs det väldigt mycket för att ge trovärdiga resultat. Att samla in datan under massor av år är jättesvårt och ofta kanske forskarna samlar in kost- och livsstilsdata en enda gång under tio år och drar sedan slutsatser. Eller att man genomför tester och samlar kost- och livsstilsdata då för att sedan kolla upp sina deltagare några extra gånger under studiens gång. Jag kommer gå in mer på vilka metoder som används för insamling av kostdata och även här är det stor skillnad på säkerheten i de data som samlas in. Ju sämre metod för insamling desto större felkällor.

Det går heller aldrig att få med varenda hälsofaktor, fullständigt omöjligt, och det tog jag upp mer i min tidigare text. Slutligen bör ens surrogat end points vara tydligt evidensbaserade för att faktiskt öka risken för att dö i sjukdomen i fråga. Totalkolesterol och LDL-kolesterol är idag surrogat end points som ifrågasätts som bra riskindikatorer för att dö i hjärtinfarkt som exempel. Om vi då drar en massa slutsatser från studier som ser sambandet mellan kostmönster A och högre LDL, kolesterol som ökad risk för hjärtinfarkt finns alltså risken för felaktiga slutsatser. Då kommer ju alla kostrekommendationer handla råd som gör att dessa två markörer hålls låga, men om de inte är farliga blir alla de råden kanske felaktiga redan från grunden?

Fall-kontrollstudie

En fall-kontrollstudie är en retrospektiv observationsstudie, det betyder att den tittar tillbaka och undersöker bakomliggande faktorer. Vad man gör här är att man väljer ut en grupp med fall, det vill säga en grupp av individer i en viss population med en viss sjukdom. Därefter letar man upp en motsvarande grupp individer utan sjukdomen, en kontrollgrupp. Man tittar sedan på exponerade och oexponerade personer i fallgrupp och vice versa för kontrollgrupp. Exponeringen måste konstateras noggrant och även hur länge den pågått. Det måste också vara så att kontrollgruppen är en grupp individer som generellt borde fått samma sjukdom i högre utsträckning om de exponerats lika mycket.

Låt säga att exponeringen i fallet är intag av fisk och sjukdomen i fråga är alzheimers. Då kanske det visar sig att exponerade personer i mindre grad insjuknat i Alzheimers och att kontrollgruppen generellt sett var mer ”exponerade” för fiskkonsumtion. Detta beräknas sedan med oddskvot (se förra artikeln) för att avgöra risk. I fall-kontrollstudier är det framför allt svårt att hitta en lämplig kontrollgrupp. Det kan vara svårt att motivera friska människor att delta i en studie rörande en sjukdom de inte har. Och i studien vill man ju att kontrollgruppen skall vara så lik fallgruppen som möjligt, med sjukdomen i fråga som enda tydlig skillnad.

Tvärsnittsstudie (Cross-sectional study)

I en tvärsnittsstudie gör man en undersökning vid en tidpunkt för att undersöka prevalensen av en viss sjukdom i en population just vid tillfället. på engelska kallas den cross-sectional study och den kallas även, på svenska, för prevalensstudie. Den kan vara lämplig vid väldigt tydlig exponering, om det till exempel skett en olycka där det läcker ut kemikailer i vatten eller dylikt. Om man då gör ett tvärsnitt av den poulationen där kemikalien läckt ut och ser en stor förekomst av skador, som kännetecknas av just den kemikalien, så är resultatet ganska trovärdigt. Men bara att göra ett tvärsnitt i en population, kolla antalet personer med arterioskleros och samtidigt låta dem redogöra för kost och fysisk aktivitet ger resultat av låg evidens. Det är väldigt svårt att konstatera de temporala sambanden mellan exponering och utfall här eftersom individerna redan är sjuka när tvärsnittet görs. Har då de här livsstilsvanorna kommit till före eller efter sjukdomen och har de överhuvudtaget med varandra att göra? Det sistnämnda kan bara visas genom bättre studier.

Ekologisk studie

De ekologiska studierna är den typ av observationsstudier med lägst evidensvärde av de studietyper som publiceras i vetenskapliga tidskrifter. De kallas även för korrelationsstudier vilket är ett begrepp som kanske lite tydligare beskriver vad de undersöker. Man studerar olika grupper av individer och försöker se korrelation med någon livsstilsfaktor. Det kan vara en jämförelsen i förekomst av bröstcancer mellan Sverige, Japan och USA och hur det korrelerar med deras intag av fisk. Eventuellt kan man här se att lägst intag av fisk korrelerar med en högre förekomst av bröstcancer men mer kan man inte säga. Du ser en korrelation men den kan på sin höjd vara hypotesbildande för framtida forskning. I övrigt är den tämligen värdelös som bevis för kausalitet och inte mycket bättre än de deskriptiva studierna. I min förra text tog jag ett exempel med korrelationen mellan långt hår och hårdrocksmusik. Som ett litet pedagogiskt exempel skulle alltså en ekologisk studie kunna studera grupper bestående av män på tio hårdrockskonserter och män på tio konserter med KENT så skulle vi se en tydlig korrelation mellan hårdrockslyssnande och långt hår. 😉

Slutord

Den här texten har syftat till att berätta om hur man inom kostforskning graderar resultaten från studier och hur man därifrån försöker ge råd baserade på mer eller mindre evidensbaserade fynd. Jag har dessutom, i korthet, beskrivit de fyra vanligaste typerna av epidemiologiska studier i fallande ordning för hur pass stark evidens de anses ge för orsakssamband. Som ni kanske redan vet, efter att ha läst min föra text om epidemiologi inom kostforskning, så är min syn på dessa studieresultat att de tyvärr ges för stort utrymme i både medias rapportering men även när råd och rekommendationer fastställs. Som ni kanske anar så anser jag att deras resultat är för svårtolkade, trots att många studier får in massor av data, kontrollerar för confounders så gott det går, och pågår över lång tid.

Den stora frågan blir ju då om man skall samla resultat på hög från observationsstudier för att sedan basera råd och rekommendationer på kvantitet framför kvalitet eller om man skall omprioritera behovet av råd och rekommendationer överhuvudtaget och kanske hålla sig till de saker som förefaller väldigt väldigt starka. Typ att jodbrist ger struma, D-vitaminbrist ökar risken för rakitis, att stora mängder antinutrientrik mat är en riskfaktor för mineralbrister av olika slag etc.

Nästa text i serien blir ännu mindre eget tyckande och mer allmänt förklarande av olika saker. Jag kommer bland annat gå in på de olika metoder som används för att samla in kostdata från människor och förklara varför den vissa metoden är bättre än andra.

1. Mann JI. Evidence-based nutrition: Does it differ from evidence-based medicine? Ann Med. 2010 Jul 24. [Epub ahead of print]
2. Harbour R and Miller J. A new system for grading recommendations in evidence based guidelines. BMJ. 2001 August 11; 323(7308): 334–336.

Fortsätt läsa artikelserienKostforskning 5 – Hur undersöker man matintag? >>

8 thoughts on “Kostforskning 4 – Evidensgradering av forskningsresultat och exempel på epidemiologiska studier

  1. Hej Niklas, när kommer nästa artikel? :O Väntar med spänning, men tycker det gått ett tag nu. 🙁

    VH Stefan

  2. Stefan:
    Hej Niklas, när kommer nästa artikel? :O Väntar med spänning, men tycker det gått ett tag nu.
    VH Stefan

    Hej Stefan!

    Menar du överhuvudtaget eller om kostforskning? Om kostforskning har jag inte planerat men en annan artikel är i princip klar för publicering inom närmsta dagarna.

    Tycker du kostforskningsartiklarna är intressanta ska jag påbörja en åt dig, det livar jag. 🙂

  3. Ja då ska jag försöka få ihop en sådan Stefan! Visste inte hur pass populära texterna är men om du gillar dom så räcker det för mig. 🙂

  4. Längtar till nästa text Nicklas, men har samtidigt lite tips på vidare artiklar i kanske samma serie?

    Du kanske kan ta upp ämnen som Empirism och Falsifierbarhet inom kostvetenskapen?

    Dock skrev du ju inför nästa: ”Nästa text i serien blir ännu mindre eget tyckande och mer allmänt förklarande av olika saker. Jag kommer bland annat gå in på de olika metoder som används för att samla in kostdata från människor och förklara varför den vissa metoden är bättre än andra”.

  5. Stefan:
    Längtar till nästa text Nicklas, men har samtidigt lite tips på vidare artiklar i kanske samma serie?
    Du kanske kan ta upp ämnen som Empirism och Falsifierbarhet inom kostvetenskapen?
    Dock skrev du ju inför nästa: “Nästa text i serien blir ännu mindre eget tyckande och mer allmänt förklarande av olika saker. Jag kommer bland annat gå in på de olika metoder som används för att samla in kostdata från människor och förklara varför den vissa metoden är bättre än andra”.

    Hej Stefan! JAg har texten på G nu. 🙂 Den är i sitt inledningsstadie men på gång i alla fall. Jag ska skriva om metoder för att undersöka och mäta hur folk äter.

Lämna ett svar

E-postadressen publiceras inte. Obligatoriska fält är märkta *