Det er “fejl på fejl på fejl” Det skriver vildtbiolog Egon Bennetsen efter sin gennemgang af DCE’s anbefalede tandsnitsmetode. En metode som måske skal anvendes som barometer på fremtidens kronvildtforvaltning …

Af: Egon Bennetsen, Vildtbiolog, d. 25.12. 2016

NOTAT VEDRØRENDE DCEs ANALYSE AF TANDSNITSMETODEN

Konklusion:

DCE har forsøgt at validere tandsnitsmetoden til aldersbestemmelse på et materiale bestående af 37 danske krondyr. Forskerne på DCE har kaldt det ”guldstandarden” inden for aldersbestemmelse af kronvildt. Metoden er vidt udbredt, og som eksempler nævner DCE kronvildt og elg i Norge. Man hævder, at metoden rammer tæt på den faktiske gennemsnitsalder for en bestand.

Det er rigtigt nok, men gennemsnitsalderen er helt uinteressant, når det – sådan som metoden er tiltænkt i den danske hjorteforvaltning – drejer sig om at vurdere, hvorvidt 5 af 100 hjorte (5%) er 8 år eller ældre.

DCE har behandlet tandsnitsmetoden. Rapporterne indeholder imidlertid en række faglige fejl både hvad angår teksten, grafikken og tabellerne. Men værst af alt indeholder rapporterne også en række graverende statistiske og faglige fejl i DCEs beregning og vurdering af tandsnitsmetodens præcision. DCE postulerer følgende:

1) Tandsnitsmetoden har en høj grad af forklaret variation (Determinationskoefficienten) R2 = 0,92 = 92%

2) Tandsnitsmetoden kan fastlægge den faktiske alder +/- 2 år

3) Tandsnitsmetoden kan fastlægge den reelle alder +/- 10 %
Alle 3 DCE-påstande er forkerte.

Som dette notat viser, er faktum derimod, at tandsnitsmetoden har en meget lav forklaringsgrad på kun 50 %, og således videnskabelig set er ubrugelig samt at DCE i flere tilfælde fejlagtigt tolker tandsnitsmetodens præcision på en måde, der slet ikke er fagligt belæg for.

Med andre ord: Fejl på fejl på fejl.

Det er altså ikke på redelig vis lykkedes DCE at validere tandsnitsmetoden på danske krondyr. Hvorvidt det skyldes metodeusikkerhed, eller det skyldes de forhold dyrene lever under i Danmark (eksempelvis lille årstidsvariation i fødegrundlag), aner jeg ikke.

Det er derimod sikkert, at aldersbestemmelse vha. tandsnit er uanvendelig for danske krondyr, og at metoden derfor ikke kan danne grundlag for fremtidens kronvildtforvaltning.

    ****** GENNEMGANG ******

1) Fejl i DCEs analyse af tandsnitsmetodens præcision (R2)

I DCE-rapporten: Bæredygtig kronvildtforvaltning. Videnskabelig rapport nr. 106. 2014 Sunde og Haugaard (Kilde 1)

hævdes det:

”I et referencemateriale på 37 individer med kendt alder (mærket som kalve eller 1-årige), kunne de enkelte dyrs alder uden systematiske fejlkilder og med en høj grad af forklaret variation (R2 = 97 %) estimeres vha.antallet af vækstlinjer i tandmateriale, om end med en usikkerhed på ± 2 år for det enkelte individ. Overordnet set betyder dette, at aldersbestemmelse vha. tandsnit må betegnes som en anvendelig og objektiv metode til aldersbestemmelser af danske krondyr.” (Min fremhævelse).

Referencematerialet er vist i nedenstående fig. 5.

Her er det dog kun muligt at finde de 30 punkter. Der mangler altså 7. Det er en klar fejl.

1

Figur 5. Alder estimeret ud fra tandsnit plottet mod kendt alder for 37 krondyr fra tre danske bestande. Den tykke linje angiver regressionslinjen af den estimerede sammenhæng mellem alder bestemt ved tandsnit og dyrets faktiske alder med skæring i punktet 0,0. De tynde linjer angiver 95 %-sikkerhedsgrænser for bestemmelsen af den rette linje. Dyr til og med det 2. fyldte år kan aldersbestemmes uden usikkerhed ud fra sammensætningen af mælketænder og blivende tænder.

Jeg beder i en henvendelse til DCE (31/10/16) om en forklaring på to forskellige værdier på R2, nemlig de 97 % nævnt ovenfor, og de 0,919 = 92 %, der er angivet i figur 5.

Hertil svarer Aksel Bo Madsen på vegne af DCE (2/11):

”I din henvendelse kan vi se at R2 – værdien i Figur er forkert angivet til 97 % side 5, og det vil vi ændre til den korrekte værdi 92%. Fejlen beror på en hændelig, beklagelig slåfejl.” Min fremhævelse.

Igen en klar fejl taget i betragtning, at adskillige fagpersoner, heriblandt mindst 6 fra DCE, har gennemlæst og/eller kvalitetssikret rapporten. (https://www.netnatur.dk/dnhs-hjoreteplan-det-faglige-grundlag-d/

I et notat fra DCE til Danmarks Jægerforbund (16/9/16):

ALDERSBEDØMMELSE OG KÆBEINDSAMLING

står der:

”I en analyse af 37 dyr med kendt alder, blev den estimerede alder for det enkelte dyr fra og med det 4. fyldte år undertiden estimeret ente for højt eller for lavt i forhold til dyrets rigtige alder (Sunde and Haugaard 2014: Figur 5). I gennemsnit rammer aldersbestemmelsen imidlertid rigtigt, hvilket betyder at en bestands aldersfordelingen estimeret ud fra denne metode bliver retvisende og med en høj statistisk forklaringsgrad (92-98 %: Figur 5 og 6 i Sunde and Haugaard 2014)” (Min fremhævelse).

På et tidligt tidspunkt forekom det mig, og flere andre, besynderligt, at den viste fordeling af de 30 punkter i figur 5, kunne give en så høj forklaringsgrad (præcision) som de angivne 92 %.

I artiklen på Netnatur.dk d. 2/10: https://www.netnatur.dk/dnhs-hjoreteplan-det-faglige-grundlag-d/

har jeg fremført, at min beregning af R2, på grundlag af de 30 punkter der kunne erkendes, var: 0,42. Hvis de resterende 7 punkter blev placeret på linjen Y= X, var værdien 0,51. Alt beregnet relativt simpelt i Excel.

TØVENDE UDLEVERING

At tabellen, der lå til grund for figur 5, ikke var medtaget i rapporten (Kilde 1), er en grov fejl. Selvom jeg havde påpeget de manglende 7 punkter, var de ikke medsendt i svaret d. 2/11/16. Jeg kunne derfor ikke lave den korrekte beregning i forhold til Peter Sundes beregning på 0,92.

Den 8/11 begærede jeg derfor i henhold til offentlighedsloven aktindsigt i de 7 punkter og beregningen af den mistænkeligt høje forklaringsgrad på 0,92. Først den 23/11 skete der noget, da jeg fik fremsendt de 37 punkter (Bilag 1) og beregningen af R2 (Bilag 2) fra en jurist i DCE.

(Filen med beregningen af regressionen med R2 værdien på 0,92 fylder 17 sider. I Bilag 2 er medtaget de 2 sider, der opsummerer beregningen).

På baggrund heraf kunne jeg beregne R2 til 0,5014 = 0,50 = 50 %. Altså en meget lav forklaringsgrad, der ikke kan anvendes videnskabeligt.

DCE fastholdt altså– ukommenteret – værdien på 0,92.

…………………………………..

Den 7/11/16 blev jeg af Danmarks Jægerforbund inviteret til møde i Jagtens Hus sammen med nogle jagtforeningsformænd fra Thy, der har efterspurgt svar på mine spørgsmål, som de finder relevante.

I indbydelsen stod bl.a.:

”På vegne af Danmarks Jægerforbund vil vi gerne invitere jer til et dialogmøde i Jagtens Hus for at gå i dybden med besvarelse af nogle af de spørgsmål I har stillet knyttet til hjortevildtforvaltning og adaptiv forvaltning.” (Min fremhævelse).

På mødet, der blev afholdt d. 13/12, havde vi håbet, at Peter Sunde og Aksel Bo Madsen, som repræsenterede DCE, ville forklare, hvordan Sunde var kommet frem til de 0,92.

Stor var vores forbløffelse, da Aksel Bo Madsen startede mødet med at fastslå, at man ikke agtede at svare på mine spørgsmål, ud over hvad der allerede var sket med Bilag 1 og Bilag 2.

Vi fik altså ikke en forklaring på – eller en diskussion om – hvorfor vi kunne komme frem til to forskellige grader af præcision for de samme 37 punkters R2 værdi.

Peter Sunde betonede dog, at de havde anvendt statistikprogrammet SAS, og at det blev brugt af mange videnskabelige institutter.

Så med hensyn til hvorvidt tandsnitsmetoden med de 37 danske krondyr med kendt alder er videnskabeligt valideret med resultatet i figur 5, stod vi mildest talt milevidt fra hinanden

Da jeg ikke er statistiker, var det svært at komme videre, når DCE hårdnakket nægtede at medvirke til en afklaring.

Det var der imidlertid et par statistiske begavelser, vi kalder dem NN1 og NN2, der gerne ville…!

DEN TEKNISKE ANALYSE

I bilag 1 fra DCE fik jeg endelig kendskab til de 37 punkter.

Sat ind i Excel giver det følgende fig.:

Figur 1

Bemærk: I figurerne vises kun 28 af de 37 punkter, der ligger til grund for beregningerne, idet flere datapar er identiske. For datasættet med de 37 krondyr se bilag 1.

 

1r2jpg

Heraf fremgår det tydeligvis at R2 = 0.5014

Bemærk at linjen er med skæring i punktet 0,0.

(Hvorvidt dette er korrekt, kan i høj grad diskuteres, hvis linjen skal bruges til kalibrering af fremtidige resultater).

Hvis vi ikke ”tvinger” linjen gennem 0,0, men bruger beregnet skæring, ændres R2 kun ubetydeligt til 0,5182. Se Figur 2

Figur 2

fig22

En entusiastisk person gjorde mig opmærksom på, at en af hans kolleger havde vist ham, at man også i Excel, ved hjælp at et tillægsprogram med ”Dataanalyse”, kunne komme frem til 0,92.

Hvis vi her (fejlagtigt) vinkler feltet: ”Konstant er nul” af, får vi Sundes R2 = 0.9189, hvilket er langt fra de ovennævnte = 0,5014

Hvis vi ikke vinkler feltet: ”Konstant er nul” af, får vi R2 = 0,5182. Nøjagtig som vist i fig. 2

…………………………………..

De to statistikkyndige NN1 og NN2, der var grebet af diskussionen, sendte mig uafhængigt af hinanden deres beregninger af R2, der giver mig ret i, at den rette R2 værdi er 0,5014 = 0,50 = 50%.

NN1s bevis (Bilag 3):

Konklusion: ”Jeg kan kun se at R2 bliver 0.5014.”

                                                               ****

NN2s bevis (Bilag 4):

(Se desuden: Bilag 4A (NN2 forsøg beregnet) og Bilag 4B (NN2 forsøg grafisk).)

Konklusion:

Med skæring i 0

SAK Model               444,32

SAK Residual          221,54

SAK total               665,86

R^2                     0,5014        

”Jeg er fuldstændig overbevist om at DCE regner forkert i deres SAK (model)”

(Min fremhævelse)

NN2’s påpegning af fejlen I Sundes beregning. (Bilag 5)

Her hedder det bl.a.:

”DCE fjumrer så vidt jeg kan se i Den samlede kvadrerede sum af totale afstande til middelværdiDe måler ikke afstanden fra hvert datapunkt op/ned til middelværdien. De måler i stedet afstanden ned til 0”

****

Det står herefter fuldstændig klart, at Peter Sunde og Aksel Bo Madsen gentagne gange fastholder en helt forkert R2 værdi på 0.92, mens den rigtige værdi er 0,5014 = 0,50.

Efter at have skygget datasættet i Excel, kræver det blot 7 museklik, at få grafen og værdierne i fig. 1 frem!

****

Konklusion angående tandsnitsmetodens præcision (R2):

Der er således aldeles ikke tale om, at de enkelte dyrs alder kan estimeres ” med en høj grad af forklaret variation (R2 = 97%) (Rettet til 0,92), som hævdet af DCE.

Tværtimod kan de enkelte dyrs alder kun estimeres med en meget lav grad af forklaret variation (R2 = 0,50 = 50%)!

Som tandsnitsmetoden er udført og præsenteret af DCE, er den fuldstændig ubrugelig som videnskabelig analysemetode, og tandsnitsmetoden kan slet ikke anvendes til, med nogen acceptabel grad af præcision, at vurdere om 5 ud af 100 dyr (5%) er 8 år eller ældre! 

EKSEMPLER

A) Jeg vil nu give et eksempel på hvor mange af de 37 punkter, man er nødt til at fjerne for at opnå en R2 værdi på 92 %:

Figur 3

33

I det givne eksempel er beregningen foretaget på baggrund af de 30 punkter, der ligger i intervallet: Rigtig alder +/- 2 år. (Blå punkter). (Husk flere af punkterne har identiske datapar (Bilag 1)).

Det betyder altså, at for at få den høje R2 værdi på 0,92 er vi er nødt til at udelade de 7 punkter, (Røde), der ligger 3 år eller mere fra rigtig alder!

B.) Herefter et eksempel, der viser, hvad R2 værdien bliver, hvis vi kun accepterer en afvigelse på +/- 1 år:

Figur 4 fig-444

 

I dette eksempel er beregningen foretaget på baggrund af de 27 punkter, der ligger i intervallet: Rigtig alder +/- 1 år. (Blå punkter) (Husk flere af punkterne har identiske datapar (Bilag 1)).

Jeg har hele tiden hævdet, at: Rigtig alder +/- 1 år må anses for at være en acceptabel afvigelse.   Det ville med dette datasæt kræve, at R2 værdien skal være over 0,95 = 95 % og bevirke, at vi er nødt til at se bort fra de 10 punkter, der ligger længst væk fra de rigtige værdier.

2) Fejl i DCEs vurdering af tandsnitsmetoden (+/- 2 år)

I DCE-rapporten: Bæredygtig kronvildtforvaltning. Videnskabelig rapport nr. 106. 2014 Sunde og Haugaard (Kilde 1) hævdes det:

”I et referencemateriale på 37 individer med kendt alder (mærket som kalve eller 1-årige), kunne de enkelte dyrs alder uden systematiske fejlkilder og med en høj grad af forklaret variation (R2 = 97 %) estimeres vha. antallet af vækstlinjer i tandmateriale, om end med en usikkerhed på ± 2år for det enkelte individ.”  Min fremhævelse.

Der gøres altså i rapporten gældende, at tandsnitsmetoden kan fastlægge den faktiske alder med en usikkerhed på +/- 2 år.

Jeg har spurgt DCE om denne påstand er baseret på DCE-rapportens fig. 5?

DCE har nægtet at svare på mit spørgsmål.

DCEs påstand er imidlertid helt forkert. På figur 5 og bilag 1 ses nemt, at følgende 7 punkter (Røde punkter i figur 3) ikke lever op til påstanden:

X-værdi Y-værdi
5 14
5 2
7 15
8 5
8 11
12 8
14 11

 

Dette er en grov fejl, idet DCE derved får tandsnitsmetoden til at fremstå med en nøjagtighed, der ikke er belæg for.

3) Fejl i DCEs vurdering af tandsnitsmetoden (+/- 10 %)

I: Modeller for måling af udviklingen i andelen af ældre hjorte i danske krondyrbestande.                 Notat fra DCE – Nationalt Center for Miljø og Energi Dato: 13. maj 2016, Peter Sunde

hævdes det:

”Aldersbestemmelse vha. tandsnit må betragtes som den mest præcise og eksakte aldersbestemmelsesmetode (+/- 10 % af reel alder) (Sunde & Haugaard 2014))”   Min fremhævelse

Igen har jeg spurgt DCE om denne påstand er baseret på DCE-rapportens fig. 5?

DCE har også nægtet at svare på dette spørgsmål.

 

Sunde gør altså gældende, at tandsnitsmetoden kan fastlægge den faktiske alder med +/- 10%.

I henhold til de almindelige afrundingsregler indebærer det, at dyr der er i aldersintervallet 1 – 4 år (4 år +/- 10 % = 3,6 – 4,4 år) ikke må afvige fra kendt alder. I aldersintervallet 5 – 14 år må dyrene afvige med +/- 1 år fra kendt alder. (5 år +/- 10 % = 4,5 – 5,5 år og 14 år +/- 10 %= 12,6 – 15,4 år).

Af bilag 1 ses det nemt, at hele 14 af 37 punkter ikke lever op til påstanden.

Dette er en grov fejl, idet DCE derved får tandsnitsmetoden til at fremstå med en nøjagtighed, der slet ikke er belæg for.

 

Bilag

 

Bilag 1

 

ID population snit_est FACIT sex ID_NINA
2010A7 Oksbøl 2 2 M A7
2012A16 Jægersborg 3 3 M A16
2010A10 Oksbøl 3 4 F A10
2010A12 Oksbøl 3 4 F A12
2010A15 Oksbøl . 4 M A15
2010A18 Oksbøl 5 4 F A18
2010A5 Oksbøl 3 4 M A5
2010A13 Oksbøl 14 5 F A13
2010A16 Oksbøl 5 5 F A16
2010A4 Oksbøl 4 5 F A4
2010A9 Oksbøl 2 5 F A9
2012A15 Jægersborg 5 6 M A15
2010A14 Oksbøl 15 7 F A14
2010A3 Oksbøl 6 7 M A3
2011A2 St. Frederikslund Dyrehave 6 7 M A2
2011A4 St. Frederikslund Dyrehave 7 7 M A4
2010A1 Oksbøl 9 8 F A1
2010A11 Oksbøl 10 8 F A11
2010A17 Oksbøl 8 8 F A17
2010A2 Oksbøl 5 8 M A2
2010A6 Oksbøl 11 8 F A6
2010A8 Oksbøl 8 8 F A8
2011A3 St. Frederikslund Dyrehave 6 8 M A3
2012A1 Jægersborg 9 8 M A1
2012A10 Jægersborg 8 8 M A10
2012A14 Jægersborg 8 8 M A14
2011A1 St. Frederikslund Dyrehave 8 9 M A1
2012A7 Jægersborg 10 10 M A7
2012A9 Jægersborg 8 10 M A9
2012A11 Jægersborg 11 11 M A11
2012A13 Jægersborg 11 11 M A13
2012A6 Jægersborg 10 11 M A6
2012A12 Jægersborg 12 12 M A12
2012A2 Jægersborg 12 12 M A2
2012A3 Jægersborg 13 12 M A3
2012A8 Jægersborg 8 12 M A8
2012A4 Jægersborg 12 13 M A4
2012A5 Jægersborg 11 14 M A5

 

Bilag 2

Linear Regression Results

The REG Procedure
Model: Linear_Regression_Model
Dependent Variable: snit_est

 

Number of Observations Read 38
Number of Observations Used 37
Number of Observations with Missing Values 1

Note: No intercept in model. R-Square is redefined.

 

Analysis of Variance
Source DF Sum of
Squares
Mean
Square
F Value Pr > F
Model 1 2511.45938 2511.45938 408.11 <.0001
Error 36 221.54062 6.15391
Uncorrected Total 37 2733.00000

 

Root MSE 2.48071 R-Square 0.9189
Dependent Mean 7.86486 Adj R-Sq 0.9167
Coeff Var 31.54163  

 

 

Parameter Estimates
Variable DF Parameter
Estimate
Standard
Error
t Value Pr > |t|
FACIT 1 0.97646 0.04834 20.20 <.0001

 

555

 

Bilag 3

Jeg har lavet et lille script i Matlab UDEN brug at funktioner, dvs. man kan regne alt ud på et stykke papir, hvis man har lyst J Nedenfor kan i se koden og resultaterne. Jeg kan kun se at R^2 bliver 0.5014.

Universitetet bør kunne lave en tilsvarende beregning UDEN brug at statistik-værktøjer…der er trods alt ikke mange data at arbejde med.

 

% colums: Known, Estimated

rawData=[2  2

3  3

4  3

4  3

4  5

4  3

5  14

5  5

5  4

5  2

6  5

7  15

7  6

7  6

7  7

8  9

8  10

8  8

8  5

8  11

8  8

8  6

8  9

8  8

8  8

9  8

10 10

10 8

11 11

11 11

11 10

12 12

12 12

12 13

12 8

13 12

14 11]

 

% Define variables

x = rawData(:,1); % Known Age

y = rawData(:,2); % Estimated Age

 

%========================================================================

% Least Square Fit to model: y = ax

%========================================================================

a = (x’*x)^-1*x’*y % Matrix form of Least Square (x’ = transpose)

 

% Calculate age based on fitted model y=ax

yCalc = a*x;

 

%========================================================================

%Calculate R^2 DIRECTLY:

%========================================================================

Rsq1 = 1 – sum((y – yCalc).^2)/sum((y – mean(y)).^2)

 

%========================================================================

%STEP-BY-STEP calculation of R^2:

%========================================================================

% Compute the residual values as a vector of signed numbers:

yresid = y – yCalc;

 

% Square the residuals and total them to obtain the residual sum of squares:

SSresid = sum(yresid.^2)

 

% Compute the total sum of squares of y by multiplying the variance of y by the number of observations minus 1:

SStotal = (length(y)-1) * var(y)

 

%Compute R2 using the formula given in the introduction of this topic:

Rsq2 = 1 – SSresid/SStotal

 

RESULTATER

a =

0.9765

Rsq1 =

0.5014

SSresid =

221.5406

SStotal =

444.3243

Rsq2 =

0.5014

 

Bilag 4:

Hvis du lige bruger eksemplet med cykler fra i går, så prøv at sætte den i relation til figuren herunder.

x-aksen er salg af cykler fra en cykelhandler

y-aksen er salg af cykelhjelme fra samme cykelhandler

(Vi forventer at der er en lineær sammenhæng. )

I 1995 sælges 1000 cykler og 300 cykelhjelme

I 1996 sælges der 2000 cykler og 700 hjelme. (altså 400 end året før mere. Antallet af cykler er fordoblet, men antallet af hjelme er MERE end fordoblet)

De første 300 ekstra hjelme som er solgt i 1996 kan umidelbart forklares ved at at antalet af solgte cykler er fordoblet.

De sidste 100 kan ikke umidelbart forklares modellen og må skyldes ”noget andet” (måske en trafiksikkerhedskampagne)

 

SAK står for Sum Af Kvadrater

Total= 400

Model = 300

Residual = 100

 

665

Når du har forstået grafen og er med på begreberne Model, Total og Residual, så kan vi gå videre til afsnittet herunder.

Excel Grafisk med skæring i 0

Hældning: 0,9765x

Skæring: 0

R^2: 0,5014

 

777

Excel grafisk med ”bedste rette linie” og dermed ikke skæring i 0

Hældning: 0,8358

Skæring: 1,2687

R^2: 0,5182     (altså en anelse højere R^2 end hvis man tvinger linien igennem 0 på y aksen)

 

888

Alt dette er er kendt viden. Det har vi hele tiden vidst.

Dataene nedenfor kommer fra vedhæftede ark (X forsøg beregnet)

Med skæring i 0

SAK Model               444,32

SAK Residual           221,54

SAK total               665,86

R^2                     0,5014

 

Uden skæring i 0

SAK Model              444,32

SAK Residual           214,09

SAK total               658,41

R^2                     0,5182

 

Bemærk at summen af både resudialer og SAK total falder når vi benytter den bedste rette linie overhovedet.

R^2 beregnes i øvrigt ovenfor vha følgende formel:

8888

Både DCE og jeg beregner summen af residualer til 221,54

Jeg beregner dog Sum Of Squares –MODEL til 444,32.  Den får DCE til 2511,45!!!!!!.

Formelen til SAK-model er ellers ret simpel, så tallet herunder kan hurtigt forkastes som noget værre volapyk

999

Tallet 2511,45 bruger DCE så videre i deres beregning til F-teststørrelsen, som er beregnet som vist nedenfor.

Jeg har indsat tal for at hjælpe dig lidt på vej

1011

Hvis vi bruger min beregning får vi en helt anden teststørrelse

12

Man kan tage gennemsnitshøjden af 30 mennesker på Borneo og gennemsnitshøjden for 30 danskere. Lad os sige at det er henholdsvis 1,68 og 1,78.

Det betyder jo ikke at vi med 100% sikkerhed kan sige at gennemsnitshøjden på ALLE mennesker på Borneo er forskellig fra gennemsnitshøjden på ALLE danskere.

Middelværdierne i stikprøverne er uomtvisteligt forskellige, men det kunne jo være at vi havde valgt 30 lave Borneanere og 30 høje danskere ved rent uheld.

Derfor laver man altid en F-test for at vurdere sandsynligheden af at man tager fejl i sin hypotesetest

Hypoteseteste i eksemplet her er: H0 = Gennemsnitshøjden for folk på Borneo og gennemsnitshøjden for Danskere er ens

Hvis man forkaster 0-hypotesen, er det samtidig god skik at skrive sandsynligheden for at man har begået en fejl. Den kunne f.eks. være 0,1%

 

Beregningen af sandsynligheden for at man tager fejl fremkommer når man laver en sandsynlighedsberegning på F-kritisk > F-test. ( Også kaldet Pr > F)

F-kritisk kan man slå op i nogle tabeller. Det er nogle standardværdier som afhænger af konfidensinterval (f.eks. 95% sikkerhed) og antallet af frihedsgrader i stikprøven.

 

Vi skal lige grave lidt mere i det her, men husk på at ANOVA anlysen er en analyse hvor vi sammenligner varianser to to grupper for at afgøre om man med rimelig sandsynlighed kan sige at middelværdierne er ens.

 

Jeg er fuldstændig overbevist om at DCE regner forkert i deres SAK (model)

Denne beregning fører de så videre til beregning af F-test.

Det medfører at deres Pr > F (PR står for Probability) er forkert.

 

De forkaster IKKE nulhypotesen og konkluderer at de to middelværdier i tandsnitsmetode og faktisk alder er identisk.

De siger også at sandsynligheden for at ovenstående sætning er løgn og latin er under 0,0001

Beregningen af 0,0001 er dog fremkommet på forkert grundlag, da deres F-model jo er beregnet forkert.

 

Det betyder ikke nødvendigvis at konklusionen i rapporten er forkert.

Den kan stadig godt være rigtig, men deres matematik er forkert.

F-model er forkert og PR > F er forkert. Basta!

 

Bilag 4A

 

Med skæring i 0 Uden skæring i 0
snit_est FACIT SAK model Udregnet alder SAK Residual SAK total SAK model Udregnet alder SAK Residual SAK total
2 2 34,39663988 1,953 0,002209 34,39884888 34,3966399 2,9403 0,88416409 35,280804
3 3 23,66691015 2,9295 0,00497025 23,6718804 23,6669102 3,7761 0,60233121 24,2692414
3 4 23,66691015 3,906 0,820836 24,48774615 23,6669102 4,6119 2,59822161 26,2651318
3 4 23,66691015 3,906 0,820836 24,48774615 23,6669102 4,6119 2,59822161 26,2651318
5 4 8,207450694 3,906 1,196836 9,404286694 8,20745069 4,6119 0,15062161 8,3580723
3 4 23,66691015 3,906 0,820836 24,48774615 23,6669102 4,6119 2,59822161 26,2651318
14 5 37,63988313 4,8825 83,1288063 120,7686894 37,6398831 5,4477 73,1418353 110,781718
5 5 8,207450694 4,8825 0,01380625 8,221256944 8,20745069 5,4477 0,20043529 8,40788598
4 5 14,93718042 4,8825 0,77880625 15,71598667 14,9371804 5,4477 2,09583529 17,0330157
2 5 34,39663988 4,8825 8,30880625 42,70544613 34,3966399 5,4477 11,8866353 46,2832752
5 6 8,207450694 5,859 0,737881 8,945331694 8,20745069 6,2835 1,64737225 9,85482294
15 7 50,9101534 6,8355 66,6590603 117,5692136 50,9101534 7,1193 62,1054325 113,015586
6 7 3,477720964 6,8355 0,69806025 4,175781214 3,47772096 7,1193 1,25283249 4,73055345
6 7 3,477720964 6,8355 0,69806025 4,175781214 3,47772096 7,1193 1,25283249 4,73055345
7 7 0,747991234 6,8355 0,02706025 0,775051484 0,74799123 7,1193 0,01423249 0,76222372
9 8 1,288531775 7,812 1,411344 2,699875775 1,28853178 7,9551 1,09181601 2,38034779
10 8 4,558802045 7,812 4,787344 9,346146045 4,55880205 7,9551 4,18161601 8,74041806
8 8 0,018261505 7,812 0,035344 0,053605505 0,0182615 7,9551 0,00201601 0,02027751
5 8 8,207450694 7,812 7,907344 16,11479469 8,20745069 7,9551 8,73261601 16,9400667
11 8 9,829072316 7,812 10,163344 19,99241632 9,82907232 7,9551 9,27141601 19,1004883
8 8 0,018261505 7,812 0,035344 0,053605505 0,0182615 7,9551 0,00201601 0,02027751
6 8 3,477720964 7,812 3,283344 6,761064964 3,47772096 7,9551 3,82241601 7,30013697
9 8 1,288531775 7,812 1,411344 2,699875775 1,28853178 7,9551 1,09181601 2,38034779
8 8 0,018261505 7,812 0,035344 0,053605505 0,0182615 7,9551 0,00201601 0,02027751
8 8 0,018261505 7,812 0,035344 0,053605505 0,0182615 7,9551 0,00201601 0,02027751
8 9 0,018261505 8,7885 0,62173225 0,639993755 0,0182615 8,7909 0,62552281 0,64378431
10 10 4,558802045 9,765 0,055225 4,614027045 4,55880205 9,6267 0,13935289 4,69815494
8 10 0,018261505 9,765 3,115225 3,133486505 0,0182615 9,6267 2,64615289 2,66441439
11 11 9,829072316 10,7415 0,06682225 9,895894566 9,82907232 10,4625 0,28890625 10,1179786
11 11 9,829072316 10,7415 0,06682225 9,895894566 9,82907232 10,4625 0,28890625 10,1179786
10 11 4,558802045 10,7415 0,54982225 5,108624295 4,55880205 10,4625 0,21390625 4,7727083
12 12 17,09934259 11,718 0,079524 17,17886659 17,0993426 11,2983 0,49238289 17,5917255
12 12 17,09934259 11,718 0,079524 17,17886659 17,0993426 11,2983 0,49238289 17,5917255
13 12 26,36961286 11,718 1,643524 28,01313686 26,3696129 11,2983 2,89578289 29,2653957
8 12 0,018261505 11,718 13,823524 13,8417855 0,0182615 11,2983 10,8787829 10,8970444
12 13 17,09934259 12,6945 0,48233025 17,58167284 17,0993426 12,1341 0,01798281 17,1173254
11 14 9,829072316 13,671 7,134241 16,96331332 9,82907232 12,9699 3,88050601 13,7095783
444,3243243 221,540627 665,8649508 444,324324 214,089553 658,413877

 

0,501398833 0,51816828
Skæring i 0 Skæring IKKE i 0
Gennemsnit 7,86486486 Gennemsnit 7,86486486
Hældning 0,9765 Hældning 0,8358
b 1,2687

 

Bilag 4B

snit_est FACIT          
2 2 1415
3 3
3 4
3 4
5 4
3 4
14 5
5 5
4 5
2 5
5 6
15 7
6 7
6 7
7 7
9 8
10 8
8 8
5 8
11 8
8 8
6 8
9 8
8 8
8 8
8 9
10 10
8 10
11 11
11 11
10 11
12 12
12 12
13 12
8 12
12 13
11 14

 

Bilag 5

 

Herunder er et uhyre simpelt plot.
3 punkter
Formel fremgår af grafen

16

R^2 er defineret som: 1 – (SAKresidual / SAKtotal)

Residual for første datapunkt: (afstand fra punktet op til tendenslinien)        = 0,5           (0,5 x 0,5 = 0,25)
Residual for andet datapunkt                                            = – 1           (-1 x -1 = 1)
Residual for tredie datapunkt                                           = 0,5           (0,5 x 0,5 = 0,25)
Den samlede kvadrerede sum af residualer er derfor 0,25 + 1 + 0,25      = 1,5

 

Gennemsnittet af de 3 datapunkter er (1 + 3 + 2) / 3                     = 2
Afstand fra første datapunkt til middelværdi    (2 – 1)                 = 1             (1 x 1 = 1)
Afstand fra andet datapunkt til middelværdi     (2 – 3)                 = – 1           (-1 x -1 = 1)
Afstand fra tredie datapunkt til middelværdi    (2 – 2)                 = 0
Den samlede kvadrerede sum af totale afstande til middelværdi: 1 + 1    = 2

 

R^2 = 1 – (1,5 / 2) = 1 – 0,75 = 0,25 (som Excel også har fundet frem til)

DCE fjumrer så vidt jeg kan se i Den samlede kvadrerede sum af totale afstande til middelværdi.
De måler ikke afstanden fra hvert datapunkt op/ned til middelværdien. De måler i stedet afstanden ned til 0.
Når de måler afstanden ned til 0 uden hensyntagen til middelværdien i datasættet, vil deres samlede kvadrerede sum af totale afstande til middelværdi blive enorm høj.
Dermed bliver brøken (SAKresidual / SAKtotal) enormt lille (da nævneren i brøken er meget stor. )

Når så formelen giver at R^2 = 1 – SAKresidual / SAKtotal), vil R^2 naturligvis være skyhøj, da bidraget fra brøken (som skal trækkes fra 1) er forsvindende lille)