Hoe werkt het?
1. De basis
Het eendenkuikenproject is een zogenaamd ‘citizen science project’, een project voor burgerwetenschappers in goed Nederlands. Dat houdt in dat het project zo is opgezet dat vrijwilligers op grote schaal eraan kunnen meedoen. Het grote voordeel daarvan is dat het project gebruik kan maken van de duizenden ogen van vrijwilligers verspreid over het hele land, maar het betekent ook dat het project laagdrempelig moet zijn. Daarom wordt voor het eendenkuikenproject alleen maar gevraagd om waarnemingen met de volgende gegevens:
- Datum
- Locatie
- Soort
- Aantal kuikens
- Leeftijd kuikens
Het project richt zich in principe op de Wilde Eend, maar ook Soepeend en Krakeend worden al jaren meegenomen. In de toekomst zullen andere soorten aan het project worden toegevoegd. Het lastigste is om de leeftijd van de kuikens in te schatten, maar hiervoor worden waarnemers geholpen met voorbeeldplaatjes van kuikens van verschillende leeftijden. Hierover later meer.
Voor de berekening van de kuikenoverleving wordt gebruik gemaakt van series van waarnemingen van hetzelfde gezin (dezelfde toom) binnen het broedseizoen. We noemen dit ‘vervolgwaarnemingen’. Dit maakt het project iets lastiger, omdat hiervoor dus de gezinnen gevolgd moeten worden. Dat is niet altijd eenvoudig, omdat eenden met kuikens zich kunnen verplaatsen. Toch blijkt in de praktijk dat het vaak mogelijk is om met tussenpozen van enkele dagen of zelfs weken eendengezinnen terug te vinden, waarbij het met een vrij grote zekerheid gaat om hetzelfde gezin. Een aantal aspecten kan hierbij helpen, namelijk:
- het uiterlijk van het vrouwtje (niet zelden zijn Wilde Eenden individueel herkenbaar)
- de locatie (meestal blijven gezinnen binnen een straal van enkele honderden meters)
- het aantal kuikens (het kunnen er in principe niet meer worden)
- de leeftijd van de kuikens (ze kunnen niet jonger worden)
Bij de vervolgwaarneming worden precies dezelfde gegevens doorgegeven als bij de eerste waarneming, met aanvulling de melding dat het een vervolgwaarneming betreft (gekoppeld aan de voorgaande waarneming). Dit geeft twee essentiële details: het aantal dagen tussen de waarnemingen en het verschil in het aantal kuikens. Dit vormt de basis voor de berekening van de dagelijkse overlevingskans van de kuikens, waarmee uiteindelijk de kuikenoverleving als geheel wordt uitgerekend.
2. Een fictief voorbeeld
De berekening van de kuikenoverleving is het makkelijkst uit de leggen aan de hand van een (fictief) voorbeeld. In dit fictieve voorbeeld gebruiken we een hele kleine dataset van vier gezinnen die bruikbaar zijn voor de berekeningen. De gegevens zijn samengevat in tabel 1.
Tabel 1. Fictief voorbeeld van waarnemingen binnen het eendenkuikenproject.
Gezin ID |
Datum |
Locatie |
Soort |
Aantal kuikens |
Leeftijd kuikens |
Gezin_1 |
15-04-2022 |
Amsterdam |
Wilde Eend |
10 |
A |
Gezin_1 |
20-04-2022 |
Amsterdam |
Wilde Eend |
2 |
B |
Gezin_2 |
19-04-2022 |
Den Haag |
Soepeend |
12 |
A |
Gezin_2 |
23-04-2022 |
Den Haag |
Soepeend |
8 |
A |
Gezin_3 |
02-05-2022 |
Amersfoort |
Wilde Eend |
8 |
A |
Gezin_3 |
06-05-2022 |
Amersfoort |
Wilde Eend |
4 |
B |
Gezin_3 |
14-05-2022 |
Amersfoort |
Wilde Eend |
2 |
C |
Gezin_4 |
09-05-2022 |
Groningen |
Wilde Eend |
9 |
A |
Gezin_4 |
15-05-2022 |
Groningen |
Wilde Eend |
5 |
B |
Gezin_5 |
12-05-2022 |
Utrecht |
Wilde Eend |
2 |
D |
3. Leeftijd kuikens
In het fictieve voorbeeld (tabel 1) is de leeftijd van de kuikens weergegeven in categorieën. Waarnemers worden namelijk gevraagd de leeftijd van de kuikens in te schatten in categorieën van weken door te geven, naar voorbeeld van geschetste plaatjes van verschillende leeftijden van eendenkuikens die in gevangenschap zijn uitgebroed (figuur 1).
Figuur 1. Voorbeeldplaatjes van kuikenleeftijden (bron: Cordonnier & Fournier 1983).
De voorbeeldplaatjes uit figuur 1 laten de leeftijd van eendenkuikens zien in categorieën A t/m H. In de praktijk komt het erop neer dat elke categorie een leeftijdsklasse van een week representeert, dus A is 0-1 week, B is 1-2 weken, enzovoorts. Voor de berekeningen wordt dit omgezet naar een benadering van de leeftijd in dagen (A is 3 dagen, B is 10 dagen, enzovoorts). In het geval dat in het opmerkingenveld bij een waarneming de leeftijd nader is toegelicht, wordt deze leeftijd overgenomen (bijvoorbeeld als erbij staat dat de kuikens op de dag van de waarneming het nest hebben verlaten). Als er bij de waarneming een foto wordt geüpload, wordt de leeftijd soms op basis hiervan nog aangepast.
4. Benaderen van kuikenoverleving
Op basis van alle kuikenwaarnemingen op een hoop (dus niet alleen series van waarnemingen, maar ook ‘losse’ waarnemingen) zijn twee voor de hand liggende benaderingen mogelijk om een indicatie te krijgen voor kuikenoverleving. Je kunt namelijk eenvoudig bepalen wat het aantal waarnemingen per leeftijdsklasse is, of het gemiddelde aantal kuikens per leeftijdsklasse uitrekenen (tabel 2). Hieruit komt in beide gevallen een duidelijk beeld naar voren: het aantal kuikens neemt snel af in de vroege kuikenfase.
Tabel 2. Samenvatting van kuikengegevens per leeftijdsklasse op basis van fictief voorbeeld.
Leeftijdscategorie |
Aantal waarnemingen |
Gemiddeld aantal kuikens |
A. 0-1 week |
5 |
9.4 |
B. 1-2 weken |
2 |
3.7 |
C. 2-3 weken |
1 |
2 |
D. 3-4 weken |
1 |
2 |
E. 4-5 weken |
0 |
n.v.t. |
Figuur 2. Grafieken van het aantal kuikenwaarnemingen per leeftijdsklasse (links) en het gemiddelde aantal kuikens in een gezin per leeftijdsklasse (rechts) op basis van het fictieve voorbeeld uit tabel 1.
Aan deze beide benaderingen kleeft echter een groot nadeel. De bepaling van het aantal waarnemingen per leeftijdsklasse zorgt voor een onderschatting van de werkelijke kuikenoverleving. Natuurlijk is het zo dat als alle kuikens van een gezin dood zijn, deze niet meer gemeld wordt, en daarom het aantal waarnemingen in oudere leeftijdsklassen lager is. Echter, er is ook sprake van een ‘observer bias’, namelijk dat waarnemers sneller geneigd zijn om jonge kuikens te melden dan oudere kuikens. Er zijn dus minder waarnemingen van kuikens in oudere leeftijdsklassen dan je op basis van hun aanwezigheid zou verwachten. De benadering op basis van het gemiddelde aantal kuikens per leeftijdsklasse daarentegen werkt juist overschatting van de werkelijke kuikenoverleving in de hand. Misschien wel het grootste methodologische probleem van het eendenkuikenproject is namelijk dat 0-waarnemingen niet worden gemeld. Met andere woorden: vrouwtjes zonder kuikens (die al hun kuikens kwijt zijn) worden niet als gezin gemeld. Door deze nullen niet mee te nemen in de berekening van het gemiddelde aantal kuikens, komt het gemiddelde (veel) te hoog uit. Als je op basis daarvan de overlevingskansen zou uitrekenen, zou je deze dus overschatten.
Het probleem van het ontbreken van 0-waarnemingen is met de huidige dataset niet (of lastig) op te lossen, maar er is wel een methode om de werkelijke kuikenoverleving nauwkeuriger te benaderen. Dit wordt gedaan aan de hand van series van waarnemingen van hetzelfde gezin, dus met de zogenaamde vervolgwaarnemingen.
5. Vervolgwaarnemingen
Uit de losse waarnemingen worden de waarnemingen gefilterd van gezinnen die meer dan één keer zijn gemeld. Uit het fictieve voorbeeld in tabel 1 heeft alleen gezin 5 maar één waarneming, dus deze wordt in de berekening van de kuikenoverleving buiten beschouwing gelaten. De vervolgwaarnemingen worden verwerkt tot een dataset met paren van opeenvolgende waarnemingen van hetzelfde gezin (tabel 3). Hiermee wordt uitgerekend hoeveel tijd er zat tussen de opeenvolgende waarnemingen en hoeveel kuikens er in die periode verdwenen zijn (figuur 3).
Tabel 3. Samenvatting van vervolgwaarnemingen.
Gezin ID |
Leeftijd kuikens start |
Leeftijd kuikens eind |
Dagen tussen waarnemingen |
Aantal kuikens start |
Aantal kuikens eind |
Verschil in aantal kuikens |
Gezin_1 |
3 |
8 |
5 |
10 |
2 |
8 |
Gezin_2 |
1 |
5 |
4 |
12 |
8 |
4 |
Gezin_3 |
3 |
7 |
4 |
8 |
4 |
4 |
Gezin_3 |
7 |
15 |
8 |
4 |
2 |
2 |
Gezin_4 |
3 |
9 |
6 |
9 |
5 |
4 |
Figuur 3. Samenvatting van de vervolgwaarnemingen met links de afname van het aantal kuikens uitgezet tegen het aantal dagen tussen de opeenvolgende waarnemingen, en rechts de afname van het aantal kuikens uitgezet tegen de leeftijd van de kuikens.
6. Dagelijkse overlevingskans
De meest accurate bepaling van kuikenoverleving krijg je door het volgen van gezinnen vanaf het moment dat de kuikens uit het ei komen en het moment dat de kuikens of wel vliegvlug, ofwel allemaal dood zijn. Helaas is dat praktisch onmogelijk, zeker binnen een citizen science project. Wat we wel hebben, zijn als het ware ‘snapshots’ van een X aantal dagen uit de kuikenfase van een (idealiter groot) aantal eendengezinnen. Deze snapshots op basis van opeenvolgende waarnemingen van hetzelfde eendengezin laten zien hoeveel kuikens er verdwenen binnen een bepaald aantal dagen. Hiermee kunnen we de dagelijkse overlevingskans van de kuikens berekenen. De dagelijkse overlevingskans is de kans dat een kuiken een dag later nog in leven is. Binnen het broedbiologisch onderzoek bij vogels is er al veel ervaring met de berekening van dagelijkse overlevingskansen, vooral als het gaat om nestoverleving. Een veelgebruikte methode daarbij is de Mayfield methode. Het elegante aan deze methode is dat hij rekenkundig vrij eenvoudig en recht-toe-rechtaan is. Binnen het eendenkuikenproject passen we de principes van de Mayfield-methode toe op kuikens in plaats van nesten.
7. Mayfield-methode beknopt uitgelegd
De Mayfield-methode voor berekening van nestsucces is ontwikkeld, omdat het uitrekenen van simpelweg het percentage nesten dat succesvol uitkomt (de “klassieke methode”) een overschatting geeft van het werkelijke nestsucces. Dit komt omdat je de nesten normaal gesproken niet volgt vanaf het moment dat de eieren gelegd zijn, dus dat je vroeg nestverlies mist. Dit lijkt dus veel op het probleem met het berekenen van de kuikenoverleving. In plaats van een percentage uitgekomen nesten berekent de Mayfield-methode de dagelijkse overlevingskans.
In een goed leesbaar Nederlandstalig artikel in Limosa legt Albert Beintema uit laagdrempelig hoe de Mayfield-methode werkt (Beintema 1992). Ik vat het hier beknopt samen. De methode gaat uit van nesten die worden gevolgd, met andere woorden nesten die minstens twee keer zijn bezocht. Elke dag dat een nest gevolgd wordt is een ‘nestdag’. De nestdagen van alle nesten kun je bij elkaar optellen, dus als je 10 nesten gedurende 10 dagen volgt, kom je uit op 100 nestdagen. Als na 10 dagen twee nesten verloren blijken, dan neem je aan dat deze halverwege de periode verloren zijn gegaan (“mid-point assumption”), dus na vijf dagen. De dag waarop een nest verloren is gegaan, telt niet mee, dus van de vijf dagen zijn er vier overleefd. Je komt dan dus uit op 8*10 + 2*4 = 88 nestdagen.
Om de dagelijkse overlevingskans uit te rekenen, deel je het aantal nestdagen door het aantal nestdagen plus het aantal verloren gegane nesten. In bovenstaand voorbeeld zou de dagelijkse overlevingskans dus 88 / 90 = 97.8% zijn. Om van de dagelijkse overlevingskans te komen tot de overleving van de totale nestperiode, verhef je de dagelijkse overlevingskans tot de macht gelijk aan het aantal dagen dag een legsel moet liggen om uit te komen. Bij de Wilde Eend duurt die periode ongeveer 28 dagen plus een extra dag voor elk ei dat is gelegd (dus 38 dagen als er 10 eieren zijn gelegd). Het nestsucces volgens Mayfield is in dat geval 0.97838 = 0.429, dus 42,9%.
Tabel 4. Bepaling van het aantal overleefde kuikendagen.
Gezin ID |
Dagen tussen waarnemingen (duur interval) |
“mid-point” leeftijd |
Aantal kuikens start |
Aantal kuikens eind |
Aantal verdwenen kuikens |
Overleefde kuikendagen |
Gezin_1 |
5 |
5.5 |
10 |
2 |
8 |
22 |
Gezin_2 |
4 |
3 |
12 |
8 |
4 |
36 |
Gezin_3 |
4 |
5 |
8 |
4 |
4 |
20 |
Gezin_3 |
8 |
11 |
4 |
2 |
2 |
22 |
Gezin_4 |
6 |
6 |
9 |
5 |
4 |
38 |
8. Kuikenoverleving volgens Mayfield
In het eendenkuikenproject passen we de principes van de Mayfield-methode toe op de kuikens. We doen voor de berekening net alsof de kuikens nesten zijn. Eigenlijk is dat niet correct, omdat de overleving van kuikens binnen een gezin niet onafhankelijk is. We berekenen daarom per vervolgwaarneming het totaal aantal (overleefde) kuikendagen binnen een gezin en het aantal verloren gegane kuikens (tabel 4), net als wanneer je nestsucces voor een gebied met meerdere nesten zou uitrekenen.
Voor het aantal kuikendagen tussen twee opeenvolgende waarnemingen van een eendengezin tellen we het aantal dagen tussen de waarnemingen en vermenigvuldigen we dat met het aantal kuikens dat de periode heeft overleefd. Daarbij tellen we op het aantal kuikendagen van de kuikens die het niet overleefd hebben, wederom uitgaande van de “mid-point assumption” dat de kuikens halverwege het interval zijn doodgegaan. Voor gezin_1 uit tabel 1 geldt dat er vijf dagen tussen de waarnemingen zat en dat 2 van de 10 kuikens die periode overleefd hebben. Het aantal kuikendagen voor de overleefde kuikens is dus 2 * 5 = 10 dagen. Voor de acht niet overleefde kuikens gaan we ervanuit dat ze nog 2.5 – 1 = 1.5 dagen overleefd hebben. Voor deze kuikens komen we dus uit op 8 * 1.5 = 12 dagen. Samen komen we voor dit gezin uit op 10 + 12 = 22 kuikendagen en acht verloren gegane kuikens. Als we de dagelijkse overlevingskans van kuikens uit dit gezin zouden uitrekenen, is de berekening 22 / (22+8) = 0.733 = 73.3%.
We kunnen controleren of deze berekening in de buurt komt van de werkelijkheid (de waarneming) door uit te rekenen hoeveel kuikens we na vijf dagen zouden overhouden als we beginnen met 10 kuikens en een dagelijkse overlevingskans aanhouden van 73.3%. De berekening is 10 * 0.733^5 = 2.1 kuikens. Dit komt goed in de buurt van onze twee waargenomen kuikens. Figuur 4 geeft weer hoe het verloop van het aantal kuikens van gezin_1 in theorie kan zijn geweest.
Figuur 4. Verloop van het aantal kuikens van gezin_1 uit het fictieve voorbeeld in tabel 1 op basis van de berekende dagelijkse overlevingskans.
9. Kuikenoverleving in een Generalized Linear Model
Misschien wel het grootste verschil tussen nestoverleving en kuikenoverleving is dat de overleving van kuikens afhankelijk is van de leeftijd van de kuikens. In het geval van nesten zal het weinig uitmaken of een predator op dag 1 of op dag 20 langskomt; de eieren hebben ongeveer net zoveel kans om opgegeten te worden. Voor kuikens is dat een ander verhaal: ze worden steeds groter en minder naïef, waardoor de kans om opgegeten te worden (of onderkoeld te raken, te verdwalen, etc.) kleiner wordt naarmate ze ouder worden. Waar voor nesten wordt verondersteld dat de dagelijkse overlevingskans constant is, neemt deze voor kuikens toe met de leeftijd (zie ook figuur 3). We moeten dus de dagelijkse overlevingskans kunnen berekenen per leeftijd (per dag) van de kuikens. Hiervoor gebruiken we een logistische regressie (een specifiek type Generalized Linear Model, afgekort glm) met leeftijd als verklarende variabele.
De syntax (code) in het statistiekprogramma R voor deze logistische regressie ziet er als volgt uit:
model <- glm(cbind(successes, failures) ~ kuikenleeftijd, family = binomial(link="logit"))
Hierbij zijn de “successes” het aantal overleefde kuikendagen per interval en “failures” het aantal niet-overleefde kuikendagen per interval, ofwel het aantal kuikens dat het niet heeft overleefd. Voor de kuikenleeftijd moet je een keuze maken, omdat de intervallen tussen de opeenvolgende waarnemingen van eendengezinnen een uiteenlopende duur hebben. Je zou de begin- of eindleeftijd kunnen nemen van elk interval, maar ook hierbij lijkt de “mid-point assumption” de beste keuze. We nemen dus aan dat de geschatte dagelijkse overleving het beste past bij kuikens van de gemiddelde leeftijd van het interval.
Figuur 5. De gemodelleerde dagelijkse overlevingskans per leeftijd van de gezinnen uit het fictieve voorbeeld op basis van de logistische regressie. De zwarte lijn geeft de overlevingskans weer uitgaande van de gemiddelde leeftijd per interval (“mid-point assumption”). De rode en blauwe stippellijn geeft de dagelijkse overlevingskans weer als voor leeftijd respectievelijke de start- en eindleeftijd van een interval worden genomen.
10. Van dagelijkse overlevingskans naar kuikenoverleving
Net als de Mayfield-methode geeft de logistische regressie een schatting van de dagelijkse overlevingskans. Deze is bij de Mayfield-methode constant, dus hierbij kun je de overleving van een periode van X dagen berekenen door de dagelijkse overlevingskans te verheffen tot de macht X. Bij kuikens loopt de dagelijkse overlevingskans op naarmate ze ouder worden. Hiervoor zou je dus de dagelijkse overlevingskansen voor de gehele kuikenperiode met elkaar moeten vermenigvuldigen om de overlevingskans van de gehele kuikenperiode (tot vliegvlug) te krijgen.
Het fictieve voorbeeld blijkt per toeval van een kleine zeer onfortuinlijke populatie: de kuikensterfte is wel erg hoog en de dagelijkse overlevingskansen dus laag. Het product van de gemodelleerde dagelijkse overlevingskansen in de eerste acht weken (ongeveer de periode voordat eendenkuikens kunnen vliegen) levert een kuikenoverleving van een magere 1.7% op. Daarbij moet gezegd worden dat in het voorbeeld geen intervallen zaten bij een hogere kuikenleeftijd. De modelvoorspellingen zijn voor hogere leeftijden dus onzekerder. In werkelijkheid ligt de dagelijkse overlevingskans van eendenkuikens dicht bij de 1 (100%) vanaf een leeftijd van ongeveer drie weken.
In figuur 5 staan ook de gemodelleerde overlevingskansen weergegeven wanner in de logistische regressie de leeftijd aan de start of het einde van ieder interval wordt genomen als kuikenleeftijd. Wanneer de startleeftijd wordt gebruikt, wordt de dagelijkse overleving binnen een interval geprojecteerd op een lagere leeftijd, dus dit leidt tot hogere inschatting van de overlevingskansen. Andersom leidt het tot een lagere inschatting van de kuikenoverleving als de overlevingskansen worden gekoppeld aan de maximale leeftijd in het interval. Ter illustratie: in het fictieve voorbeeld hebben kuikens bij een “mid-point assumption” van leeftijd in het interval een kans van 33.1% om een week oud te worden. Als de startleeftijd per interval wordt genomen, komen de berekeningen uit op een kans van 36.6% en als de eindleeftijd per interval wordt genomen op 29.7%. De werkelijkheid (van dit fictieve voorbeeld) zal waarschijnlijk ergens tussen deze schattingen liggen.
11. Uitbreiding van statistisch model
Het werken met regressiemodellen geeft een grote flexibiliteit als het gaat om uitbreiding en verbetering van de schattingen (indien er voldoende gegevens zijn!). In het fictieve voorbeeld zitten met opzet twee problemen die met uitbreiding van het regressiemodel zijn op te lossen (nogmaals, indien er voldoende gegevens zijn, minstens enkele honderden waarnemingen). We bespreken deze problemen hier dus slechts ter illustratie.
- Pseudoreplicatie: het regressiemodel gaat ervanuit dat de waarnemingen onafhankelijk van elkaar zijn. Dat zou je kunnen aannemen als je van elk gevolgd gezin één vervolgwaarneming (interval) hebt in de dataset. In dit voorbeeld zie je echter dat van gezin_3 twee vervolgwaarnemingen zijn gedaan, dus twee intervallen zijn. Deze waarnemingen zijn dus niet onafhankelijk en daarvoor zou je idealiter willen corrigeren. Je kunt dit doen door de ID van het gezin aan het model toe te voegen als ‘random factor’. Je krijgt dan een Generalized Linear Mixed-effects Model (glmm).
- Verschil tussen soorten: in het eendenkuikenproject worden waarnemingen verzameld van Wilde Eenden, Soepeenden en Krakeenden. Dit onderscheid wordt gemaakt omdat de hypothese is dat deze ‘soorten’ (Soepeend is niet echt een soort, maar we noemen het voor het gemak toch even zo) verschillen in kuikenoverleving. In het fictieve voorbeeld zien we dat gezin_2 een Soepeend betreft en deze zou je mogelijk niet op één hoop willen gooien met de waarnemingen van Wilde Eenden. In de analyses zou je “soort” als cofactor kunnen meenemen in het regressiemodel (apart of in interactie met leeftijd).
Tot slot zou je op dezelfde manier het regressiemodel kunnen uitbreiden met andere factoren waarin je geïnteresseerd bent. Zo zou je kunnen testen of er een effect is van (of verschillen tussen) gebieden, habitattypen, jaren, etc. Een aandachtspunt is dat hiermee de dataset steeds verder wordt ‘opgeknipt’ en daarmee neemt de statistische zeggingskracht af. Dergelijke verdiepende analyses zijn dus alleen zinvol bij een grote dataset en een goede steekproef uit alle groepen waartussen je onderscheid wilt maken.
12. Disclaimer
De hier beschreven methode voor het berekenen van de kuikenoverleving is een grove, recht-toe-rechtaan methode en ongetwijfeld niet de beste of meest verfijnde. Ik nodig de kritische lezer graag uit om verbeteringen van deze methode of ideeën voor alternatieve methodes aan te dragen.
Daarnaast geldt dat de statistische methodiek nooit beter wordt dan de kwaliteit van de basisgegevens uit het veld. Het eendenkuikenproject heeft vanwege zijn opzet voor de hand liggende tekortkomingen, waarvan het hierboven genoemde ontbreken van 0-waarnemingen er slechts één is. Daar staat tegenover dat dankzij de opzet als citizen science project inmiddels duizenden waarnemingen beschikbaar zijn voor analyses, wat de robuustheid van de schattingen ten goede komt. Deze schattingen van kuikenoverleving zijn de eerste en nog steeds enige die beschikbaar zijn voor Nederlandse populaties van Wilde Eend, Soepeend en Krakeend. Er zijn concrete plannen om dit project in de toekomst uit te breiden naar een bredere set (water)vogels met kuikens die snel het nest verlaten (nestvlieders). Houd hiervoor het eendenkuikenproject en de KuikenTeller app in de gaten.