De verjaardagsparadox is in feite geen echte paradox. Er is namelijk geen tegenspraak tussen stellingen of axioma's die er aan ten grondslag liggen, noch is het een onoplosbaar probleem. Het wordt slechts een paradox genoemd omdat de resultaten ervan tegen de intuïtie ingaan. Tenminste, de intuïtie van iemand voor wie kansberekening geen tweede natuur is geworden. Intuïtie bij dieren, inclusief ons, is bedoeld om snel beslissingen te kunnen nemen bij gebrekkige informatie. Het is gericht op wat meestal resultaat boekt. Wanneer het echter aankomt op zaken die effectief berekend moeten worden is intuïtie vaak niet erg accuraat, of zelfs ronduit verkeerd. Dit is wat er voor zorgt dat mensen bij gokken almaar meer geld verliezen tegenover een partij die de kansen wel kent (zoals een casino) en er voor zorgt dat die in z'n voordeel zijn.@Snakke schreef:Ik weet niet of dit topic nog openstaat voor suggesties, maar ik zou wel eens het verjaardagsparadox uitgelegd willen krijgen.
Aangezien er niet zolang geleden 3 personen jarig waren wil ik wel eens weten wat de kans is dat er over een jaar (als we veronderstellen dat het forum een even grote groei heeft) iemand is die als vierde op die dag jarig is.
Of met hoeveel leden het forum moet zijn zodat de kans 50% is dat er op elke dag twee mensen verjaren.
Bij de verjaardagsparadox bestaat die intuïtieve faux pas uit de inschatting dat in een groep mensen van bepaalde grootte er geen twee zitten met dezelfde verjaardag, of juist wel (minstens) twee met dezelfde verjaardag. Meer specifiek, voor getallen veel lager dan het aantal dagen in een jaar schatten de meeste mensen de kans op geen twee gedeelde verjaardagen veel te hoog in, en omgekeerd de kans op minstens twee gedeelde verjaardagen te laag. In wat volgt gaan we voor het gemak schrikkeljaren negeren, alsook de distributie van geboortedagen doorheen het kalenderjaar. Niet elke dag heeft namelijk dezelfde kans op geboortes, er zijn fluctuaties op basis van zaken als seizoenen, cultuur en verscheidene gebeurtenissen. We gaan er eenvoudigweg van uit dat voor een willekeurige dag de kans dat je daarop verjaart 1/365 is.
Stel dat je een kamer hebt met 20 willekeurig gekozen personen in. Wat is nu de kans dat elke persoon een unieke datum in het jaar heeft waarop deze verjaart? Dus, geen twee personen in de kamer met dezelfde verjaardag? Doorgaans wordt deze kans veel te hoog ingeschat. De redenering die mensen volgen is dat er 365 dagen in een jaar zijn, en slechts 20 personen in deze kamer. Er zijn maximaal 20 verschillende verjaardagen. Met 345 lege dagen moet de kans dat er twee dezelfde hebben toch wel aan de lage kant zijn?
In realiteit is de kans dat er geen twee personen in de kamer zijn met dezelfde verjaardag ongeveer 58,86% ofwel 0,5886 in decimale notatie (die we vanaf nu vaker gebruiken). De kans dat er minstens twee personen zijn met een dezelfde verjaardag is 41,14% ofwel 0,4114.
Voor 23 personen is de kans dat er geen twee dezelfde verjaardagen zijn reeds minder dan 1/2.
Bij 40 personen is de kans nog slechts 0,1088 (10,88%).
Hoe berekenen we dit nu? Bij kansberekening is een belangrijk principe dat wanneer we twee of meer mutueel exclusieve situaties hebben, de som van de kans op elke situatie 1 wordt (100%). Stel dat we een munt opwerpen. De twee uitkomsten zijn kop of munt. Als we aannemen dat beide 0,5 kans hebben zie je dat de som 0,5 is. Kop en munt zijn mutueel exclusief. Je zou ook kunnen stellen dat de kans dat het kop is en de kans dat het niet kop is 1 moet zijn. Wat als er een 1/1000 kans is dat de munt op z'n kant blijft staan? Dan wordt dat gewoon een derde situatie. De kans op kop/munt neemt lichtjes af, maar de som kop + munt + kant blijft 1.
Laten we n personen kiezen. Stel n = 1. De kans op een gedeelde verjaardag is 0, want er is maar 1 persoon. De kans op geen gedeelde verjaardag is dus 1.
Stel n = 2. De eerste persoon heeft een specifieke verjaardag. De kans dat de tweede persoon dezelfde verjaardag heeft is 1/365 (~= 0,0027 ofwel 0,27%), want er zijn 365 dagen om uit te kiezen maar slechts eentje komt overeen met die van de eerste persoon. De kans op geen gedeelde verjaardag is dus 1 - 1/365 (~= 0,9973 ofwel 99,73%).
Voor hogere waarden van 2 wordt het echter lastig. Voor n = 4 bijvoorbeeld moeten we berekenen wat de kans is dat er 2 personen dezelfde verjaardag hebben, de kans dat 3 personen dezelfde verjaardag hebben en de kans dat ze alle 4 dezelfde verjaardag hebben. De som van die kansen is die dat er minstens een gedeelde verjaardag is. Zelfs die deelproblemen worden lastig, omdat bijvoorbeeld van de 4 er 2 paren kunnen zijn met dezelfde verjaardag (bv. 2 op 10 februari en de 2 andere op 17 oktober). Als voor n personen de kans dat er x dezelfde verjaardag hebben wordt uitgedrukt als K(x), dan is de kans dat er minstens 2 met dezelfde verjaardag zijn gelijk aan K(2) + K(3) + ... + K(n).
Dat wordt een hoop rekenwerk. Gelukkig kunnen we beroep doen op de mutueel exclusieve situaties. Het is gemakkelijker om te berekenen wat de kans is dat niemand dezelfde verjaardag heeft. Dat is K(1). En we weten dat de som K(1) + K(2) + ... + K(n) gelijk moet zijn aan 1.
Dus:
1 = K(1) + K(2) + ... + K(n)
Als we willen weten wat K(2) + K(3) + ... + K(n) is (de kans om minstens 2 gedeelde verjaardagen) doen we gewoon
1 - K(1) = K(2) + K(3) + ... + K(n)
Hoe berekenen we wat de kans is dat niemand dezelfde verjaardag heeft? Als we n personen hebben...
Dan kiezen we de eerste persoon. Deze heeft een bepaalde verjaardag. De kans op geen gedeelde verjaardag is 1, ofwel 365/365.
We kiezen een tweede persoon. De kans dat deze niet dezelfde verjaardag heeft is 364/365. Er zijn namelijk 364 dagen te kiezen die niet samenvallen met de eerste.
We kiezen een derde persoon. De kans dat deze niet dezelfde verjaardag heeft is 363/365. Er zijn namelijk 363 dagen te kiezen die niet samenvallen met de eerste twee.
Enzovoort.
De kans dat we voor n personen geen gedeelde verjaardag hebben is de vermenigvuldiging van die reeks. Dus:
(365/365) * (354/365) * (363/365) * ... * ((365-n+1)/365)
Merk op dat vanaf n > 365 de kans effectief 0 is. Dit is het pigeonhole principe. Als je 20 duivenhokken hebt kan je er niet meer dan 20 duiven inpassen zonder er minstens 2 in hetzelfde hok te moeten steken.
De bovenstaande reeks kan worden uitgedrukt als:
(365!/(365-n)!) / (365^n)
! is de faculteitsoperator, ^ de machtsverheffing.
- Spoiler:
- k!/(k-n)! is een makkelijke manier om de vermenigvuldiging k * (k-1) * (k-2) * ... * (k-n) te berekenen of noteren. Dit is dus de 365 * 364 * ... * (365-n). De 365 tot de macht n zijn de delers van bovenstaande reeks die vermenigvuldig worden, voor n personen.
Als je wilt weten wat de kans is op minstens 2 personen met dezelfde verjaardag, doe je gewoon 1 min bovenstaande formule.
Laten we een plot bekijken van de kans op geen gedeelde verjaardagen in functie van n:
http://www.wolframalpha.com/input/?i=%28365!%2F%28365-n%29!%29%2F%28365^n%29%2C+n+in+[1%2C365]
Omgekeerd, een plot van de kans op minstens 2 gedeelde verjaardagen in functie van n:
http://www.wolframalpha.com/input/?i=1+-+%28365!%2F%28365-n%29!%29%2F%28365^n%29%2C+n+in+[1%2C365]
Het tegenintuïtieve volgt uit twee zaken. Ten eerste, de plots zijn niet lineair. Ten tweede, ze dalen respectievelijk stijgen pijlsnel bij reeds lage aantallen voor ze uitvlakken. Deze link zou een plot moeten tonen die inzoomt op een kleiner interval van 1 tot 40:
http://www.wolframalpha.com/input/?i=birthday+problem+20+people
Je kan overigens aan WolframAlpha vragen om het voor gelijk welk aantal mensen te berekenen.
Gerelateerd aan je vraag: we zijn nu bijna een jaar later en er zijn 298 geregistreerde leden. De kans dat er op een willekeurig gekozen dag geen enkel lid verjaart is 0,4415 (44,15%). Dit lijkt op zijn beurt misschien tegenintuïtief na het verjaardagsprobleem te hebben bekeken. De berekening hiervan laten als oefening aan de lezer over. En het precieze antwoord op je vraag laat ik over aan iemand die beter is in kansberekening dan ik...
Voor nog een interessant probleem dat zodanig onintuïtief lijkt dat veel mensen de oplossing zelfs niet willen aanvaarden, tot en met een kwade rant van een zekere Scott Smith, Ph.D. aan de universiteit van Florida, moet je zeker eens hier kijken: https://en.wikipedia.org/wiki/Monty_Hall_problem