Binominális eloszlás
Szerda reggel Jennifer Thompson a HR-standup után a kávéautomatánál áll sorba, amikor Karen White, a HR Director futtában odakiált:
“Jennifer, szeptemberben legalább 7 új kollégát kell felvennünk, ha 80%-os az ajánlat elfogadási rátánk. Hány jelöltet hívjunk be?”
Jennifer a kávét letéve a binomiális képlethez nyúl, kiszámolja, hogy 12 behívott jelölttel van a legnagyobb biztonság a 7 hire eléréséhez. Karen megnyugszik, és nem aggódik többé a toborzási csúszás miatt.
Nézzük, mi a binominális disztribúció, és hogyan segít a HR-ben és a marketingben.
0. Mi a franc az a binominális eloszlás?
Diszkrét eloszlás ismétlődő független siker/sikertelenség kísérletek számára, paraméterei n (kísérletek) és p (siker).
1. Miért jó?
Egyszerű modell: két lehetséges kimenet (siker vs. sikertelenség) ismétlődő kísérleteire ad egyértelmű keretet.
Értelmezhető paraméterek: n (kísérletek száma) és p (siker valószínűsége) közvetlenül meghatározhatók.
Számítható képlettel: zárt formájú összefüggés, nem kell nagy mintákat szimulálni.
Alapmodell: sok komplexebb valószínűségi modell épít erre az egyszerű szerkezetre.
2. Hogyan számítható?
Paraméterek:
n = megismételt kísérletek száma
p = siker valószínűsége egy kísérletben
Valószínűség pontosan k sikerre:
P(X = k) = C(n, k) * p^k * (1–p)^(n–k)
ahol C(n, k) = n! / (k! * (n–k)!)
Halmozott eloszlás (max. vagy min. kimenetek):
P(X ≤ k) = Σ [i=0→k] C(n, i)*p^i*(1–p)^(n–i)
P(X ≥ k) = Σ [i=k→n] …
3. Mikor használd?
Bináris események ismétlődő, független kísérleteihez.
Konverziós arány becslése marketingben: kattintás, vásárlás, regisztráció.
Minőségi ellenőrzés: hibás termékek száma egy minta méretben.
A/B-teszt: nyertes verzió sikerarányának statisztikai vizsgálata.
4. Marketing-példák
E-mail kampány: ha 1 000 e-mailt küldesz és p=0,2 az átkattintási arány, mi a valószínűsége, hogy 150-200 kattintásod lesz?
Hirdetés: 100 megjelenésből p=0,05 kattintási arány, mi az esélye, hogy legalább 10 kattintás legyen?
Lead generálás: 50 potenciális ügyfélből p=0,3-es konverzióval hány új ügyfelünk lesz?
5. Case Study: 10 ajánlat és 80 % elfogadás
Feladat: 10 munkavállalónak írt ajánlatból p=0,8-át elfogadják.
n = 10, p = 0,8
P(5–7 elfogadás) = P(5) + P(6) + P(7)
P(5) = C(10,5)*0.8^5*0.2^5 ≈ 0.0264
P(6) ≈ 0.0881
P(7) ≈ 0.2014
Összesen ≈ 0.316 → 31.6 %
6. Mikor ne használd?
Ha kísérletek nem függetlenek (korrelált válaszok).
Ha p változik minden kísérletben (pl. tanulási effektus).
Ha több kimenet van, nem csak siker/sikertelenség (multinomiális kell).
Ha a mintaszám nagyon kicsi és a p szélsőséges (0 vagy 1 felé), instabil lehet a becslés.
7. Milyen üzleti kérdésekre adhat választ.
Ha 1 000 e-mailt küldesz p=0,2 átkattintási aránnyal, mekkora az esélye, hogy legalább 150 kattintás lesz?
A sales várja, hogy 100 meghívottból 30 jön el – ha p=0,3, hány ember jön meg nagy valószínűséggel?
Az A/B tesztnél mekkora a valószínűsége, hogy a B verzióban legalább 5%-kal jobb lesz a konverzió?
Ha 10 000 SMS-t küldesz és p=0,05 a válaszarány, mikor lesz az 500 válasz ±10%-on belül van?
Hogyan határoznád meg, hány próbát küldj a pilot kampányban, hogy 95%-os konfidenciájű legyen a p=0,1 körüli arányt ±2%-os pontossággal?