Binominális eloszlás

Szerda reggel Jennifer Thompson a HR-standup után a kávéautomatánál áll sorba, amikor Karen White, a HR Director futtában odakiált:

Jennifer, szeptemberben legalább 7 új kollégát kell felvennünk, ha 80%-os az ajánlat elfogadási rátánk. Hány jelöltet hívjunk be?”

Jennifer a kávét letéve a binomiális képlethez nyúl, kiszámolja, hogy 12 behívott jelölttel van a legnagyobb biztonság a 7 hire eléréséhez. Karen megnyugszik, és nem aggódik többé a toborzási csúszás miatt.

Nézzük, mi a binominális disztribúció, és hogyan segít a HR-ben és a marketingben.

0. Mi a franc az a binominális eloszlás?

Diszkrét eloszlás ismétlődő független siker/sikertelenség kísérletek számára, paraméterei n (kísérletek) és p (siker).

1. Miért jó?

  • Egyszerű modell: két lehetséges kimenet (siker vs. sikertelenség) ismétlődő kísérleteire ad egyértelmű keretet.

  • Értelmezhető paraméterek: n (kísérletek száma) és p (siker valószínűsége) közvetlenül meghatározhatók.

  • Számítható képlettel: zárt formájú összefüggés, nem kell nagy mintákat szimulálni.

  • Alapmodell: sok komplexebb valószínűségi modell épít erre az egyszerű szerkezetre.

2. Hogyan számítható?

  • Paraméterek:

    • n = megismételt kísérletek száma

    • p = siker valószínűsége egy kísérletben

  • Valószínűség pontosan k sikerre:

    • P(X = k) = C(n, k) * p^k * (1–p)^(n–k)

    • ahol C(n, k) = n! / (k! * (n–k)!)

  • Halmozott eloszlás (max. vagy min. kimenetek):

    • P(X ≤ k) = Σ [i=0→k] C(n, i)*p^i*(1–p)^(n–i)

    • P(X ≥ k) = Σ [i=k→n] …

3. Mikor használd?

  • Bináris események ismétlődő, független kísérleteihez.

  • Konverziós arány becslése marketingben: kattintás, vásárlás, regisztráció.

  • Minőségi ellenőrzés: hibás termékek száma egy minta méretben.

  • A/B-teszt: nyertes verzió sikerarányának statisztikai vizsgálata.

4. Marketing-példák

  • E-mail kampány: ha 1 000 e-mailt küldesz és p=0,2 az átkattintási arány, mi a valószínűsége, hogy 150-200 kattintásod lesz?

  • Hirdetés: 100 megjelenésből p=0,05 kattintási arány, mi az esélye, hogy legalább 10 kattintás legyen?

  • Lead generálás: 50 potenciális ügyfélből p=0,3-es konverzióval hány új ügyfelünk lesz?

5. Case Study: 10 ajánlat és 80 % elfogadás

Feladat: 10 munkavállalónak írt ajánlatból p=0,8-át elfogadják.

  1. n = 10, p = 0,8

  2. P(5–7 elfogadás) = P(5) + P(6) + P(7)

    1. P(5) = C(10,5)*0.8^5*0.2^5 ≈ 0.0264 

    2. P(6) ≈ 0.0881

    3. P(7) ≈ 0.2014

  3. Összesen ≈ 0.316 → 31.6 %

6. Mikor ne használd?

  • Ha kísérletek nem függetlenek (korrelált válaszok).

  • Ha p változik minden kísérletben (pl. tanulási effektus).

  • Ha több kimenet van, nem csak siker/sikertelenség (multinomiális kell).

  • Ha a mintaszám nagyon kicsi és a p szélsőséges (0 vagy 1 felé), instabil lehet a becslés.

7. Milyen üzleti kérdésekre adhat választ.

  • Ha 1 000 e-mailt küldesz p=0,2 átkattintási aránnyal, mekkora az esélye, hogy legalább 150 kattintás lesz?

  • A sales várja, hogy 100 meghívottból 30 jön el – ha p=0,3, hány ember jön meg nagy valószínűséggel?

  • Az A/B tesztnél mekkora a valószínűsége, hogy a B verzióban legalább 5%-kal jobb lesz a konverzió?

  • Ha 10 000 SMS-t küldesz és p=0,05 a válaszarány, mikor lesz az 500 válasz ±10%-on belül van?

  • Hogyan határoznád meg, hány próbát küldj a pilot kampányban, hogy 95%-os konfidenciájű legyen a p=0,1 körüli arányt ±2%-os pontossággal?

Previous
Previous

Exponenciális eloszlás

Next
Next

Normál eloszlás