Lineáris regresszió
Szombat délelőtt Penny Sellmore a kávéját kortyolgatva a teraszon a családi fotókat nézegeti a táblagépén, amikor csörög a Teams. Susan Lee, a finance director hívja és hadarva közli:
“Penny, a vezetőség szeretné látni, hogy minden plusz 1 000 dolláros hirdetési költés mennyi extra bevételt hoz – 10%-kal magasabb profitot kell látnunk a következő negyedévben. Mik a számaid?”
Penny gyorsan leteszi a lattéját, és máris megnyitja a bevétel vs. költés táblázatot. „Lineáris regresszió, az a legegyszerűbb” – gondolja. Percek alatt kiszámolja, hogy minden 1 000 $ költés átlagosan 6 500 $-t hoz vissza. A CFO így igazíthatja a büdzsét és teljesítheti a profitcélokat.
Nézzük, hogyan működik a lineáris regresszió, és miért praktikus marketing-pénzügy együttműködésben.
0. Mi az a lineáris regresszió?
Olyan statisztikai módszer, amellyel két (vagy több) változó közötti lineáris kapcsolatot becsülsz meg, és előrejelzéseket készítesz.
1. Miért jó?
Egyszerű és könnyen értelmezhető kapcsolatot ad a bemeneti és kimeneti változók között. Ok-okozati kapcsolat becslése: “spend → revenue”
Gyorsan kiszámolható nagy adatmennyiséggel is (OLS zárt alakú megoldás).
Alapja sok fejlettebb modellnek (ridge, lasso, GLM).
Könnyen kommunikálható üzleti döntéshozók felé: egy-egy wᵢ koefficiens megmutatja, mekkora hatást gyakorol Xᵢ egy egységnyi változása Y-ra.
Gyors Excel megoldás: Data Analysis Toolpak
2. Hogyan számítható?
Modell:
Y = w0 + w1*X1 + w2*X2 + … + wn*Xn + ε
Cél: minimalizálni a négyzetes eltérések összegét (SSE):
SSE = Σ (yi – ŷi)²
Értékelés:
R² = 1 – (SSR / SST)
3. Mikor használd?
Ha változóink között közel lineáris kapcsolatot feltételezünk.
Gyors prototípus-készítéshez, adatfeltáráshoz.
Ha fontos, hogy lássuk: egy-egy Xᵢ változás mekkora elmozdulást okoz Y-ban.
Előrejelzésre, trend modellezésre, költség-hatékonyság elemzésre.
4. Marketing-példák
Ár-elaszticitás: mennyivel csökken a forgalom 1 000 Ft áremelés hatására?
Kampány-spend vs. bevétel: havi hirdetési költés regressziója a bevételre.
CLTV előrejelzés: ügyfél-érték regressziója RFM-score-okra.
Promóciós hatékonyság: kuponköltség, e-mail-költség és display-költség hatása a konverziókra.
Média-mix modellezésnél
5. Case Study: havi kampányköltség és bevétel
Adatok (12 hónap)
Modell felírása:
PredictedRevenue = w0 + w1 * Spend
Excel-ben (Data Analysis → Regression):
w0 (intercept) ≈ 200
w1 (slope) ≈ 6.0
R² ≈ 0.80
Értelmezés:
Minden 1 000 Ft hirdetési költés ≈ 6 000 Ft többletbevételt hoz.
A modell az adatok 80%-át magyarázza.
Üzleti következtetés:
Ha 4× ROI-t célzunk, 1 000 Ft-ig érdemes hirdetni (6 000/4).
6. Mikor ne használd?
Ha a kapcsolat a bemenetek és kimenet között nem lineáris (erősen görbült, lépcsős mintázat).
Ha a hibák nem normális eloszlásúak, vagy heteroszkedasztikusak (változó szórás).
Ha a kimenő változó kategóriális (pl. igen/nem), nem folyamatos.
Ha sok a multikollinearitás az X-ek között (XᵀX nem invertálható).
7. Milyen üzleti kérdésekre adhat választ?
A pénzügyi igazgató arra kíváncsi, mekkora többletbevétel jön, ha 1 000 Ft-tal megemeljük a hirdetési költést – hogyan mutatjuk ki?
A sales vezető szeretné tudni, mekkora mozgást eredményez egy egységnyi árkedvezmény a forgalomban – hogyan válaszolunk?
Ha a CLTV-t (ügyfél-érték) RFM-pontszámok alapján becsüljük meg, mennyire lesz stabil ez a tipp?
A kampánytervezéshez mennyi célt érdemes kitűzni hónap végéig a jelenlegi költéssel – mit mond a regresszió?
Az IT azt kérdezi, be lehessen-e építeni egy dummy-szezonális hatást (pl. Black Friday) a bevétel-előrejelzésbe – hogyan tennénk?