λ³Έλ¬Έ λ°”λ‘œκ°€κΈ°

Machine Learning

[Machine Learning] Poisson Regression

λ°˜μ‘ν˜•

βœ‹ 포아솑 νšŒκ·€ (Poisson Regression)

πŸ’‘ 포아솑 뢄포 (Poisson distributuon)

 -  μΌμ •ν•œ μ‹œκ°„ λ˜λŠ” 곡간 λ‚΄μ—μ„œ λ°œμƒν•˜λŠ”, μ‚¬κ±΄μ˜ λ°œμƒ νšŸμˆ˜μ— λ”°λ₯Έ ν™•λ₯ μ„ ꡬ할 λ•Œ μ‚¬μš©

 -  λ‹¨μœ„ μ‹œκ°„ μ•ˆμ— μ–΄λ–€ 사건이 λͺ‡ 번 λ°œμƒν•  것인지 ν‘œν˜„ν•˜λŠ” 이산 ν™•λ₯  뢄포

 

βœ”   λ (λžŒλ‹€) = μ •ν•΄μ§„ μ‹œκ°„ μ•ˆμ— μ–΄λ–€ 사건이 일어날 νšŸμˆ˜μ— λŒ€ν•œ κΈ°λŒ€κ°’

βœ”   e  =  μƒμˆ˜κ°’ (2.71828)

 

 

πŸ’‘ 포아솑 νšŒκ·€ (Poisson Regression)

μ’…μ†λ³€μˆ˜(dependent variable)κ°€ 포아솑 뢄포λ₯Ό λ”°λ₯Έλ‹€κ³  κ°€μ •ν•˜κ³ , μΌλ°˜ν™” μ„ ν˜•λͺ¨λΈμ˜ νšŒκ·€λΆ„μ„ μˆ˜ν–‰

μ’…μ†λ³€μˆ˜κ°€ κ°€μ‚°μžλ£Œ(count data)일 λ•Œ 주둜 μ‚¬μš©

-  포아솑 λΆ„ν¬μ˜ νŠΉμ„±μƒ 평균과 뢄산이 κ°™μ•„μ•Ό ν•œλ‹€λŠ” μ œμ•½μ‘°κ±΄ 있음

But, ν˜„μ‹€ λ°μ΄ν„°μ—μ„œλŠ” 평균과 λΆ„μ‚°μ˜ 차이가 크게 λ‚˜νƒ€λ‚˜λŠ” κ²½μš°κ°€ 많기 λ•Œλ¬Έμ—,

   ν¬μ•„솑 νšŒκ·€λͺ¨ν˜•을 μ μš©ν•˜λ©΄ νšŒκ·€κ³„μˆ˜ μΆ”μ •λŸ‰μ˜ ν‘œμ€€μ˜€μ°¨κ°€ 편ν–₯λ˜λŠ” ν˜„μƒμ΄ λ°œμƒ

πŸ’‘ 포아솑 νšŒκ·€ (Poisson Regression) μ „μ œμ‘°κ±΄

1. λ°˜μ‘λ³€μˆ˜(y κ°’)λŠ” μ…€ 수 μžˆμ–΄μ•Ό ν•œλ‹€. μ…€ 수 μ—†λ‹€λ©΄, 포아솑 νšŒκ·€λΆ„μ„μ€ μ‚¬μš©μ΄ 어렀움  
2. λ™μΌν•œ 길이의 μ–΄λ–€ 두 κ΅¬κ°„μ—μ„œ 사건 λ°œμƒμ˜ ν™•λ₯ μ€ λ™μΌν•˜λ‹€.
3. μ–΄λ–€ κ΅¬κ°„μ˜ 사건 λ°œμƒμ΄λ‚˜ 사건 λΆˆλ°œμ€ λ‹€λ₯Έ κ΅¬κ°„μ—μ„œμ˜ 사건 λ°œμƒ, λΆˆλ°œκ³ΌλŠ” λ¬΄κ΄€ν•˜λ‹€ (독립성)
4. 맀우 짧은 μ‹œκ°„μ΄λ‚˜ 맀우 μž‘μ€ 곡간에 두 개 μ΄μƒμ˜ κ²°κ³Όκ°€ λ™μ‹œμ— λ°œμƒν•  ν™•λ₯ μ€ 0이닀.

πŸ’‘ 포아솑 νšŒκ·€ (Poisson Regression) 뢄석 예제

poisRegFit <- glm( Attacks ~ offset(log(Pop100Thou)) + Year, family=poisson, data=sharks)
plot(sharks$Year,sharks$Rate,xlab="Year", ylab="Rate")
predRate <- predict(poisRegFit,type="response")/(sharks$Pop100Thou)
lines(sharks$Year,predRate,col=2)

 

λ°˜μ‘ν˜•

'Machine Learning' μΉ΄ν…Œκ³ λ¦¬μ˜ λ‹€λ₯Έ κΈ€

[Machine Learning] XGBoost (Extreme Gradient Boosting)  (0) 2023.04.26
[Machine learning] scikit-learn pipeline  (0) 2023.04.21
[Machine Learning] Data Leakage  (0) 2023.04.21
[Machine Learning] Hyperparameter Tuning  (0) 2023.04.21
[Machine Learning] Feature Engineering  (0) 2023.04.21