β ν¬μμ‘ νκ· (Poisson Regression)
π‘ ν¬μμ‘ λΆν¬ (Poisson distributuon)
- μΌμ ν μκ° λλ κ³΅κ° λ΄μμ λ°μνλ, μ¬κ±΄μ λ°μ νμμ λ°λ₯Έ νλ₯ μ ꡬν λ μ¬μ©
- λ¨μ μκ° μμ μ΄λ€ μ¬κ±΄μ΄ λͺ λ² λ°μν κ²μΈμ§ νννλ μ΄μ° νλ₯ λΆν¬
β λ (λλ€) = μ ν΄μ§ μκ° μμ μ΄λ€ μ¬κ±΄μ΄ μΌμ΄λ νμμ λν κΈ°λκ°
β e = μμκ° (2.71828)
π‘ ν¬μμ‘ νκ· (Poisson Regression)
- μ’ μλ³μ(dependent variable)κ° ν¬μμ‘ λΆν¬λ₯Ό λ°λ₯Έλ€κ³ κ°μ νκ³ , μΌλ°ν μ νλͺ¨λΈμ νκ·λΆμ μν
- μ’ μλ³μκ° κ°μ°μλ£(count data)μΌ λ μ£Όλ‘ μ¬μ©
- ν¬μμ‘ λΆν¬μ νΉμ±μ νκ· κ³Ό λΆμ°μ΄ κ°μμΌ νλ€λ μ μ½μ‘°κ±΄ μμ
- But, νμ€ λ°μ΄ν°μμλ νκ· κ³Ό λΆμ°μ μ°¨μ΄κ° ν¬κ² λνλλ κ²½μ°κ° λ§κΈ° λλ¬Έμ,
ν¬μμ‘ νκ·λͺ¨νμ μ μ©νλ©΄ νκ·κ³μ μΆμ λμ νμ€μ€μ°¨κ° νΈν₯λλ νμμ΄ λ°μ
π‘ ν¬μμ‘ νκ· (Poisson Regression) μ μ 쑰건
1. λ°μλ³μ(y κ°)λ μ
μ μμ΄μΌ νλ€. μ
μ μλ€λ©΄, ν¬μμ‘ νκ·λΆμμ μ¬μ©μ΄ μ΄λ €μ
2. λμΌν κΈΈμ΄μ μ΄λ€ λ ꡬκ°μμ μ¬κ±΄ λ°μμ νλ₯ μ λμΌνλ€.
3. μ΄λ€ ꡬκ°μ μ¬κ±΄ λ°μμ΄λ μ¬κ±΄ λΆλ°μ λ€λ₯Έ ꡬκ°μμμ μ¬κ±΄ λ°μ, λΆλ°κ³Όλ 무κ΄νλ€ (λ
립μ±)
4. λ§€μ° μ§§μ μκ°μ΄λ λ§€μ° μμ 곡κ°μ λ κ° μ΄μμ κ²°κ³Όκ° λμμ λ°μν νλ₯ μ 0μ΄λ€.
π‘ ν¬μμ‘ νκ· (Poisson Regression) λΆμ μμ
poisRegFit <- glm( Attacks ~ offset(log(Pop100Thou)) + Year, family=poisson, data=sharks)
plot(sharks$Year,sharks$Rate,xlab="Year", ylab="Rate")
predRate <- predict(poisRegFit,type="response")/(sharks$Pop100Thou)
lines(sharks$Year,predRate,col=2)
'Machine Learning' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
[Machine Learning] XGBoost (Extreme Gradient Boosting) (0) | 2023.04.26 |
---|---|
[Machine learning] scikit-learn pipeline (0) | 2023.04.21 |
[Machine Learning] Data Leakage (0) | 2023.04.21 |
[Machine Learning] Hyperparameter Tuning (0) | 2023.04.21 |
[Machine Learning] Feature Engineering (0) | 2023.04.21 |