분석 : 머신러닝을 활용한 마케팅 예산 분배 최적화

머신러닝의 가장 큰 목적

이때 우리가 찾아낼 수 있는 가장 직관적이고 간단한 모델은 선(Line)이다. 그래서 데이터를 놓고 그걸 가장 잘 설명할 수 있는 선을 찾는 방법을 선형 회귀(Linear Regression) 분석이라 부른다.

Y = Wx + b

독립변수(X들)과 종속변수(Y)의 관계를 수치적으로 명확하게 설명하고 싶을 때

X와 Y의 관계를 선형으로 나타낼 수 있을 때

예측하고 싶다. 무엇을 ?

어떤 범주에 속할 확률을 0에서 1 사이의 값으로 예측

로지스틱 회귀식을 (0,1) 사이의 범위로 떨어지도록 식을 변형해준다. 어떻게 ?

선형식은 간단히 sigmoid 함수를 통해서 (0,1)을 예측하는 선으로 바꿀 수 있다.

Y = Sigmoid(Wx+b)

로지스틱 회귀 분석의 활용
- 예측하려고 하는 값이 이분형(1 또는 0) 일 때 사용한다.
- 고객 신용도 평가 (우량 / 불량 예측)
- 질병 예측 (질병 발생 확률 예측)
우리가 살펴본 데이터에는 어떤 모델을 사용할까?
목적
- 우리가 산정한 마케팅 예산을 각 켐페인에 분배하고 싶다.
- 각 캠페인의 유저 전환에 대한 상대적은 기여도를 알고 싶다.
- 켐페인의 종류는 현재 50개이다.
- 유저가 본 켐페인들과 해당 켐페인의 카테고리 등 모든 피쳐들을 모아서 전환을 예측하는 모델을 만든다. 전환(Conversion) 은 0 또는 1이다 = Logistic Regression

개발 노트 블로그