기초통계 : 대푯값
in Analysis / Statistics
대푯값
어떤 데이터를 대표하는 값
일반적으로 자료의 특징을 수 하나로 표현한 값이다.
평균
- 일반적으로 말하는 평균은 산술평균
- 관측된 값을 모두 더한 후 관측값의 개수로 나눈 것
- 데이터의 무게중심
기대값
- 기대값은 관측값과 그 관측값이 발생할 확률을 곱한 것
- 평균의 다른 말로 봐도 된다.
중앙값
어떤 주어진 값들을 크기의 순서대로 정렬했을 때 가장 중앙에 위치하는 값
최빈값
데이터에서 가장 자주 등장하는 값 (빈도수가 높은 값)
도수분포표 = 자료들을 모아 테이블로 만든다.
히스토그램 - 도수분포표를 그래프로 표현하자
중앙값과 평균의 관계
- 히스토그램이 잘게잘게 쪼개지면 연속적인 그래프가 된다.
- 이 때 중앙값과 평균의 차이를 잘 보자
요약
우리가 기본적으로 알고 있는 평균, 최빈값, 중앙값 등 자료를 대표하는 값들
평균과 중앙값을 잘보면 데이터가 어떻게 치우쳐 있는지 파악할 수 있다.