기초통계 : 대푯값

대푯값

어떤 데이터를 대표하는 값

일반적으로 자료의 특징을 수 하나로 표현한 값이다.

평균

  • 일반적으로 말하는 평균은 산술평균
  • 관측된 값을 모두 더한 후 관측값의 개수로 나눈 것
  • 데이터의 무게중심

기대값

  • 기대값은 관측값과 그 관측값이 발생할 확률을 곱한 것
  • 평균의 다른 말로 봐도 된다.

중앙값

어떤 주어진 값들을 크기의 순서대로 정렬했을 때 가장 중앙에 위치하는 값

최빈값

데이터에서 가장 자주 등장하는 값 (빈도수가 높은 값)

image

도수분포표 = 자료들을 모아 테이블로 만든다.

image

히스토그램 - 도수분포표를 그래프로 표현하자

image

중앙값과 평균의 관계

  • 히스토그램이 잘게잘게 쪼개지면 연속적인 그래프가 된다.
  • 이 때 중앙값과 평균의 차이를 잘 보자

image

요약

우리가 기본적으로 알고 있는 평균, 최빈값, 중앙값 등 자료를 대표하는 값들

평균과 중앙값을 잘보면 데이터가 어떻게 치우쳐 있는지 파악할 수 있다.