kang9366
Repository
kang9366
글쓰기
설정
전체 방문자
오늘
어제
  • 분류 전체보기 (143)
    • Programming (70)
      • Java (1)
      • C++ (11)
      • Kotlin (12)
      • Keras (2)
      • Android (34)
      • Jetpack Compose (1)
      • Error Solution (7)
    • CS (36)
      • 자료구조 (13)
      • 운영체제 (1)
      • 알고리즘 (4)
      • 컴퓨터 보안 (8)
      • 기타 (10)
    • Data Science (28)
      • 데이터분석 (7)
      • 머신러닝 (14)
      • 딥러닝 (7)

인기 글

최근 글

최근 댓글

Github · Instagram · Facebook
kang9366

Repository

[기초통계학] 대표값
Data Science/데이터분석

[기초통계학] 대표값

2022. 6. 16. 03:54

주어진 자료를 대표하는 특정 값을 그 자료의 대표값이라고 한다. 대표값은 자료의 중심적인 경향이나 자료분포의 중심의 위치를 나타내주는데, 일반적 으로 사용되는 것에는 평균(mean), 중위수(median), 최빈수(mode) 등이 있다.

 

평균(mean)

평균은 산술평균, 기하평균, 조화평균, 가중평균 등으로 분류할 수 있다.

 

1. 산술평균(arithmetic mean)

일반적으로 평균 이라고 줄여말하는 것으로, 자료의 모든 측정값을 합산하여 이 값을 전체 자료의 수로 나누어 준 값을 말한다. 가장 보편적이고, 흔히 사용하는 값이다. 

 

 

2. 기하평균(geometric mean)

변화하는 비율을 나타내는 평균이다.

예를 들어, 자본금 100만원 으로 사업을 시작하여 첫 해에는 자본금이 2배, 두 번째 해는 자본금이 8배 증가했다고 하자. 그러면 자본금은 2년 동안 총 16배가 늘어났고, 매년 평균 적으로 4배 늘어났다고 볼 수 있다. 이렇듯 기하평균은 여러 개의 수를 연속 으로 곱하여 그 개수의 거듭제곱근으로 구한다.

만약 이를 산술평균으로 구하면 2배와 8배의 산술평균 즉 5배가 되어 실제 평균증가율보다 높게 나타난다.

 

 

3. 조화평균(harmonic mean)

평균속도를 계산하거나 일정금액을 가지고 구입할 수 있는 상품의 수량의 평균을 구할 때 이용되는데, 자료값을 각각 역수로 하여 산술 평균을 구한 다음 다시 이 값의 역수를 취하여 산출한다.

 

 

4. 가중평균(Weighted Average)

각각의 자료값이 가지는 중요성이 서로 다르면, 자료값에 자료의 상대적 중요도인 가중치(w)를 곱하여 합산한 값을 각각의 가중치의 합계로 나누어 구한다. 가중평균은 물가지수 산정 등 광범위하게 사용되고 있다.

 

 

중앙값(median)

중위수는 중앙값이라고도 하며, 자료를 크기 순으로 나열했을 때 한가운 데에 위치하는 자료값을 말한다.

자료가 홀수 개이면 정중앙 값이 중앙값이 되지만, 짝수 개이면 중앙에 위치한 값이 두 개가 되므로 이 경우에는 두 값의 평균을 중앙값으로 한다.

 

 

최빈값(mode)

자료 중 빈도수가 가장 높은 자료값을 말한다.

 

자료값이 7, 10, 10, 8, 9, 10, 6, 10로 주어졌다고 하자. 크기순대로 자료값을 다시 나열하면 6, 7, 8, 9, 10, 10, 10, 10이므로 중위수는 네 번째 값 9와 다섯 번째 값10의 평균인 9.5가 되며, 4번으로 가장 빈도수가 높은 10이 최빈수가 된다. 

 

자료 중에 극단적인 값이 한 개 이상 있을 때 그 값들이 산술평균에 큰 영향을 미쳐서 산술평균이 대표값으로 부적절한 경우가 있다. 이런 경우에는 극단적인 값의 영향을 받지 않는 중위수나 최빈수가 오히려 대표값으로 적절 할 수 있다.

저작자표시 비영리 변경금지 (새창열림)

'Data Science > 데이터분석' 카테고리의 다른 글

[기초통계학] 통계적 추정  (0) 2022.06.16
[기초통계학] 표본평균의 분포와 중심극한정리  (0) 2022.06.16
[기초통계학] 확률분포  (0) 2022.06.16
[기초통계학] 자료의 분류  (0) 2022.06.10
[기초통계학] 통계학이란?  (0) 2022.06.10
    'Data Science/데이터분석' 카테고리의 다른 글
    • [기초통계학] 표본평균의 분포와 중심극한정리
    • [기초통계학] 확률분포
    • [기초통계학] 자료의 분류
    • [기초통계학] 통계학이란?
    kang9366
    kang9366

    티스토리툴바