그림 3. 상자는 외부 값이 표시된 플롯입니다. 상자 및 수염 플롯은 Q 1의 왼쪽 가장자리, Q 3의 오른쪽 가장자리, Q 2(중앙값)의 상자의 “가운데”와 최대 및 최소값을 “수염”으로 표시합니다. 데이터는 최소한에서 최대로 순서대로 정렬됩니다. 15개의 값이 있으므로 순서대로 8번째 숫자는 중앙값인 50입니다. 중앙값의 왼쪽에는 7개의 데이터 값이, 오른쪽에는 7개의 값이 있습니다. 상자 플롯을 만드는 데 사용되는 다섯 가지 값은 표 2입니다. 상자는 여성의 시대에 대한 용어와 값을 플롯. 아래 화살표 다음 오른쪽 화살표 키를 사용 하 여 다섯 번째 그림으로 이동, 상자 플롯입니다. Enter. “동일하고 동일하지 않음”은 대부분의 모든 데이터 집합에 대한 짧고 정확한 설명입니다… 예를 들어 단풍 나무 잎 더미.

단풍 나무잎은 크기가 거의 같지만 약간의 차이가 있습니다. 설명 통계는 숫자를 사용하여 데이터가 동일하고 동일하지 않은 방법을 설명하려는 시도입니다. 상자 플롯(상자 및 수염 다이어그램이라고도 함)은 최소, 첫 번째 사분위수, 중앙값, 세 번째 사분위수 및 최대값의 다섯 숫자 요약을 기반으로 데이터의 분포를 표시하는 표준화된 방법입니다. 가장 간단한 상자 플롯에서 중앙 사각형은 첫 번째 사분위수에서 세 번째 사분위수(사분위수 범위 또는 IQR)에 걸쳐 있습니다. 사각형 내부의 세그먼트는 중앙값과 상자 아래의 “수염”을 표시하여 최소 및 최대 위치를 표시합니다. 일반적으로 분산된 대규모 데이터 집합에서 이상값으로 의심되는 경우는 드물지 않습니다(예: 100개 이상의 데이터 포인트). 이상값은 약 10,000개 이상의 데이터 요소가 있는 일반적으로 분산된 데이터 집합에서 예상됩니다. 다음은 상자 플롯으로 표시되는 1000개의 일반적으로 분산된 데이터의 예입니다: 온라인 imathAS 상자 플롯 도구를 사용하여 상자 와 수염 플롯을 만듭니다. 통계 분석 프로그램은 상자 플롯을 작성하는 방법에 대한 옵션을 제공할 수 있습니다. 예를 들어 그림 6의 상자 플롯은 데이터에서 생성되지만 여러 가지 방법으로 이전 상자 플롯과 다릅니다.

일부 데이터 집합의 경우 가장 큰 값, 가장 작은 값, 첫 번째 사분위수, 중앙값 및 세 번째 사분위수 중 일부가 동일할 수 있습니다. 예를 들어 중앙값과 세 번째 사분위수가 동일한 데이터 집합이 있을 수 있습니다. 이 경우 다이어그램에는 중앙값을 표시하는 상자 내부에 점선이 없습니다. 상자의 오른쪽에는 세 번째 사분위수와 중앙값이 모두 표시됩니다.