
箱ひげ図とはデータのばらつきを表したグラフのことである。Excelでは作成した表を元に箱ひげ図を作成したり、作成した箱ひげ図を編集したりすることができるので覚えておこう!
目次
Excelで箱ひげ図を作成したいものの、方法が分からないという方も多いのではないだろうか。
本記事では、Excelで箱ひげ図を作成する方法について解説する。また、箱ひげ図を作成するメリットや四分位数を求める手順についてもまとめた。
箱ひげ図とは?
箱ひげ図とは、データのばらつきを表したグラフのことだ。
具体的には以下のような形をしたグラフを指す。箱の両側に出た線がまるでひげのようであることから、箱ひげ図と呼ばれている。
箱ひげ図を作成することで、「複数のデータのばらつきがどれくらい異なるのか」比較しやすくなる。
箱ひげ図は次の5つの要素から成り立っている。
- 最大値
- 最小値
- 平均値
- 四分位範囲(中央値)
- 外れ値
最大値と最小値の間は縦線(ひげ)で表される。ひげが長ければ、最大値と最小値の差がそれだけ広いということである。また、平均値は「☓」マークで箱の中に表される。
それ以外は聞き慣れない言葉だと思うので、それぞれ意味を解説する。
■四分位数とは?
四分位数はデータを小さい方から均等に4分割したものを指す。
そして、小さい方から25%地点の値を第1四分位数、50%地点の値を第2四分位数(中央値)、75%地点の値を第3四分位数と言う。
第1四分位数〜第3四分位数の範囲は、四分位範囲と呼ばれている。箱ひげ図では、四分位範囲を箱によって表現する。箱が長ければ、データのばらつきが激しいということになる。
また、第2四分位数(中央値)には、薄く横線が引かれている。
■外れ値とは?
外れ値とは、データの中で他の値から極端に離れているものを指す。他の値から極端に離れているものがある場合、その値は最大値にも最小値にもしない。あくまで外れ値とする。
極端に離れている値を外れ値にすることで、データのばらつきを正しく把握できるようになる。
たとえば、会社の各従業員の売上成績のばらつきを図で示す場合、1人だけ飛び抜けて営業成績が良い社員がいるなら、その社員は度外視して図を作成した方が、分かりやすくなる。
箱ひげ図では、最大値・最小値はそれぞれ線で表しているが、外れ値はその線の中に含まず、線の外に点で表す。
■箱ひげ図のメリット
箱ひげ図のメリットは、データのばらつきを視覚的に把握しやすいことである。
たとえば、特定地域の年収のばらつきを調べたい場合、平均値や中央値だけでは、「どの程度ばらつきがあるか」までは分からない。平均年収が400万だと、200万・400万・600万なのかもしれないし、300万・300万・600万なのかもしれない。
また、年収が1億以上など極端に高い人がいるために、平均年収が高くなっている可能性もある。
箱ひげ図ならその辺りのデータのばらつきが分かりやすい。ひとつのグラフだけで、最大値・最小値、平均値、中央値、外れ値、値が固まっている箇所、が把握できる。
箱ひげ図の四分位数を求める方法
四分位数を求める方法はシンプルだ。
まず、以下のようにデータを小さい順に並べる。
【1,2,4,6,8,9,11,14,17,19,21,23】
次に、データの真ん中(中央値)を決めて、データを前半と後半に分ける。
【1,2,4,6,8,9 11,14,17,19,21,23】
最後に、前半と後半で更に中央値を決めて、データを4分割すれば良い。
【1,2,4 6,8,9 11,14,17 19,21,23】
それぞれのグループの間が、第1四分位数〜第3四分位数ということになる。
第1四分位数は(4+6)/ 2=5、第2四分位数は(9+11)/ 2=10、第3四分位数は(17+19)/ 2=18ということになる。
そして四分位範囲は、18(第3四分位数)-5(第1四分位数)=13である。箱ひげ図ではこの範囲が箱で表される。
Excelで箱ひげ図を作成する方法
Excelで箱ひげ図を作成する方法について解説する。箱ひげ図を作成する手順は次のとおり。
- データを用意する
- 箱ひげ図を表示する
- タイトルを設定する
ひとつひとつの手順について詳しく解説する。
■1.データを用意する
まずは、グラフの元となるデータを用意する必要がある。
ここでは、以下のような社員ごとの売上金額をまとめた表を用意した。
■2.箱ひげ図を表示する
表を作成したら、表全体をドラッグアンドドロップで選択しよう。
「挿入」タブから「統計」⇒「箱ひげ図」をクリックする。
これで、箱ひげ図が表示される。「営業1課」「営業2課」それぞれのグラフが表示された。
外れ値を表示させるために、データを1つ書き換えてみよう。以下ではD11の値を「300,000」に変更している。1人だけ極端に売上金額が高いということになる。
すると、箱ひげ図が作り変わり、外れ値が表示された。
これで、箱ひげ図が完成したことになる。箱ひげ図によって、営業1課と営業2課に所属する社員の売上金額のばらつきが、それぞれどうなっているかが分かる。
営業1課よりも営業2課の方が箱が長く、社員の売上金額の差が激しい。更に、営業2課の売上金額の中央値は最大値の方に近く、好成績を収めた社員の方が多いと分かる。同時に、成績が著しく振るわない社員も一定数いて、彼らが平均値を下げていることも分かる。
もし外れ値が表示されない場合、グラフをダブルクリックして箱ひげ図のオプションを表示させよう。
- 「特異ポイントを表示する」にチェックが入っているか
- 「平均マーカーを表示する」にチェックが入っているか
- 「四分位数計算」を「包括的な中央値」になっているか
この3点を確認しよう。
■3.タイトルを設定する
最後に、箱ひげ図のタイトルを設定しよう。
グラフのタイトル箇所をダブルクリックすると、タイトルを入力できるようになる。
まとめ
本記事ではExcelで箱ひげ図を作成する方法について解説した。最後に、箱ひげ図を構成する5つの要素についておさらいしよう。
- 最大値
- 最小値
- 平均値
- 四分位範囲(中央値)
- 外れ値
箱ひげ図では、最大値から最小値までは縦線(ひげ)で表される。四分位範囲は箱で表され、中央値は箱の中で横線で表される。外れ値がある場合は、図の外で点で表される。
また、Excelで箱ひげ図を作成する手順は次のとおり。
- データを用意する
- 箱ひげ図を表示する
- 表全体を選択する
- 「挿入」⇒「統計」⇒「箱ひげ図」をクリック
- タイトルを設定する
- タイトル箇所をダブルクリック
- 新しいタイトルを入力
箱ひげ図はデータのばらつきを視覚的に把握したい場合に便利だ。
構成/編集部