突然ですが、この記事を執筆している時点での日本人の平均年収は436万円だそうです
この数字を見て、あなたは多いと思いましたか?
私は平均以下じゃないか! と思いましたか?
この数字を見て私がどれほど愕然としたかは、さておき__
平均という見方は、万能ではなく、
意図しない結果を返すことがあります
年収はその一例ですが、今回お伝えするのは、
エクセル関数を用いて平均を計算する際に異常値を除外する関数についてです
TRIMMEAN関数の使い方がわかります
TRIMMEAN関数とは
データの中間項の平均を返します。 TRIMMEAN 関数は、データ全体の上限と下限から一定の割合のデータを切り落とし、残りの項の平均値を返します。 この関数は、範囲外のデータを分析対象から排除する場合に使用できます。
Microsoft Supportより
つまり、極端な値を除外して平均をとることができる関数です
数式は、=(配列,割合) です
配列は、平均を求めたいデータの範囲
割合は、データ全体個数から除外するデータ個数の割合を意味します
例えば、割合を0.2とした場合、
データの上位10%と下位10%を合わせた20%を除外することになります
TRIMMEAN関数とAverage関数の比較
例題として下図は、とある会社の年収のリストです
A2:A12セルの平均は868万円でした
しかし、50万円は明らかに少ない数値です
→ 2ヶ月で退職した社員でしょうか
また、5,000万円も多すぎる数値です
→ 恐らく社長の報酬なのでしょう

というわけで今回は、年収の上位と下位から10%の数値は除外して平均をとってみます
使用するのは、TRIMMEAN関数です
=TRIMMEAN(A2:A12,0.2)
A2:A12 は、平均したい範囲を設定してください
0.2というのは、20%を意味します
→上位10%と下位10%、合わせて20%を除外するという意味になります

結果は、500万円となりました
異常値として、50万円と5,000万円が除外された結果です
いかがだったでしょうか
異常値として一定のラインで、ざっくりと仕切るには良い関数です
ですが、結果の求め方として中央値や標準偏差を用いる方法もありますので機会があれば記事にしたいと思います
コメント