多くの学会発表や論文でその集団の特性を示す代表値として平均値±SDが使用されています。一方で平均値±SDではなく、中央値と四分位範囲(Median [interquartile range])が用いられることもあります。
私たちは子供の頃から平均値に慣れ親しんできたので、多くの人が平均値を使用しますが、平均値と中央値にはその使い方に違いがあります。
基本的な考え方
平均値は基本的にはデータが正規分布に従う場合に用いる集団の代表値で、正規分布しないデータには中央値を使うのが一般的です。
また、その集団のばらつきを示す場合に平均値であれば標準偏差(SD)、中央値の場合には四分位範囲が用いられます。四分位範囲はその集団の下から25%と75%に該当するデータを[25%tile値, 75%tile値]のように記載します。
時々、論文中で平均値±SDと中央値[四分位範囲」が使い分けわれているのは、そのデータが正規分布しているかどうかによって代表値を使い分けているものと考えられます。
また、群間比較の検定をする場合場合、t検定などは正規分布している集団に用いるもので、同じような検定をする場合に正規分布していないデータではWilcoxonの順位和検定などを用いることになります。
可能であれば使い分け
平均値と中央値には前述のような使い分けがありますが、統計ソフトは別にして、グラフ作成する場合でもエクセルでは平均値±SDの作図は簡単ですが、中央値[四分位範囲]の作図は箱ひげ図などが用いられるので平均値と比べると作図にも手間がかかります。こられの要因もあり、中央値での表記は平均値と比較するとやや面倒ではあります。
統計解析はこだわりすぎると何もできなくなるものもあるので、必要以上にこだわることもないかもしれませんが、知っておくことで発表や論文の作成において間違いを少なくすることにつながります。
当社では多忙なクライアント様の負担をできる限り軽減するため、専門スタッフがデータ解析から医学文献・臨床文献調査、論文作成代行まで一連の作業をサポート致します。
臨床論文投稿前に問題がないか見てほしい、統計部分のメディカルライティングをチェックしてほしいなど、何かお困りのことがございましたらご相談ください。