「平均値と中央値、どっちを見ればいいんですか?」「標準偏差って何を示しているんですか?」。論文の表を見るとき、こうした疑問にぶつかることはありませんか。
この記事では、記述統計の基本用語——平均値、中央値、標準偏差、四分位範囲など——を、薬剤師が実務で使える形で整理します。
目次
代表値 ― データの「中心」を示す指標
平均値(Mean)
最もよく知られた代表値です。すべてのデータを足し合わせて、データ数で割ったもの。
特徴:計算が簡単で、数学的に扱いやすい。ただし、外れ値(極端に大きいまたは小さい値)に影響を受けやすい。
平均値って、いつも正しい代表値なんですか?

オカメインコさん

ポッポ先生
データの分布が対称的(正規分布に近い)なら平均値が適切です。でも、外れ値がある場合や分布が歪んでいる場合は、平均値が中心を正しく表さないことがありますね
中央値(Median)
データを小さい順に並べたとき、真ん中に位置する値。
特徴:外れ値の影響を受けにくい。分布が歪んでいても、中心の傾向を正しく表せる。
例:5人の年齢が25歳、30歳、35歳、40歳、80歳の場合、平均値は42歳、中央値は35歳。80歳という外れ値が平均値を引き上げています。
最頻値(Mode)
データの中で最も頻繁に現れる値。
特徴:カテゴリーデータにも使える。ただし、複数のピークがある場合(双峰性)には解釈が難しくなる。
ばらつきを示す指標
標準偏差(SD:Standard Deviation)
データのばらつきの大きさを示す指標。平均値からの距離の平均的な大きさを示す。
解釈のポイント:
- 標準偏差が小さい → データが平均値の周りに集まっている(ばらつきが小さい)
- 標準偏差が大きい → データが広がっている(ばらつきが大きい)
正規分布では、平均値±1SDに約68%のデータが、平均値±2SDに約95%のデータが含まれます。
四分位範囲(IQR:Interquartile Range)
データを小さい順に並べたとき、下から25%の点(第1四分位数:Q1)と75%の点(第3四分位数:Q3)の範囲。
特徴:外れ値の影響を受けにくい。中央値とセットで報告されることが多い。
論文で「中央値(四分位範囲)」って書いてあるのをよく見ますが、どう解釈すればいいんですか?

オカメインコさん

ポッポ先生
「中央値(Q1-Q3)」の形で書かれていますね。これは「半分の人がこの範囲に入る」という意味です。例えば年齢が65歳(55-75歳)なら、半分の人が55〜75歳の間にいるということですね
範囲(Range)
データの最小値から最大値までの範囲。
特徴:計算が簡単だが、外れ値の影響を受けやすい。あまり使われない。
分布の形を示す指標
正規分布(Normal Distribution)
釣鐘型の対称的な分布。平均値、中央値、最頻値が一致する。
多くの統計的検定は、データが正規分布に従うことを前提としています。
歪度(Skewness)
分布の左右の非対称性を示す指標。
- 歪度 > 0:右に長い尾(正の歪み)。平均値 > 中央値
- 歪度 < 0:左に長い尾(負の歪み)。平均値 < 中央値
- 歪度 ≈ 0:対称的な分布
尖度(Kurtosis)
分布のピークの鋭さを示す指標。尖度が高いと、中心にデータが集中し、裾が重い分布。
論文の表でよく見る表記
| 表記 | 意味 | 使われる場面 |
|---|---|---|
| 平均値 ± SD | 平均値と標準偏差 | 正規分布に近いデータ |
| 中央値(Q1-Q3) | 中央値と四分位範囲 | 歪んだ分布や外れ値があるデータ |
| n (%) | 人数と割合 | カテゴリーデータ |
まとめ
- 平均値:外れ値に影響されやすい。対称的な分布で使う
- 中央値:外れ値に強い。歪んだ分布で使う
- 標準偏差:ばらつきの大きさ。平均値とセットで使う
- 四分位範囲:外れ値に強いばらつきの指標。中央値とセットで使う
- 論文の表記を見て、どの指標が使われているか確認する
次に論文のTable 1(患者背景の表)を見たとき、平均値と標準偏差、または中央値と四分位範囲のどちらが使われているか確認してみてください。


