「p < 0.05だから有意だ!」——この言葉、論文を読むときに目にしますよね。でも、本当にp値が0.05未満なら「効果がある」と言っていいのでしょうか。
実は、p値は「効果の大きさ」を教えてくれません。また、p値が0.06でも0.04でも、実は大きな違いはないのです。さらに、p値だけを見ると、研究の質を見逃すリスクもあります。
この記事では、p値と有意差の正しい理解、そして臨床的に意味のある効果を見極めるための考え方を整理します。
目次
p値とは何か ― 「偶然の確率」を示すだけ
p値の定義を簡潔に言うと、「観察された結果が、偶然(帰無仮説が真の場合)に生じる確率」です。
たとえば、ある薬を投与した群とプラセボ群で、イベント発生率に差が出たとします。p = 0.03なら、「この差が偶然に生じる確率は3%」という意味です。つまり、「差があるかどうか」の判定材料に過ぎません。
それってつまり、差があるかどうかがわかればいいんじゃないですか?

オカメインコさん

ポッポ先生
差があるかどうかはわかります。でも、その差がどのくらい大きいかはp値ではわからないんです。ここが重要なポイントですね
p値の限界 ― 知っておくべき5つの落とし穴
1. p値は効果の大きさを教えてくれない
大規模な試験では、ほんのわずかな差でも統計的に有意になります。たとえば、10万人の試験で死亡率が0.1% vs 0.09%の差が出たとします。p値は有意かもしれませんが、臨床的な意味は限定的です。
2. p値の閾値(0.05)は恣意的
p = 0.049とp = 0.051では、実質的な違いはほとんどありません。でも前者は「有意」、後者は「有意でない」と二分されてしまいます。これは統計的な慣習に過ぎず、絶対的な基準ではありません。
3. p値だけでは研究の質がわからない
バイアスの多い研究でも、サンプルサイズが大きければp値は有意になります。だからこそ、研究デザインの妥当性を確認することが必要です。
4. 多重検定の問題
多くの検定を行えば、偶然に有意差が出る確率が上がります。20個の検定を行えば、平均して1個はp < 0.05になります(1/20 = 0.05)。主要アウトカムと副次アウトカムを区別して確認しましょう。
5. 出版バイアス
有意な結果が出た研究は出版されやすく、有意でなかった研究は「お蔵入り」になりやすい。これがメタアナリシスの結果を歪める原因になります。
じゃあ、p値はもう見なくていいってことですか?

オカメインコさん

ポッポ先生
そうではありません。p値は参考情報の一つです。ただ、p値だけで判断せず、効果の大きさや信頼区間も合わせて見る必要がありますね
信頼区間の方が情報量が多い ― 効果の大きさと精度を同時に示す
p値よりも臨床的に有用なのが信頼区間(Confidence Interval:CI)です。信頼区間は、効果の大きさとその精度を同時に示してくれます。
たとえば、相対リスク(RR)= 0.70、95% CI:0.50-0.95の場合:
- 点推定値(0.70):最も可能性の高い効果の大きさ(リスクが30%減少)
- 信頼区間(0.50-0.95):真の値がこの範囲に入る確率が95%
- 1.0を含まない:統計的に有意(p < 0.05)
信頼区間の幅が狭いほど、推定精度が高いと言えます。逆に幅が広い場合は、真の効果がどこにあるか不確実です。
統計的有意と臨床的有意 ― この区別が重要
論文を読むとき、最も重要な区別の一つです。
| 概念 | 意味 | 判断材料 |
|---|---|---|
| 統計的有意 | 差が偶然ではない確率が高い | p値、信頼区間が1(または0)を含まないか |
| 臨床的有意 | その差が患者にとって意味がある | 効果の大きさ(NNTなど)、患者の価値観 |
統計的に有意でも、臨床的に意味がない場合があります。たとえば、ある降圧薬で収縮期血圧が平均2mmHg下がったとします。統計的には有意かもしれませんが、患者が実感できる変化ではないでしょう。
この区別を意識することで、論文の結果を過大評価したり、逆に見落としたりするリスクを減らせます。
まとめ ― p値を正しく使うための3つのポイント
- p値は「差があるかどうか」の指標:効果の大きさは別の指標(NNT、信頼区間)で確認する
- 信頼区間を重視する:効果の大きさと精度を同時に示してくれる
- 統計的有意≠臨床的有意:その差が患者にとって意味があるかを別途判断する
次に論文を読むときは、p値だけでなく、信頼区間やNNTも確認する習慣をつけてみてください。


