薬歴記載はAIで効率化!! 気になる方はこちらを!

【薬剤師のためのEBM講座】第6回_システマティックレビューの読み方

「メタアナリシスはエビデンスのピラミッドの頂点にある」。そう聞いたことはあっても、実際にシステマティックレビューを開いたとき、何をどう見ればいいのか迷ったことはありませんか?

フォレストプロットという独特なグラフが出てきて、四角やひし形が並んでいる。でもその読み方がわからず、結論の文章だけ拾って閉じてしまう——そういう方は少なくないと思います。

この記事では、システマティックレビューとメタアナリシスを読むときに確認すべきポイントと、フォレストプロットの読み方を解説します。加えて、メタアナリシスを「最強のエビデンス」と過信しないために知っておくべき限界——出版バイアス、SPIN(結果と結論の不一致)、元の研究の質の問題——にも踏み込みます。


システマティックレビューとメタアナリシスは何が違うのか

まず用語を整理します。この2つは混同されがちですが、役割が異なります。

  • システマティックレビュー:特定の臨床疑問に対して、あらかじめ定めた方法で文献を網羅的に検索・選択・評価し、結果をまとめたもの
  • メタアナリシス:システマティックレビューの中で、複数の研究結果を統計的に統合する手法

つまり、メタアナリシスはシステマティックレビューの一部(統計的統合の部分)です。すべてのシステマティックレビューがメタアナリシスを含むわけではありません。

でも、複数の研究をまとめているなら、どっちにしても信頼性は高いんですよね?

オカメインコ

オカメインコさん

ポッポ先生

ポッポ先生

そこが落とし穴です。質の低い研究をいくら集めても、質の高いエビデンスにはなりません。”何を集めたか”と”どう集めたか”を確認する必要がありますね

ここ、迷いやすいところです。「たくさんの研究をまとめた=信頼性が高い」と自動的に考えてしまうと、質の低いシステマティックレビューに引っかかるリスクがあります。“Garbage in, garbage out”という表現が使われるのには理由があります。


システマティックレビューの妥当性を評価する4つの視点

個々のRCTに妥当性のチェックポイントがあったように、システマティックレビューにも確認すべき項目があります。私ならまず、以下の4つを確認します。

1. 含まれているのはRCTのシステマティックレビューか

治療効果を検討するシステマティックレビューであれば、基本的にはRCTを対象としたものが最も信頼性が高いです。観察研究のみを統合したレビューは、交絡因子の影響を排除できないため、結論の確実性が下がります。

2. 文献検索は網羅的に行われているか

システマティックレビューの価値は、関連する研究を「漏れなく」集めているところにあります。確認すべきポイントは以下のとおりです。

  • 複数のデータベース(MEDLINE、EMBASE、Cochrane Libraryなど)を検索しているか
  • 検索戦略(使用したキーワードや検索式)が明示されているか
  • 未発表研究や灰色文献(学会抄録、臨床試験登録など)も検索対象にしているか
  • 言語を限定していないか(英語論文のみの検索は偏りの一因になる)

3. 個々の研究の妥当性が評価されているか

集めた研究の質を、レビュー著者が評価しているかどうか。第4回で解説したRCTのチェックポイント(ランダム化、盲検化、ITT解析など)に基づくバイアスリスクの評価が行われているかを確認します。

コクランレビューでは「Risk of Bias(RoB)ツール」が標準的に使われています。各研究のバイアスリスクが「低・不明・高」で評価され、表やグラフで示されます。

4. 研究間の結果は一貫しているか(異質性の評価)

ここが非常に大切なポイントです。統合された研究の結果がバラバラだと、ひとつの数字にまとめること自体が適切でない可能性があります。

指標意味目安
I²統計量研究間のばらつきのうち、偶然では説明できない割合0-40%:低い、30-60%:中程度、50-90%:高い、75-100%:非常に高い
Q検定のp値異質性の統計的検定p < 0.10 で異質性ありと判断されることが多い

フォレストプロットの読み方 ― 四角・線・ひし形の意味

フォレストプロットは、メタアナリシスの結果を視覚的に示したグラフです。最初は独特な見た目に戸惑いますが、構造を理解すれば直感的に読めるようになります。

フォレストプロットの構成要素

  • 各行の四角(■):個々の研究の結果(点推定値)
  • 四角の大きさ:その研究の「重み」(サンプルサイズや分散の逆数に基づく)。大きいほどメタアナリシスへの寄与が大きい
  • 四角から伸びる横線(━):その研究の95%信頼区間
  • 縦の基準線(│):効果なし(RRやORなら1.0、リスク差なら0)
  • 最下部のひし形(◆):すべての研究を統合した結果(統合推定値)。ひし形の横幅が統合結果の95%信頼区間

読み取りの3ステップ

私ならまず、以下の順番でフォレストプロットを読みます。

  1. ひし形(統合結果)の位置を見る
    基準線(1.0)の左側にあれば治療群が有利、右側なら対照群が有利(RRの場合)。ひし形が基準線にかかっていなければ統計的に有意
  2. 各研究の四角と横線のバラつきを見る
    四角がおおむね同じ方向に並んでいれば、結果に一貫性がある。基準線をまたぐ研究と、またがない研究が混在していたら異質性に注意
  3. 四角の大きさの分布を見る
    大きな四角(重みが大きい研究)が統合結果と一致していれば安心感がある。逆に、統合結果が小さな研究に引っ張られている場合は注意

それってつまり、ひし形が基準線にかかっていなければ”効果あり”でいいんですか?

オカメインコ

オカメインコさん

ポッポ先生

ポッポ先生

統計的にはそうです。でも、各研究がバラバラの方向を向いているのに統合結果だけが有意になっている場合は、その統合自体に疑問が残ります。個々の四角のばらつきも必ず見てくださいね


コクランレビューを読むときの追加チェック

コクラン共同計画(Cochrane Collaboration)が作成するシステマティックレビューは、方法論が標準化されており、質が高いことで知られています。薬剤師がシステマティックレビューを読むなら、まずコクランレビューから始めるのが効率的です。

コクランレビューには以下の特徴があります。

  • プロトコルが事前に登録・公開されている
  • 標準化されたRisk of Biasツールで個々の研究を評価
  • GRADE(エビデンスの確実性の評価体系)に基づくエビデンスの質の評価
  • 定期的にアップデートされる

でも、コクランレビューなら無条件に信頼していいんですか?

オカメインコ

オカメインコさん

ポッポ先生

ポッポ先生

コクランレビューでも、含まれるRCT自体の質が低ければ結論の確実性は下がります。レビューの中のGRADE評価やSummary of Findingsテーブルで、エビデンスの確実性が”高”なのか”低”なのかを確認することが大切ですね


メタアナリシスの限界を知っておく ― 過信しないための視点

「メタアナリシスは最強のエビデンス」という言い方をよく耳にしますが、しないほうが安全です。メタアナリシスにも重大な限界があります。ここからの内容は、ぜひ覚えておいてください。

出版バイアス ― 見えない研究が結果をゆがめる

ここは特に気をつけてほしいポイントです。有意な結果が出た研究は学術誌に出版されやすく、有意でなかった研究や否定的な結果の研究は「お蔵入り」になりやすい。これが出版バイアスです。

何が問題かというと、メタアナリシスが出版された研究のみを集めている場合、「ポジティブな結果」ばかりが統合に入り、効果を過大評価してしまう可能性があるんです。

出版バイアスがあったら、そのメタアナリシスの結果は使えないんですか?

オカメインコ

オカメインコさん

ポッポ先生

ポッポ先生

使えないわけではないですが、“効果は実際にはもう少し小さいかもしれない”と割り引いて解釈する必要があります。ファンネルプロットの確認は一つの目安になりますね

SPINの問題 ― 結果と結論が一致していない論文がある

SPIN(スピン)という問題をご存じですか? 研究の結果(Results)と著者の結論(Conclusions)が一致していない現象のことです。これは個別のRCTだけでなく、システマティックレビューやメタアナリシスでも起こります。

たとえば、主要評価項目で有意差が出なかったのに、二次評価項目やサブグループ解析の結果を前面に出して「効果が示唆された」と結論づけるケースです。

元の研究が低質なら、統合しても信頼できない

これは繰り返しになりますが、とても大事なことなので改めて強調させてください。

メタアナリシスの統計的な力は「精度を上げる」ことです。複数の研究を統合することでサンプルサイズが実質的に大きくなり、信頼区間が狭くなります。見た目には「確実な結果」に見えます。

でも、精度が上がっても妥当性は上がりません。第4回で説明した的当ての例えを思い出してください。バイアスのある研究をいくら集めても、的の中心からずれた場所に矢が密集するだけです。精度は上がっても、妥当性は上がらないんです。


まとめ

システマティックレビューとメタアナリシスを読むときのポイントをまとめます。

妥当性の4つのチェック

  1. RCTを対象としたレビューか(元のRCTの質が低ければ、統合しても信頼できない)
  2. 文献検索は網羅的か(複数データベース、検索式の記載、出版バイアスへの対処)
  3. 個々の研究のバイアスリスクが評価されているか(質の高い研究に限定した感度分析も確認)
  4. 研究間の結果に一貫性はあるか(異質性:I²)

フォレストプロットの3つの読み方

  1. ひし形(統合結果)の位置と基準線との関係
  2. 各研究の方向の一貫性
  3. 大きな四角(重みのある研究)の動向

過信しないための3つの視点

  • 出版バイアスの影響(ファンネルプロットの確認。ポジティブな結果ばかり集まっていないか)
  • SPINの問題(結果と結論が一致しているか。アブストラクトの結論だけで判断しない)
  • 元の研究の質(低質な研究の統合は低質なエビデンス。精度が上がっても妥当性は上がらない)

「メタアナリシスだから正しい」ではなく、「このメタアナリシスの統合は妥当か」を自分で判断できることが、エビデンスを使いこなす薬剤師への一歩です。

確認先(一次情報):Cochrane Library(cochranelibrary.com)、Cochrane Handbook for Systematic Reviews of Interventions、Guyatt GH, et al. Users’ Guides to the Medical Literature(JAMA Evidence)

Share Section Final

記事の共有について

この記事はリンクフリーです。
勉強会や資料作成など、薬局業務のお役に立てれば幸いです。
出典としてKUROYAKUと添えていただけると嬉しいです!

関連記事

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です


reCaptcha の認証期間が終了しました。ページを再読み込みしてください。

\薬歴、半分の時間で終わらせませんか? /
「薬歴、溜まってる…」を終わりにする
AI薬歴ディープインパクト
無料で試してみる