今回はChatGPTに英語の医学論文を読ませてみて、しっかりと内容を要約してくれることができるのかなどを検証していこうと思います。
目次
何故、ChatGPTに読ませようと思ったのか?
何故、このようなことをするのかというと過去記事でも紹介しているように、日本の薬剤師では英語の医学論文を読んでいる人が少ない(12人に1人)という結果がでています。
そして医師の半数近くは、薬剤師にも大規模臨床試験の結果くらいは知っておいてほしいと思っています。
私は、英語苦手なので、翻訳ツールを活用して医学論文の情報収集をしていますが、それでも医学論文読むことへの苦手意識がある人は多いと思います。
もし、ChatGPTで英語の医学論文の要約が簡単にできるのであれば、英語が苦手な人でも医学論文の内容を効率的に情報収集できるようになり、情報格差が縮まるのではないかなと思います。
るるーしゅ
前置きはこの辺で本題に入っていこうと思います。
お題論文①パロキセチン普通錠とCR錠を比較した文献
まずはパロキセチンの普通錠と徐放性製剤を比較したランダム化比較試験のアブストラクトをChatGPT(GPT-4)に読んでいってもらいましょう。
Golden RN, Nemeroff CB, McSorley P, Pitts CD, Dubé EM. Efficacy and tolerability of controlled-release and immediate-release paroxetine in the treatment of depression. J Clin Psychiatry. 2002 Jul;63(7):577-84. doi: 10.4088/jcp.v63n0707. PMID: 12143913.
Efficacy and tolerability of controlled-release and immediate-release paroxetine in the treatment of depression
Abstract
Background: Antidepressant efficacy may be compromised by early discontinuation of treatment secondary to common, treatment-emergent side effects, including nausea, agitation, and somnolence. Paroxetine controlled-release (CR) was developed to improve general tolerability and, in particular, gastrointestinal tolerability.
Objective: To determine the antidepressant efficacy and tolerability of paroxetine CR in adult patients 18 to 65 years of age with DSM-IV major depressive disorder.
Method: Paroxetine CR (25-62.5 mg/day; N = 212) and paroxetine immediate-release (IR; 20-50 mg/day; N = 217) were compared with placebo (N = 211) in the pooled dataset from 2 identical, double-blind, 12-week clinical trials.
Results: Both paroxetine CR and paroxetine IR exhibited efficacy in major depressive disorder as assessed by the reduction in 17-item Hamilton Rating Scale for Depression total score compared with placebo. Moreover, depressed mood and psychic anxiety symptoms improved as early as treatment week 1 in the paroxetine CR group compared with the placebo group. After 6 weeks of treatment, response and remission rates were 41.5% and 20.5% for placebo, 52.8% and 29.6% for paroxetine IR, and 58.9% and 34.4% for paroxetine CR, respectively. After 12 weeks of treatment, response and remission rates were 61.2% and 44.0% for placebo, 72.9% and 52.5% for paroxetine IR, and 73.7% and 56.2% for paroxetine CR, respectively. Rates of nausea were significantly lower for paroxetine CR (14%) than for paroxetine IR (23%; p < or = .05) during week 1. Rates of dropout due to adverse events were comparable between paroxetine CR and placebo, while significantly (p = .0008) more patients treated with paroxetine IR withdrew from the study prematurely compared with those treated with placebo.
Conclusion: Paroxetine CR is an effective and well-tolerated antidepressant exhibiting symptomatic improvement as early as week 1. Paroxetine CR is associated with low rates of early-onset nausea and dropout rates due to adverse events comparable to those of placebo. The clinical improvement seen with paroxetine CR, coupled with its favorable adverse event profile, suggests a benefit for therapeutic outcome with paroxetine CR.
るるーしゅ
このアブストラクトのPICO及び結果を表にまとめて
P: DSM-IVのうつ病障害を持つ18歳から65歳の成人患者
I: パロキセチン徐放錠(CR; 1日25-62.5 mg)
C: パロキセチン速放錠(IR; 1日20-50 mg)とプラセボ
O: 抗うつ効果(17項目ハミルトンうつ病評価尺度の合計スコアの減少、寛解率および応答率)および容認性(悪心の発生率および有害事象による中止率)
結果
項目 | プラセボ | パロキセチン IR | パロキセチン CR |
---|---|---|---|
応答率(6週) | 41.5% | 52.8% | 58.9% |
寛解率(6週) | 20.5% | 29.6% | 34.4% |
応答率(12週) | 61.2% | 72.9% | 73.7% |
寛解率(12週) | 44.0% | 52.5% | 56.2% |
悪心の発生率(第1週) | N/A | 23% | 14% |
有害事象に よる中止率 | パロキセチン CRと同等 | プラセボよりも有意に 高い (p = .0008) | プラセボと同等 |
結論
パロキセチンCRは、効果的で容認性の高い抗うつ薬であり、治療開始1週間で改善が見られました。パロキセチンCRは、パロキセチンIRに比べて初期の悪心発生率が低く、有害事象による中止率はプラセボと同等でした。臨床的な改善と好ましい有害事象プロファイルから、パロキセチンCRの治療成績に利点があることが示唆されます。
るるーしゅ
批判的吟味して
この論文では、抗うつ薬としてのパロキセチンの制御放出(CR)と速放性(IR)製剤の有効性と容認性を比較しています。以下は、批判的吟味の観点からいくつかのポイントです。
研究デザイン:この研究は、2つの同一の二重盲検無作為化プラセボ対照試験をプールしたデータセットを使用しています。このデザインは、バイアスを減らし、有効性と容認性の比較を可能にするため、信頼性が高いと言えます。
サンプルサイズ:研究は、それぞれのグループで200人以上の患者を含んでおり、結果の信頼性と一般化可能性に対するサンプルサイズの影響を十分にカバーしています。
患者の選択:研究対象は18〜65歳のDSM-IVの大うつ病性障害の患者です。年齢範囲が広いため、結果はより多くの患者に適用できる可能性があります。ただし、65歳以上の患者や青少年については、この研究の結果がそのまま適用できるかどうかは不明です。
効果の評価:17項目ハミルトンうつ病評価尺度(HAMD-17)を用いて効果を評価しています。HAMD-17は、うつ病の症状を評価するための広く使用される信頼性の高い尺度です。しかし、他の尺度や患者自身の評価(例:QOL)も用いることで、より包括的な効果評価が可能になります。
評価期間:試験は12週間行われており、短期的な効果と容認性に関する情報を提供しています。しかしながら、長期的な効果や安全性については、この研究では評価されていません。
結果の解釈:パロキセチンCRは、IRと比較して、早期の吐き気の割合が低く、有害事象による途中脱落率がプラセボと同等であったことから、容認性が高いと結論付けられています
るるーしゅ
吐き気の割合で1週間のデータを出しているのは、チャンピオンデータの可能性はないですか?
吐き気の割合に関して、第1週のデータのみが報告されていることは、確かにチャンピオンデータ(つまり、最も有利な結果を選択的に報告する)の可能性があります。ただし、抗うつ薬の副作用として、吐き気は通常治療開始時に最も顕著であり、徐々に減少することが多いため、第1週のデータは臨床的に意味があるとも考えられます。
しかしながら、吐き気の割合に関するデータが全試験期間(12週間)を通して報告されていないため、論文には一定の限界があります。試験期間全体にわたる吐き気の割合や、他の副作用に関するデータが報告されることで、パロキセチンCRとIRの容認性をより正確に比較できるでしょう
この内容をものの数分で出してくれるのは非常に有用だと思います。また私が吐き気のデータを1週間で切り取って発表するのはチャンピオンデータでは?と質問してもその内容を汲み取り、回答していることに「やばっ」となりました。
お題論文②抗ヒスタミン薬の運転への影響を検討した文献
続いては、レボセチリジン、フェキソフェナジン、ジフェンヒドラミン、プラセボを服用した際の運転への影響を検討した文献をChatGPT(GPT-4)に読んでもらいましょう。
Inami A, Matsuda R, Grobosch T, Komamura H, Takeda K, Yamada Y, Miyake M, Hiraoka K, Maurer M, Yanai K, Tashiro M. A simulated car-driving study on the effects of acute administration of levocetirizine, fexofenadine, and diphenhydramine in healthy Japanese volunteers. Hum Psychopharmacol. 2016 May;31(3):167-77. doi: 10.1002/hup.2524. Epub 2016 Mar 21. PMID: 26999510.
A simulated car-driving study on the effects of acute administration of levocetirizine, fexofenadine, and diphenhydramine in healthy Japanese volunteers
Abstract
Objective: Antihistamines are often used for treating allergic rhinitis. However, many older antihistamines cause sedative side effects. The sedative effects of antihistamines on car-driving have been investigated. This has not been investigated for levocetirizine, a new-generation antihistamine, in Asian populations, and so we evaluated its sedative effects in healthy Japanese subjects.
Methods: In this double-blind, placebo-controlled, four-way crossover study, healthy volunteers received single doses of levocetirizine 5 mg, fexofenadine 60 mg, diphenhydramine 50 mg, and placebo at intervals of at least 6 days. Simple brake reaction time and choice brake reaction time task (CBRT), a lateral tracking (LT) task, and a multiple task, a mixture of CBRT and LT task, were used to compare driving performance between the four drugs. Subjective sedation was also assessed.
Results: The simple brake reaction time and CBRT, and the CBRT component of the multiple task, did not show any significant differences between the drugs. In contrast, the LT, both as a single parameter and as a component of the multiple task, showed significant differences between diphenhydramine and the newer-generation antihistamines in a manner that corresponds with subjective sedation.
Conclusions: Levocetirizine and fexofenadine did not impair psychomotor performance in subjects performing simulated car-driving tasks, while diphenhydramine did impair psychomotor performance in the subjects. Copyright © 2016 John Wiley & Sons, Ltd.
るるーしゅ
このアブストラクトのPICO及び結果を表にまとめて
P: 健康な日本人被験者
I: レボセチリジン 5 mg を1回投与
C: フェキソフェナジン 60 mg、ジフェンヒドラミン 50 mg、およびプラセボを1回投与
O: 自動車運転時の鎮静効果(単純ブレーキ反応時間、選択ブレーキ反応時間タスク(CBRT)、横追跡(LT)タスク、複数タスク)、主観的鎮静感
結果
パラメータ | レボセチリジン | フェキソフェナジン | ジフェンヒドラミン | プラセボ |
---|---|---|---|---|
単純ブレーキ反応時間 | 有意差なし | 有意差なし | 有意差なし | N/A |
選択ブレーキ反応時間 タスク (CBRT) | 有意差なし | 有意差なし | 有意差なし | N/A |
横追跡 (LT) タスク | 有意差なし | 有意差なし | 有意差あり (障害) | N/A |
複数タスク (CBRT と LT) | 有意差なし | 有意差なし | 有意差あり (障害) | N/A |
主観的鎮静感 | N/A | N/A | LT 障害に対応 | N/A |
結論
レボセチリジンおよびフェキソフェナジンは,自動車運転の模擬作業を行う被験者の精神運動能力を低下させなかったが、ジフェンヒドラミンは精神運動能力を低下させた.
るるーしゅ
批判的吟味して
ご指摘の医学論文は、健康な日本人を対象に、抗ヒスタミン剤の自動車運転性能に対する鎮静効果を検討したものです。新世代の抗ヒスタミン薬であるレボセチリジンを、フェキソフェナジン、ジフェンヒドラミン、プラセボと比較したものである。抄録はいくつかの洞察を与えてくれるが、この研究を批判的に検討するには、方法論、サンプルサイズ、統計解析の詳細について、全文を分析する必要がある。しかし、抄録に基づき、我々は以下のような見解を述べることができる。
長所
- 二重盲検、プラセボ対照デザイン。この研究デザインは、バイアスを減らし、結果の信頼性と妥当性を確保するのに役立つ。
- 4ウェイ・クロスオーバー試験。このデザインでは、各参加者がすべての治療を受けることができ、個人差をコントロールすることで研究の内部妥当性を高めることができる。
- 複数のタスクの使用。単純ブレーキ反応時間、選択ブレーキ反応時間課題(CBRT)、横方向追従(LT)課題、複数課題(CBRTとLT課題の混合)を含む、さまざまな自動車運転パフォーマンス課題を用いています。これにより、自動車運転性能に対する鎮静剤の効果を包括的に評価することができる。
制限事項
- 一般化可能性。本研究は、健康な日本人を対象としているため、他のアジア人集団や既往症のある人を含む他の集団への一般化可能性が制限される可能性があります。
- 単回投与。本試験は、抗ヒスタミン剤の単回投与による効果を検証しています。長期間または異なる用量で服用した場合のこれらの薬剤の効果を正確に表すものではない可能性があります。
- 主観的な鎮静の評価。抄録には、主観的鎮静を評価するために使用された方法や、薬剤間の主観的鎮静を比較するために使用された統計解析の詳細が記載されていない。
結論として、本研究は方法論的に健全であると思われるが、完全な批判的評価を行うには、論文の全文にアクセスする必要がある。結果を解釈する際には、一般化可能性と単回投与という点で、いくつかの制限を考慮する必要がある。
るるーしゅ
運転シミュレーションって実際の運転結果とリンクするの?
模擬運転課題による研究結果は、薬が運転能力にどのような影響を与えるかについての有用な知見を提供しますが、実際の運転状況とはまったく相関しない場合があります。 、制御された環境で行われるため、実際の運転状況で遭遇するすべての変数や複雑さを考慮に入れていない可能性があります。交通状況、気象条件、道路状況、運転者の気分など、実際の運転中に運転性能に影響を与える事項があります。
模擬運転課題は、運転スキルに対する潜在的な影響を評価するのに役立ちますが、現実の判定での結果の範囲を完全には捉えられないかもしれません。カーネルに解釈し、その制限を規定する必要があります。
ChatGPTは論文要約に使えるか?
今回は、医学論文のアブストラクトをChatGPTを用いて要約、批判的吟味してみました。
使用してみた実感としては、ChatGPTによる医学論文の要約等は、十分使えるレベルだと感じました。(おそらくこのレベルの要約及び批判的吟味ができる薬局薬剤師はそこまで多くないと思います)
PICOを書きだしてくれたり、結果を表にしてもらうと見やすいですし、記録として残す際にも便利だと思います。
また批判的吟味の内容も、ChatGPTに記載されれば「確かに」となりますが、一人で読んでいると漏れることもあるので有用だなと感じます。
やだおそらくこのChatGPTによる医学論文の要約等も英語の翻訳ツール同様に、ChatGPTが間違えることがあるから、使用するなんてけしからんといった指摘はくるのではないかなと思います。
るるーしゅ
専門家たる者、原著を原文のまま読んでこそだという人もいますからね。
このような意見も分からないことはないですが、私は優秀ではないので、使えるツールと活用して効率的にやっていかないとダメなレベルの薬剤師なので許してください。
ChatGPTはかなり使えるツールだと思っていますので、是非とも活用してみてください。
るるーしゅ
使い方を間違えていて、使えないと評価してしまうのは勿体ないですからね。よかったら関連記事も読んでみてください