今回も前回の記事に引き続き,
認知症新薬のアデュカヌマブの効果は,どの程度期待できるのか?
について考えていきたいと思います。
*この記事の記載内容に関し,筆者が開示すべき COI はありません。
前回の復習
まずは前回の記事の内容で取り扱った内容を簡単に復習します。
- アデュカヌマブの第 III 相試験は2本あり(EMERGE・ENGAGE)
- いずれも早期アルツハイマー型認知症・MCI を対象とした国際共同試験
- 中間解析で無益性の判定となり,両試験とも途中中断された(EMERGE 803例,ENGAGE 945 例が解析対象)
- 中断後の後付け解析で,EMERGE では主要評価項目(認知機能スケール CDR-SB)の有意差を示したが,ENGAGE 試験ではプラセボよりも成績が悪かった(EMERGE 1638 例,ENGAGE 1647 例が解析対象)
- アミロイドPETの画像所見は,いずれの試験でも有意に改善させていた
- 「画像改善」という〈代用アウトカム〉をもとに〈迅速承認〉された
- 今後 10 年以内の 市販後検証的試験(第 IV 相試験)で認知機能スケールでの有効性を示すことができなければ,承認取消となる
- また,投与に伴う主なリスクとして,9人ごとに1人 脳内微小出血(NNH 9)を起こし,4人ごとに 1人 脳内浮腫を起こす(NNH 4)
─── データ出典 ───
● NCT: EMERGE試験 (NCT02484547), ENGAGE試験 (NCT02477800)
● FDA: 諮問委審議ページ,提出されたプレゼンテーション
──────────────
今回の本題に入る前に,もう一度治験データの要所だけまとめておきたいと思います(詳細な内容は前回の記事を参照)。
PICO-T
試験の概要 | |
---|---|
P | アミロイド PET 画像所見のある MCI・軽度認知症 |
I | Aducanumab(低用量レジメン or 高用量レジメン) / 4週ごと投与 |
C | プラセボ / 4週ごと投与 |
O | Primary: CDR-SB の baseline からの変化 Secondary: MMSE, ADAS-Cog13, etc の baseline からの変化 |
T | 78 週経過時点(約1年半) |
P:対象者(Patient/Population), I:介入(Intervention)
C:比較対照(Control), O:アウトカム(Outcome), T:期間(Timeframe)
試験結果(ITT)
EMERGE | プラセボ群 (n=548) |
高用量群 (n=547) |
差§[95%CI] | p値 |
---|---|---|---|---|
CDR-SB† | +1.74 | +1.34 | -0.40 [-0.71, -0.10] | 0.010 |
MMSE† | -3.3 | -2.8 | +0.50 | 0.062 |
78週完遂 | 52.6% | 54.7% |
ENGAGE | プラセボ群 (n=545) |
高用量群 (n=555) |
差§[95%CI] | p値 |
---|---|---|---|---|
CDR-SB† | +1.55 | +1.58 | +0.03 [−0.26, 0.33] | 0.83 |
MMSE† | -3.5 | -3.6 | -0.10 | 0.79 |
78週完遂 | 60.9% | 52.9% |
†: ベースラインとの比較(経時的悪化の程度を評価)。
§:ここでの「差」は「プラセボ群のベースラインとの差」と「実薬群のベースラインとの差」の「差」。
▶︎ 総括)
- ENGAGE はプラセボより実薬の方が成績が悪かった(有意差以前の問題)。
- EMERGE のみ,主要評価項目(CDR-SB)で有意差あり。
- ただし CDR-SB は 0.5 点刻み 18 点満点のスケールであり,プラセボとの 0.40 [0.71, 0.10] の差が臨床的に有意かは要検討。
アミロイドPET画像所見の改善
EMERGE amyloid PET | プラセボ (n=157) |
高用量 (n=171) |
p値 |
---|---|---|---|
Adjusted mean change in SUVR from baseline |
0.019 | -0.272 | p<0.001 |
78週完遂 | n=74 | n=87 |
ENGAGE amyloid PET | プラセボ (n=203) |
高用量 (n=181) |
p値 |
---|---|---|---|
Adjusted mean change in SUVR from baseline |
-0.005 | -0.238 | p<0.001 |
78週完遂 | n=104 | n=97 |
*SUVR: standardized uptake value ratio
▶︎ 総括)
- いずれの試験においても,画像所見は明らかに改善させた。
有害事象
- ARIA:アミロイド関連画像異常
- ARIA-E(edema):脳内血管性浮腫;早期中断すれば多くは可逆性
- ARIA-H (hemorrhages) :頭蓋内微小出血や脳表ヘモジデリン沈着
EMERGE | プラセボ群 (n=547) |
低用量群 (n=544) |
高用量群 (n=547) |
---|---|---|---|
ARIA-E | 12 (2.2%) | 140 (25.7%) | 186 (34.0%) |
ARIA-H(微小出血) | 38 (6.9%) | 88 (16.2%) | 102 (18.6%) |
ARIA-H(脳表ヘモジデリン沈着) | 14 (2.6%) | 50 (9.2%) | 73 (13.3%) |
ENGAGE | プラセボ群 (n=541) |
低用量群 (n=548) |
高用量群 (n=558) |
---|---|---|---|
ARIA-E | 16 (3.0%) | 139 (25.4%) | 198 (35.5%) |
ARIA-H(微小出血) | 31 (5.7%) | 85 (15.5%) | 98 (17.6%) |
ARIA-H(脳表ヘモジデリン沈着) | 10 (1.8%) | 48 (8.8%) | 86 (15.4%) |
▶︎ 総括)
- 脳浮腫の NNH 4,脳内微小出血の NNH 9
- 4人ごとに1人余分に脳浮腫を起こし,9人ごとに1人余分に脳内微小出血を起こす。
以上から考えたい数々の問題
上記のデータや迅速承認の経緯からは様々な問題点が見えてきますが,医療統計・医薬品リテラシーの教材として考えた場合,特にポイントとなるのは以下の5点だと思います。
- そもそも本当に「有意」なのか?(多重検定の問題)
- 「代用アウトカムで迅速承認」の問題
- 外的妥当性(一般化可能性)の問題(日本でも使えるデータか?)
- risk/benefit バランス(ARIAと認知機能)
- cost/benefit バランス(値段が高い問題)
前回の記事では〈多重検定の問題〉という観点から,後付けでひねり出された p=0.010 という数値の妥当性,「本当に有意と言えるのか」といった問題について考えました。
今回は前回に引き続き「代用アウトカムで迅速承認(accelerated approval pathway)」が抱える問題について考えてみたいと思います。
最初に結論を述べてしまうと,本稿の要旨は以下の3つです。
- アデュカヌマブの迅速承認は「仮免許」にすぎない
- 代用アウトカムを改善しても真のアウトカムは改善しないことがある
- 「アミロイド PET画像 の改善」が代用アウトカムとして妥当か不明
以下は購読者の方限定となりますが,お付き合いいただければ幸いです。
※この記事の記載内容に関し開示すべき COI は特にありません。
読者コメント