ひびめも

日々のメモです

初期アルツハイマー病に対するレカネマブの効果: 認知症に対する疾患修飾薬

Lecanemab in Early Alzheimer’s Disease.
van Dyck, Christopher H., et al.
New England Journal of Medicine (2022).

 

たまには臨床的なこともちゃんと記事にしてみます。アルツハイマー病に対する疾患修飾薬の、かなり明確なエビデンスが出たとするNEJMの論文です。

 

1. 背景
アルツハイマー病 (AD: Alzheimer's disease) 関連認知症に対する既存の治療薬は、一時的に症状を改善することはできるものの、背景となる疾患経過を変化させることはできない。いくつかのエビデンスは、アミロイドの除去が疾患の進行を遅らせる可能性を示唆している。現在、抗アミロイド抗体の1つ (アデュカヌマブ) は、FDAから迅速承認を受けている。
レカネマブは可溶性アミロイドβ (Aβ) プロトフィブリルに高い親和性で結合するヒト化モノクローナル抗体である。Aβプロトフィブリルは、Aβモノマーや非可溶性フィブリルと比較して、より高い神経毒性を持つことが示されている。初期ADの854人の患者を対象としたphase 2bの用量探索臨床試験では、レカネマブとプラセボの間に、コンポジットスコア (主要エンドポイント) の12ヶ月間変化にベイズ解析上の有意差は認められなかった。しかし、18ヶ月時点の解析では、レカネマブで用量および時間依存性のアミロイド除去効果が認められており、プラセボと比較していくつかの測定項目で臨床的進行抑制が認められた。当該試験では、レカネマブ10mg/kgを2週間ごとに静脈内投与するのが適切な用量と定められ、浮腫や液体貯留を伴うアミロイド関連画像異常 (ARIA-E: amyloid-related imaging abnormalities with edema or effusions) の発生率は9.9% (症候性のものは3%未満) であった。今回我々は、初期AD患者に対するレカネマブの安全性と有効性を決定すべく、phase 3の臨床試験 (Clarity AD) を実施した。

 

2. 方法
2-1. 試験デザインと概観
Clarity ADは、初期AD患者を対象とした、18ヶ月間の多施設二重盲検プラセボ対照平行群試験である。参加者は、レカネマブの静脈内投与群 (2週間ごとに10mg/kg) とプラセボ投与群に、ランダムに1:1の比率で割り当てられた。ランダム化は、臨床的サブグループ (下記に示すような基準に基づいてMCI due to AD群と軽度AD関連認知症群の2つの臨床的サブグループを分類)、現在認可されているAD治療薬 (e.g. コリンエステラーゼ阻害剤やメマンチン) の使用状態、ApoE遺伝子型 (ε4キャリアまたは非キャリア)、地理的領域で層別化した上で行った。試験期間中、参加者たちは血清バイオマーカー検査を受け、さらにオプションとして、amyloid-PET、tau-PET、脳脊髄液中バイオマーカー検査の3つを受けることができた。
本試験は医薬品規制調和国際会議ガイドラインヘルシンキ宣言の倫理的原則に従って行われた。また、試験は各施設の審査委員会または独立倫理委員会によって承認を受けており、すべての参加者は書面でのインフォームドコンセントを受けた。スポンサー企業であるエーザイが試験をデザインし、アカデミア側の著者と協力しながらデータ解析を行い、レカネマブとプラセボを提供し、論文執筆の協力およびそのための資金提供を行った。Biogenも本試験に一部の資金提供を行った。
データ・安全性モニタリング委員会は、ADの専門家と統計学の専門家から構成された独立した組織で、盲検化されていない安全性データをレビューした。医学的モニタリングチームは、試験グループの割り当てを知らないメンバーから構成された独立した組織で、ARIA、投与関連反応、過敏性反応をレビューした。臨床的評価は、安全性評価と試験グループの割り当てを知らない者が行った。すべての著者が、データの完全性と正確性、試験プロトコルの遵守、有害事象の漏れのない報告を保証する。

2-2. 参加基準
試験には、NIAAA criteriaに基づいてMCI due to AD、または軽度AD関連認知症に分類された、50-90歳の参加者が含まれた。アミロイド陽性は、PETまたは脳脊髄液を用いてAβ1-42を測定することで判断した。すべての参加者は、WMS IV Logical Memory IIの年齢調整平均の-1 SD未満のスコアを以って客観的に証明されたエピソード記憶の障害を有していた。

2-3. エンドポイント
主要効果エンドポイントは、18ヶ月時点でのCDR-SB (Clinical Dementia Rating Sum of Boxes) のベースラインからの変化量である。CDR-SBスコアは、ADの臨床試験で用いられる、よく検証されたアウトカム測定手法であり、参加者と介護者にインタビューすることで認知と機能を測定する方法である。具体的には、記憶、見当識、判断力と問題解決、地域社会活動、家庭生活および趣味関心、介護状況という6つのドメインを評価する。それぞれのドメインのスコアは0-3点の範囲内であり、高いスコアほど障害が重いことを意味する。総合スコアは0-18点の間であり、0.5-6点が初期ADとされる。
二次エンドポイントは、18ヶ月時点における、センチロイド法で測定したamyloid-PET (florbetaben、florbetapir、flutemetamolのいずれか) によるアミロイド負荷の変化、ADAS-cog14 (14-item cognitive subscale of the Alzheimer's Disease Assessment Scale; 0-90点で高スコアほど障害が重い) の変化、ADCOMS (Alzheimer’s Disease Composite Score; 0-1.97点で高スコアほど障害が重い) の変化、ADCS-MCI-ADL (Alzheimer’s Disease Cooperative Study - Activities of Daily Living Scale for Mild Cognitive Impairment; 0-53点で低スコアほど障害が重い) の変化である。バイオマーカー評価は、脳脊髄液バイオマーカー (Aβ1-40、Aβ1-42、総tau、リン酸化tau181 [p-tau181]、neurogranin、neurofilament light chain [NfL])、血清バイオマーカー (Aβ42/40比、p-tau181、glial fibrillary acidic protein [GFAP]、NfL) で行った。Tau-PETとvolumetric MRIの結果は完全には解析できなかった。
事前に指定された探索的かつ多重度未調整の解析では、グローバルCDRスコア (0-3点で高スコアほど障害が重い) が悪化するまでの時間を検討した。このエンドポイントは、連続した2回の診察でグローバルCDRスコアが最初に0.5ポイント以上上昇するまでの時間と定義された。

2-4. 統計解析
本試験のサンプルサイズは、主要効果エンドポイントに関するレカネマブとプラセボの比較に基づいて推定された。レカネマブのphase 2b試験のデータに基づくと、プラセボ群では18ヶ月時点でのベースラインからのCDR-SBスコアの変化の推定標準偏差は2.031点で、プラセボに対するレカネマブの推定治療効果は0.373点であった。この推定値は、プラセボと比較してレカネマブで認知機能の低下が25%抑制できたことに対応しており、ADの文献および統計学的原則に基づいて臨床的に意味のある差と見なせる値である。18か月時点での脱落率を20%と想定すると、1566人のサンプルサイズ中、783人がレカネマブ投与を受け、783人がプラセボ投与を受けることで、2標本の両側t検定を用いて90%の検出力で、有意水準0.05の治療効果の差を検出できると考えられた。COVID-19パンデミックの最初の6か月のピークの間に3回以上連続して投与を受けられなかった参加者の存在を考え、サンプルサイズを200人追加した。無益性または有効性に関する中間解析は、計画・実施ともにされなかった。
有効性解析は、modified ITT集団に対して行われた。この集団は、ランダム割り当てを受けた集団のうち、少なくとも1回のレカネマブまたはプラセボ投与を受け、さらに主要有効性 (CDR-SB) のベースライン評価および少なくとも1回の投与後評価を受けた集団として定義された。欠損値に対する主要解析の頑健性を評価するための有効性エンドポイントの感度解析として、欠損値の代入を伴う共分散のランク解析を行った。ARIAによる機能的な脱盲検化の潜在的影響、およびCOVID-19による投与漏れの影響を評価するために、追加の感度分析を行った (Supplementary Appendix)。安全性は、安全性集団 (レカネマブまたはプラセボを少なくとも1回投与された参加者グループとして定義される) において評価された。安全性評価には、有害事象、バイタルサイン、身体診察、臨床検査値、および12誘導心電図のモニタリングが含まれた。ARIAの発生は、9、13、27、53、79週目、およびその3ヵ月後 (91週目) にMRIを撮像することで監視された。また、amyloid-PET、tau-PET、および脳脊髄液中のADバイオマーカーに関するサブスタディの集団は、レカネマブまたはプラセボを少なくとも1回投与し、ベースラインのPETまたは脳脊髄液評価と投与後の評価を少なくとも1回受けた参加者のグループとした。
主要解析は、欠損値の代入を行わないで行った。CDR-SBスコアの18ヶ月時点でのベースラインからの変化の主要解析は、共変量としてベースラインのCDR-SBスコア、固定効果として試験群、来院月、層別変数 (i.e. 臨床的サブグループ、ベースラインでのAD治療薬の使用の有無、ApoE遺伝子型、地理的領域 (北アメリカ、ヨーロッパ、アジア太平洋))、ベースラインのCDR-SBスコアと来院月の交互作用、試験群と来院月の交互作用を含んだ、反復測定のための混合モデルを用いた。主要エンドポイントの群間差が有意であれば、二次エンドポイントを次の順番で階層的にテストした: amyloid-PETのセンチロイドの変化、ADAS-cog14スコアの変化、ADCOMSの変化、ADCS-MCI-ADLスコアの変化。これらはすべてmodified ITT集団に対して行った。それぞれの検定は有意水準0.05で行い、先行する検定が有意差を出したときにのみ行った。デザインと解析方法のさらなる詳細は、Supplementary Appendixおよびprotocolに記載した。

 

3. 結果
3-1. 参加者
5967人がスクリーニングされ、1795人がランダム化を受けた。898人がレカネマブ、897人がプラセボを受けた。試験は2019年3月から2021年3月に行われ、北アメリカ、ヨーロッパ、アジアの計235ヵ所が実施場所となった。参加者の中で、レカネマブ群の729人 (81.2%) とプラセボ群の757人 (84.4%) が試験を完了し、主要エンドポイントの評価のためのデータが揃っていた (図1)。Modified ITT集団は1734人の参加者で構成され (レカネマブ群859人、プラセボ群875人)、安全性集団はランダム化を受けた1795人全員となった。3つのサブスタディについては、698人がamyloid-PET、257人がtau-PET、281人が脳脊髄液中バイオマーカー検査を受けた。サブスタディ群のベースライン特性は、主要解析群のそれと概ね同様であった。本試験では、なるべく多様な地域・人種を含めるように努力を行った (20%が非白人)。米国内でも、スクリーニングされた3638人のうち6.1%、28.1%、そしてランダム割り当てを受けた参加者のうち4.5%、22.5%が、それぞれ黒人、ヒスパニック系であった。参加者のベースライン特性は、2つの試験群間でおおむね同様であった。これらの特性は、初期AD患者を含んだ集団調査で観察された特性と類似している (ただし、米国内では黒人の過小表現とヒスパニック系の過大表現が存在する)。試験集団の表現力は表S1およびSupplementary Appendixに示した。

※ 図1: 42回目の来院 (18か月目) を完了した被験者が、試験を完遂したとみなされた。試験からの主要な脱落原因が不明の場合、脱落原因は"Other"と記載した。ランダム割り当てを受けて少なくとも1回のレカネマブまたはプラセボ投与を受けた参加者をmodified ITT集団と定義し、この集団を対象に主要エンドポイント評価を行った。

※ 表1: 被験者のベースライン特性 (modified ITT集団)。

3-2. エンドポイントの結果

※図2: 主要エンドポイントおよび主な二次エンドポイント。パネルBを除くすべてのパネルは、modified ITT集団の結果を示している。パネルAは、主要エンドポイントであるCDR-SBのスコアを示している。6つのドメインのスコアは0から3まであり、スコアが高いほど障害が大きいことを意味する。合計スコアは0〜18で、0.5〜6のスコアは初期ADを示す。パネルBからEは、二次エンドポイントの結果であり、値は主要エンドポイントのものと同じ方法で算出された。パネルBは、サブスタディとして行われた試験で、florbetaben、florbetapir、flutemetamolのいずれかのトレーサーを使用してセンチロイド法で測定された、PET上のアミロイド負荷のベースラインからの変化に関する結果を示している。パネルCは、ADAS-cog14 (範囲: 0~90、スコアが高いほど障害が大きいことを意味する) の14項目の認知機能サブスケールのスコアのベースラインからの変化に関する結果である。パネルDは、ADCOMS (範囲: 0〜1.97、スコアが高いほど障害が大きいことを意味する) のベースラインからの変化に関する結果を示している。パネルEは、ADCS-MCI-ADL (範囲: 0〜53、スコアが低いほど障害が大きい) のスコアのベースラインからの変化についての結果を示している。

CDR-SBスコアのベースラインでの平均値は、レカネマブおよびプラセボ群でどちらも約3.2であり、初期AD (0.5-6.0点) として合致していた。CDR-SBスコアの18か月時点のベースラインからの変化の調整済み平均値は、レカネマブ群で1.21、プラセボ群で1.66であった (P<0.001) (図2Aと表2)。
698人の参加者を対象に行ったamyloid-PETのサブスタディ (二次エンドポイント) では、ベースラインでのアミロイドレベルはレカネマブ群で77.92センチロイド、プラセボ群で75.02センチロイドであった。アミロイド負荷に関する18か月時点のベースラインからの変化の調整済み平均値は、レカネマブ群で-55.48センチロイド、プラセボ群で3.64センチロイドであった (P<0.001) (図2Bと表2)。Modified ITT集団の中では、ベースラインの平均ADAS-cog14スコアはレカネマブ群で24.45、プラセボ群で24.37であった。ADAS-cog14の18か月時点のベースラインからの変化の調整済み平均値は、レカネマブ群で4.14、プラセボ群で5.58であった (P<0.001) (図2Cと表2)。Modified ITT集団の中では、ベースラインの平均ADCOMSスコアはレカネマブ群で0.398、プラセボ群で0.400であった。ADCOMSの18か月時点のベースラインからの変化の調整済み平均値は、レカネマブ群で0.164、プラセボ群で0.214であった (P<0.001) (図2Dと表2)。Modified ITT集団の中では、、ベースラインの平均ADCS-MCI-ADLスコアはレカネマブ群で41.2、プラセボ群で40.9であった。ADCS-MCI-ADLの18か月時点のベースラインからの変化の調整済み平均値は、レカネマブ群で-3.5、プラセボ群で-5.5であった (P<0.001) (図2Eと表2)。

表2: 主要エンドポイントおよび主な二次エンドポイント (modified ITT集団)。

それぞれの評価項目について、3か月時点ですでに2群が分離していることがグラフ上目で見てもわかる。しかし、中間時点における比較については、事前に解析を計画していなかったため、明確な結論を導くことはできない。

COVID-19の影響 (投与漏れ) と、ARIAによる脱盲検による潜在的なバイアスを評価するためのCDR-SBスコアの感受性解析は、腫瘍解析の結果とおおむね一致していた (表S2)。結果は、主要なランダム化層や、ADに影響を与える他の因子についても一貫していた (図S1-S4)。ApoE ε4ホモ接合体を持つ患者に対する探索的サブグループ解析 (試験参加者の15%) では、ADAS-cog14スコアとADCS-MCI-ADLスコアでレカネマブが数値的には勝っていたが、CDR-SBスコアとADCOMSについてはそうではなかった。脳脊髄液および血清バイオマーカーに関するエンドポイントについて事前に準備した解析の結果では、脳脊髄液中NfLを除くすべての評価項目で、レカネマブが数値的な改善を示した (図S5)。グローバルCDRスコアの悪化までの時間に関する、事前に準備した多重度未調整の解析では、認知症の次のステージへの進行のハザード比は、プラセボに対してレカネマブが数値的に勝っていた (図S6)。

3-3. 安全性
死亡はレカネマブ群で0.7%、プラセボ群で0.8%に生じた (表3)。研究者による評価では、どの死亡もレカネマブまたはARIAの発生とは関連していないと考えられた。重度の有害事象はレカネマブ群の14.0%、プラセボ群の11.3%で生じた。重度有害事象としては、投与関連反応 (レカネマブ群の1.2%、プラセボ群では0%)、ARIA-E (0.8%と0%)、心房細動 (0.7%と0.3%)、失神 (0.7%と0.1%)、狭心症 (0.7%と0%) が多かった。全体的な有害事象の発生率は、2群で同様であった (図3)。試験薬の投与を中止せざるを得ないような有害事象の発生は、レカネマブ群で6.9%、プラセボ群で2.9%であった。多かった有害事象 (被験者の10%以上に起こったもの) は、投与関連反応 (レカネマブ群の26.4%、プラセボ群の7.4%)、脳内微小出血・脳内出血・脳表ヘモジデリン沈着を伴うARIA (ARIA-H; 17.3%と9.0%)、ARIA-E (12.6%と1.7%)、頭痛 (11.1%と8.1%)、転倒 (10.4%と9.6%) であった。投与関連反応は、ほとんどが軽度から中等度 (grade 1 or 2、96%) であり、初回投与で起こった (75%)。参加者の56%は、投与関連反応に対する予防薬 (i.e. NSAIDS、抗ヒスタミン薬、糖質コルチコイド薬) を投与されていなかった。2回目の投与に備えて予防薬を投与された集団のうち、63%ではそれ以上の投与関連反応は起こらなかった。
レカネマブによるARIA-Eの発生は、プロトコル定義文を用いた画像読影では、ほとんどが軽度から中等度 (91%) であった。これらの事象はほとんどが無症候性 (78%) で、治療期間の最初の3か月に起こり (71%)、検出から4か月以内に軽快していた (81%)。レカネマブ群の2.8%が有症候性のARIA-Eを発症し、一般的な症状は頭痛、視覚障害、混乱であった。ARIA-H単独の発症率 (ARIA-Eを起こさなかったもの) はレカネマブ群で8.9%、プラセボ群で7.8%であった。単独かつ有症候性のARIA-Hは、レカネマブ群で0.7%、プラセボ群で0.2%であった。その最も多かった症状はめまいであった。(マクロな) 脳内出血はレカネマブ群の898人中5人 (0.6%)、プラセボ群の897人中1人 (0.1%) で起こった。ARIA-Eと共に起こるARIA-Hは、比較的早期に発症する傾向にあった (6か月以内)。単独のARIA-Hは、試験期間中のいつでも起こった。ARIA-EとARIA-Hは、ApoE ε4の非キャリアでは数値上の発生率は低く、さらにApoE ε4ヘテロ接合体患者と比べてApoE ε4ホモ接合体患者で高頻度に発症した (表3)。

表3: 有害事象。

 

4. 考察
このphase 3試験では、CDR-SBスコアのベースラインからの18か月時点での変化 (主要エンドポイント) はプラセボ群と比較してレカネマブ群で少なく、レカネマブの効果を示していた。臨床的二次エンドポイントも、主要エンドポイントと同様の結果であった。レカネマブは、アミロイドモノマーよりも可溶性のAβ凝集体に高い選択性を示し、アミロイドフィブリルにも中等度の選択性を示す。Amyloid-PETのサブスタディの18か月時点での評価では、レカネマブ群ののアミロイド値は22.99センチロイドであり、アミロイド値の上昇と判断される30センチロイドを下回っていた。また、脳脊髄液および血清中バイオマーカーのサブスタディでも、Aβ、tau、神経変性、神経炎症のマーカーはプラセボ群と比較してレカネマブ群で大きく減少していた (NfLを除く; NfLは神経変性に比較的感受性が低く、他のマーカーと比較して時間変化も緩徐であることが知られている)。
主要エンドポイントであるCDR-SBスコアの臨床的に有意な効果の定義は確立されていないが、本試験では、推定治療差が0.373点となり、前向きに定義された目標を上回った。事前に準備した探索的かつ多重度未調整の解析では、2回の連続した診察でグローバルCDRスコアが0.5点以上悪化するまでの時間について、認知症の次のステージへの進行のハザード比はプラセボに対してレカネマブで数値的に有利であることが示された。Clarity ADの非盲検延長試験は、18カ月以降の安全性と有効性の追加データを提供するために実施中である。
レカネマブ投与群では、ARIA-Eの発症率は12.6%、ARIA-Hの発症率は17.3%であった。これらの発生率を、レカネマブのphase 2b試験 (ApoE ε4キャリアが本試験より過小表現されていた群) における発症率 (ARIA-E 9.9%、ARIA-H 10.7%) と比較されたい。ARIA-Eの発生率は、症候性ARIAを含め、類似の臨床試験より数値的に低かったが、使用された薬剤や試験デザインの違いにより、直接比較することはできない。ARIA-E全体および症候性ARIA-Eの発生率は、ApoE ε4ホモ接合体において最も高かった。
本試験の限界として、特にデータが18か月分しか存在しないことが挙げられる。本試験の延長試験が、現在進行中である。Clarity AD試験はCOVID-19パンデミック中に行われたため、投与漏れ、評価の遅延、疾患併発などの障壁に当たることがあった。脱落率は17.2%であり、投与漏れの影響を評価した感受性解析は主要エンドポイント解析と一致していた。加えて考えられる限界としては、欠損値の代入を行わないmodified ITT解析を用いたことが挙げられる。しかし、代入を行った標準的ITT集団に対して行った感受性解析でも、同様の結果が得られている。最後に、ARIAの発症が参加者および研究者に試験群割り当てを気づかせてしまった可能性がある。我々は、安全性評価と試験群割り当てを臨床評価者にわからないようにすることで、このバイアスを最小化した。さらに、ARIAの臨床的アウトカムに対する効果を調べた感受性解析では、ARIAが結果に影響を及ぼさないことが示された。レカネマブに対する追加の試験として、5年間のphase 2 長期延長試験、初期ADに対する4年間のphase 3 長期延長試験、潜在的ADに対する4年間のAHEAD 3-45試験、顕性遺伝性ADに対する4年間のDIAN-TU Next Generation試験が存在する。
レカネマブは、初期AD患者の脳アミロイドレベルを減少させ、さらに有害事象との関連はあるものの18か月時点での認知機能評価尺度の低下を、プラセボと比較して中等度に抑制することができた。より長期の試験によって、初期ADに対するレカネマブの有効性と安全性を確認できる。

 

結論
・レカネマブは、初期AD患者の18ヶ月後の臨床的な認知機能低下を抑制する。
・レカネマブは、初期AD患者の18ヶ月後の脳アミロイドレベルを減少させる。

 

感想
すごーい!!抗アミロイドβ抗体がアルツハイマー病に効くかもという話は聞いたことはあったものの、ちゃんと有意差が出たのは驚きです。アデュカヌマブのデータが出たときにネットがざわついて、「アミロイド仮説は嘘だったのでは説」も騒がれてましたが、レカネマブでちゃんと疾患修飾薬の効果が実証できたことは、基礎医学的にもすごく重要なことですよね。脳脊髄液中・血清中マーカーや、PETのレベルでも病態の進行抑制 (というか改善) が示せているのがすごいです。認知機能障害自体は進行してしまっていますが、これが延長試験でプラトーに達するなんてことがわかれば、さらに美しいデータの完成ですよね。まあそこまでは期待しすぎでしょうが。
問題は、2週間に1回の静脈内投与が必要なことと、副作用の多さですよね。2週間に1回じゃなくて、せめて1か月に1回であれば...とか思ってしまうのですが、難しいのですよね、きっと。あと、ARIA-EやARIA-Hを患者さんに説明するときは「脳がむくんで頭がいたくなったり、小さな脳出血を起こしたりすることがあります」と言わなきゃいけないと思うのですが、これはかなり恐怖を与えてしまう可能性があり、なかなかハードルが高い問題です。今後、同様の作用機序を持った薬剤が開発されてくるとは思いますが、それらの薬にはこのあたりの問題の解決をぜひ期待したいところです。