2015年7月5日

【P#15】医薬品の開発(3)〜エンドポイント

医薬品の開発について過去2度にわたり触れた(【製薬コラムVol.3】【製薬コラムVol.4】参照)。今回は臨床試験の特にエンドポイントについて取り上げたいと思う。

スクリーンショット 2015-07-02 14.12.38

薬の臨床試験を設計する際に、大切になるのはどのような指標で試験を評価するかである。臨床研究の評価項目として「死亡」はもっとも妥当であると考えられている。というのも、死亡とは、人生の終了点であるからだ。 そこから、終了「end」の点「point」という。そこから、臨床試験の評価項目のことを、エンドポイントと呼ばれるようになった。

iStock_000009315438Small

長期にわたって追跡した臨床試験では、エンドポイントは、死亡率(mortality)、罹病率(morbidity)を明示したものが多く、近年では結果の指標(outcome、outcome measure)の意味で用いられる。

エンドポイントを指標に臨床試験が行われ、統計学的に有意に差があるかどうかが調べられるため、統計学の知識が必須となる。製薬会社には必ず統計の専門家がいて、統計学的に有意な差がでるように患者数が決まってくる。患者数が多くなると、それだけ開発費用が増えていくためである。患者数を決める際には、検定力という知識が必要となるがここでは割愛する。

DSC_2381 のコピー

たまたま偶然の出来事が結果にどれだけ影響を及ぼすかを見るために、統計学的な有意をみるのだが、統計学では確率が5%以下の場合に有意差があると決めている。この有意差を見るために行われる方法を検定という。

1つの臨床研究でのエンドポイント(目的)は1つが望ましい。しかし、最近の多くの臨床試験で見られるように、エンドポイントが多く用いられる。評価項目が多くなればなるほど、統計学的に有意かどうかを調べるために行う検定が増え、検定の多重性の問題にぶち当たる。例えば、10の評価項目があり、検定を10回行えば、全体としては、

1-(1-0.05)(1-0.05)(1-0.05)(1-0.05)(1-0.05)(1-0.05)(1-0.05)(1-0.05)(1-0.05)(1-0.05)=0.60

となり、この場合60%の確率で有意差が出てしまうことになる。

このため、検定の多重性への対処として、エンドポイントに優先順位がつけられている。例えば、癌研究では、癌の治療の次エンドポイント(primary endpoint)に死亡(延命効果)とQOLとし、次エンドポイント(secondary endpoint)を腫瘍縮小(奏効率)と癌の進行抑制にすることである。

飽くまでも統計学から見たら、

次エンドポイントが有意でなく、次エンドポイントが有意である場合には、参考結果とする

となっている。

臨床判断に直接結びつくのではなく、主に薬理的作用のものをサロゲートエンドポイント(surrogate endpoint)という。サロゲートは、真のエンドポイント(hard endpoint)の代わりになることを意味する。真のエンドポイントへの中間経路として観察・測定される値で、早期に結果が必要の場合に用いられる。例えば、心筋梗塞の場合には、血中脂質、IVUSによる血管造影などがサロゲートエンドポイントとして挙げられる。以下にサロゲートエンドポイントの例を挙げた。

疾患 真のエンドポイント サロゲートエンドポイント
心不全 心臓病死亡率 左室駆出率
急性心筋梗塞 30日以内死亡率 再開通率・再狭窄率
狭心症 心筋梗塞発生率 自覚症状・運動耐用能
不整脈 突然死亡率 心電図よりPVC数
高脂血症 血管障害発生率 LDL値などの脂肪量
高血圧 脳卒中発生率・全死亡率 血圧の減少
クモ膜下出血 全死亡率・脳卒中発生率 脳血管攣縮
脳血管障害 神経障害率・全死亡率 諸症状改善
糖尿病 死亡率・合併症発生 血糖値・HbA1c値
全死亡率・無再発率 縮小効果・進行抑制
エイズ 全死亡率 CD4陽性細胞数
骨粗鬆症 骨折率 骨密度
精神疾患 精神状態 心理テストによる得点

折笠秀樹:「臨床研究デザイン」より

エンドポイントは、審査側の当局と各臨床試験の事前相談によって決まる。エンドポイントを見ると、西洋医学で何が重視されているのかがよくわかって興味深い。症状や臨床検査の値を中心に見ており、それが実際に病院で検査値を重視する医師の姿勢に反映されていると思う。

FDA

次に、開発に携わる審査側(当局)の歴史について軽く触れたいと思う。