為進一步探索藥物臨床試驗中不同特征患者的療效和安全性差異,評估不同亞組可能的獲益-風險,更好的支持對亞組分析結果的解釋,我中心組織起草了《藥物臨床試驗亞組分析指導原則(征求意見稿)》,現在中心網站予以公示,以廣泛聽取各界意見和建議,歡迎各界提出寶貴意見和建議,并請及時反饋給我們。
征求意見時限為自發布之日起1個月。
您的反饋意見請發到以下聯系人的郵箱:
聯系人:衡明莉、辛曉娜
聯系方式:hengml@cde.org.cn,xinxn@cde.org.cn
感謝您的參與和大力支持。
2020年8月28日
附件 1 :《藥物臨床試驗亞組分析指導原則(征求意見稿)》
附件 2 :《藥物臨床試驗亞組分析指導原則(征求意見稿)》起草說明
原文鏈接:http://www.cde.org.cn/news.do?method=viewInfoCommon&id=9bc3c4eeab71cf7f
一、概述
參與臨床試驗的患者由于受各種因素(如遺傳學、人口學、環境、病理生理學、合并癥和合并用藥等)的影響,往往具有不同程度的異質性,從而可能導致試驗藥物在不同患者中的療效不同。臨床試驗中將具有不同特征的患者分組,是探索不同患者人群之間療效差異的直觀方法,同時也是獲益-風險評估不可缺少的一部分。
對于事先未設定亞組分析的臨床試驗,在對結果進行解讀和下結論時需要特別慎重。事后根據數據驅動尋找有統計學意義的亞組,會導致I類錯誤膨脹,其結果通常不能用于確證該亞組的有效性。此外,因亞組的樣本量較少而導致檢驗效能不足,可能會影響試驗藥物在這些亞組人群中療效的精確估計,或者無法得出各亞組間療效是否一致的結論。
本指導原則中將目標適應癥人群稱為總體人群,將通過入排標準納入臨床試驗的人群稱為全人群。亞組人群(簡稱亞群)指總體人群中具有某些特征的一個子集,亞組是全人群中的一個子集。亞組分析是指對試驗藥物在亞組中的療效和/或安全性進行試驗設計與統計分析的過程,亞組是亞群的一個樣本,將亞組結果推廣到亞群時需要考慮亞組對亞群的代表性問題。
本指導原則主要闡述了亞組的識別和定義、亞組分析的類型、一般考慮以及確證性臨床試驗中的亞組分析等方面的內容,旨在為申辦者能夠在臨床試驗中對亞組分析進行正確地設計、實施和評價提供指導性建議。本指導原則主要適用于以支持藥品注冊上市為目的的確證性臨床試驗,也可供以非注冊為目的的臨床試驗參考。
二、亞組的識別和定義
(一)亞組的識別
亞組的識別一般基于早期臨床試驗或確證性臨床試驗的探索性分析,可以使用定量的方法,如交互樹和遞歸分割樹等方法;也可以根據文獻報道或者醫療實踐積累的知識進行識別。
亞組識別主要關注不同亞組間療效的差異及其臨床意義,本質上屬于探索性研究,一般無須控制I類錯誤。進行亞組識別時應考慮的因素包括但不限于以下幾個方面:①臨床上的可解釋性;②臨床上的可操作性;③藥物的作用機理;④定義亞組的變量個數和類型(如連續變量、分類變量);⑤誤分或漏分亞組兩種情況帶來的風險;⑥亞組識別模型的選擇(不宜過于復雜,以避免過擬合)。
(二)亞組的定義
亞組通常由患者的一個或多個內在和/或外在因素(見 ICH E5)來定義,而且應具有一定的臨床意義。這些變量通常是基線變量,包括人口學特征(如年齡、性別等)、實驗室檢查指標、基因組相關標志物、疾病的嚴重程度或分型、臨床狀況(如合并癥、伴隨用藥)、地區(如國家、試驗中心)和環境因素等。
實際應用中,亞組大多由一到兩個變量來定義,例如把研究對象按照年齡分為18-65歲和>65歲兩個年齡組;在抗腫瘤藥物研究中,把患者按照ECOG分數和基因突變(或基因表達)水平,分成不同的亞組。需要注意的是,使用多于兩個變量定義亞組比較少見,主要是因為:①定義亞組的變量過多,容易出現誤分和漏分等情況;②使用多個變量定義亞組時,對亞組分析結果的解釋往往出現困難。當亞組的定義確實需要涉及多個變量時,可以考慮將這些變量通過一定的方法轉換成單一的風險分數,并以此來定義亞組。例如抗腫瘤藥物試驗中常用的ECOG評分反應了患者自我保健、日?;顒雍腕w能狀況等綜合能力。
三、亞組分析的類型
根據研究目的,亞組分析分為探索性亞組分析、支持性亞組分析和確證性亞組分析。對于探索性亞組分析,亞組既可以在設計階段事先定義、也可以在分析階段事后定義(如根據數據驅動劃分的亞組分析)。對于支持性亞組分析,亞組一般應在臨床試驗的設計階段事先定義,并在試驗方案中詳細描述。對于確證性亞組分析,亞組必須在臨床試驗的設計階段事先定義,并在試驗方案中詳細描述。
(一)探索性亞組分析
探索性亞組分析主要用于早期臨床試驗或在確證性臨床試驗的探索性分析中,其目的是發現藥物在不同亞組間療效或安全性方面的差異,進而提出研究假設,以待在后續的臨床試驗中進一步探索和驗證。因此,探索性亞組分析主要關注的是其結果在生物學上的合理性或臨床上的可解釋性,一般無須進行多重性調整。
(二)支持性亞組分析
在確證性臨床試驗中,除了對全人群的主要終點進行分析外,還需要對各亞組的療效進行分析,目的是進一步考察試驗藥物在各個亞組中療效的一致性。如果試驗藥物在各亞組間的療效差異在可接受范圍,可認為試驗藥物在亞組間的療效一致,并為藥物適用于全人群提供進一步支持性證據。如果各亞組間的療效差異超出了可接受的范圍,特別是方向相反時,則亞組分析結果的解釋可能會出現困難,需要對其做進一步的分析和研究。
(三)確證性亞組分析
確證性臨床試驗中,按照預先規定的亞組和多重性調整方法,考察試驗藥物在目標亞組和/或全人群中的療效,其結果應同時具有臨床意義和統計學意義,以支持藥物說明書的撰寫。確證性臨床試驗也可以對目標亞組進行確證性亞組分析,而對其它(非目標)亞組進行支持性或探索性亞組分析,以支持試驗藥物在各亞組人群或全人群中的有效性和安全性的結論,或者為進一步的亞組研究提供線索。
四、一般考慮
(一) 生物學上的合理性及臨床意義
1. 病理生理學和遺傳學的差異
不同患者之間潛在的病理生理學或遺傳學的差異可能導致藥物治療效果的不同。一些臨床綜合征可能有多個潛在的病理學機制,如原發性全身性癲癇有不同的分子病理學基礎,因此使用藥物治療該病的效果往往因不同的發病機制而異。另外,對于一些基礎疾病,由于其可預見的生物學反應的差異,也可能促進亞組分析的使用。例如在減少腎移植排斥反應方面,對于術前免疫致敏的患者在手術期間使用抗淋巴細胞抗體,可以使其獲益更多。此外,很多藥物的療效及不良反應與患者的基因型密切相關,例如對于絕經后婦女補充雌激素,可以增加血漿中高密度脂蛋白膽固醇含量,其效果與雌激素受體基因序列的變異密切相關。
2. 最佳治療時機和合并癥
亞組分析所關注的主要問題之一是在醫療實踐中如何使藥物的療效在不同的亞組或疾病的不同階段達到最優化,例如確定疾病治療的最佳階段、在某一臨床事件發生后的最優治療時間以及治療時機與合并癥之間的關系等。藥物的療效通常取決于疾病的嚴重程度或進展階段,在醫療實踐中經常據此對患者進行分組,以確定藥物的適應癥和最佳時機。例如,急性心肌梗死的溶栓治療對ST段抬高的患者非常有效,而對ST段壓低的患者無效甚至有害;同時,溶栓治療的合適時機是發病6小時以內,且3小時以內效果更好。另外,治療效果也可能與合并癥有關,例如血管緊張素轉換酶抑制劑對合并非腎性高血壓的心衰患者非常有益,但對合并腎血管疾病的患者卻有害。
3. 有效性和安全性亞組分析的差異
亞組通常是根據試驗藥物對亞組人群的有效性來定義的,這樣的分組對安全性分析可能不合適,因為:①藥物的有效性和安全性一般使用不同的臨床終點或者替代終點,其機理可能不同;②定義有效性亞組的變量(例如靶點受體)和安全性亞組的變量(例如年齡等因素)往往不同;③對可能導致潛在危害的藥物,不同亞組患者的耐受程度可能不同(例如病情嚴重的患者為了治療獲益可能更容易耐受一定程度的副反應),此時亞組的獲益-風險評估非常重要。
(二)異質性
亞組分析的主要目的是為了更好地了解試驗藥物在各亞組和全人群中的療效,而是否需要和如何設計亞組分析關鍵在于臨床試驗中目標人群的異質性,這與研究方案中制定的患者入排標準有關。通常,入排標準的限制條件越嚴格,招募的患者異質性就越小,亞組間療效的差異也就相對較??;反之,寬松的入排標準可能導致入組患者的異質性增加,亞組間的療效差異也會增加,不易顯示試驗藥物在全人群中的療效,此時進行亞組分析就顯得非常必要。
(三)可信度
亞組分析結果的可信度評估包括但不限于以下幾個方面:①定義亞組的變量具有生物學上的合理性,即對患者的預后或治療應答的預測有科學依據;②亞組分析結果的可重現性,即在相同或相似條件下的其他臨床研究中,具有相同或相似的亞組效應;③先驗知識的可靠性,即源于外部數據和文獻報告的亞組分析結果具有一定的科學依據。
在研究設計階段,有時基于先驗知識指定用于分層隨機化和亞組分析的變量。這種預先指定亞組變量的方法,通常用在確證性和支持性亞組分析中,蘊含了亞組之間療效有差異的推測,因此得到的亞組分析結果具有一定的可信度。然而,即使亞組變量不是被預先指定,也要予以重視,尤其是對在安全性亞組分析中發現的亞組之間的差異,要特別關注其生物學上的合理性和結果的可重現性。
當亞組的樣本量不足、無法準確估計藥物在亞組中的療效時,應主要考察其生物學上的合理性和結果的可重現性。當亞組療效在試驗條件(如研究設計、目標人群、亞組定義、治療方案、結局測量等)相似的一系列臨床試驗中一致時,即使沒有明確的臨床和生物學方面的解釋,亞組結果也具有一定的可信度。另外,雖然隨機化可以使不同治療組間入組患者的基線變量分布趨于平衡,但由于亞組內樣本量的減少,可能會存在基線不均衡,因此必須檢查藥物在各亞組間療效差異是否是由于基線分布不均衡所致。
(四)主要終點指標與亞組分析
當臨床試驗的主要終點為復合終點時,有些情況下藥物的療效可能只反映在構成復合終點的某一或某些組成終點上,而其余的組成終點則受到試驗藥物以外其他因素的影響,此時,不宜用復合終點進行亞組分析。例如,在一項治療中輕度高血壓的試驗中,以全因死亡率作為主要終點,但對亞組進行分析時發現,試驗藥物降低了男性的全因死亡率,但卻增加了女性的全因死亡率,原因是女性非心血管因素導致的死亡過多,此時對性別的亞組分析采用全因死亡率這一復核終點可能并不合適,而使用心血管因素的死亡專率較為恰當。
當使用多個主要終點指標時,整體治療效果通常是對其綜合分析的結果,如果這些指標具有不同的風險因素,需要考慮這些因素在各亞組的分布,并闡述如何進行亞組分析及其結果的臨床意義。
五、確證性亞組分析
確證性亞組分析是在確證性臨床試驗中對事先指定的目標亞組進行假設檢驗的分析,目標亞組可以作為主要或共同主要分析人群。亞組分析的結果提示不同亞組人群可能的獲益與風險,因此直接影響決策和產品使用說明書的撰寫。確證性亞組分析的臨床試驗需要考慮的關鍵問題包括但不限于以下幾個方面:①亞組的選擇;②試驗設計類型(如固定樣本設計、適應性設計或者適應性富集設計);③多重性;④亞組分析結果的解釋。需要注意的是,把亞組作為主要或共同主要分析人群的試驗設計應考慮亞組的樣本量以及是否使用分層隨機等關鍵問題。
(一)亞組的選擇
確證性亞組分析應在方案中預先規定目標亞組。關于亞組的選擇,如果是基于醫療知識或實踐,例如按照疾病嚴重程度、人口學特征(性別、年齡等)或已知的能夠精確分辨亞組的生物標志物(如基因突變)進行分類,通常具有一定的臨床意義。另一方面,亞組的定義是否合理取決于亞組分類器(如標志物)是否能夠可靠地識別最有可能從藥物中獲益的亞組人群。分類器的確定通?;谠缙谂R床研究數據,由于樣本量往往不足,因此分類器的性能有限,在研究設計時要考慮到這一問題。
(二)試驗設計
在進行確證性亞組分析的樣本量估計時,除了常用的試驗設計參數如期望治療效應大小及其變異度、I類和Ⅱ類錯誤概率之外,還必須考慮亞組分類器分辨亞組的準確度,以及亞組人群在符合入組條件的目標人群中所占的比例。
如果有可靠的證據表明試驗藥物在不同亞組中的療效不同,且其具有生物學上的合理性和重要的臨床意義,可以采用固定樣本量設計,以驗證藥物的療效。此時,臨床試驗的目標人群可以是亞組人群和/或總體人群,其至少有三種設計方案(以標記物舉例):
①如果只有標志物陽性的患者才能從試驗藥物中獲益,入組患者可以僅限于這個亞組。
②如果標志物陽性和陰性的患者都能從試驗藥物中獲益,但陽性患者獲益高于陰性患者,而試驗的主要目的是驗證藥物在陽性患者中的療效,則樣本量和藥物療效的估計可以主要針對標志物陽性的亞組,但建議標志物陰性的亞組也納入試驗,以便更好地了解試驗藥物在該人群中的療效,用于獲益-風險評估或后續研究設計。
③如果標志物陽性和陰性的患者都能從試驗藥物中獲益,但不能確定哪個亞組人群的獲益更大,而試驗的主要目的是驗證藥物在總體人群中的療效,則患者可以在總體人群中招募,也可以在兩個亞組人群中進行分層隨機。如果是后者,則需要注意各亞組樣本量的比例應與目標人群中各亞組人群患者的比例相似,以避免由于過多納入療效較好的亞組人群而夸大了藥物在總體人群中的療效。
如果沒有充分的證據表明不同亞群間的療效差異具有臨床意義時,可以采用適應性設計的方法進行亞組的選擇。例如,當不清楚試驗藥物在標志物陽性和陰性患者中的療效時,可以考慮兩階段適應性設計(即適應性亞組選擇和富集)。第一階段試驗的數據可用于估計藥物在亞組中的療效,然后據此調整第二階段的入組人群及其樣本量。對于適應性設計中的亞組的選擇,應重點考慮試驗設計和統計分析方法的有效性(如是否控制了I類錯誤)。
(三)多重性
多重性是確證性亞組分析中需要重點關注的問題之一。對于將亞組作為共同主要分析的臨床試驗,由于要對全人群和亞組的療效進行多次檢驗,因此如果不進行多重性調整,會增加總I類錯誤。為了將總I類錯誤控制在預設的水平,有多種多重性調整方法,如Bonferroni單步檢驗法、逐步多重檢驗法和回退法等,多重性調整的方法應在方案和統計分析計劃中事先指定。
不同的多重性調整方法各有其優缺點。如果一個亞組和全人群作為共同主要分析人群,則可以用Bonferroni法將α分配給這兩個主要分析人群,即以水平檢驗亞組,以水平檢驗全人群,并且。這里也可以使用回退法。
另外,在沒有足夠的證據表明藥物在全人群和亞組的療效差異時,可以考慮使用逐步多重檢驗法(如Hochberg、Hommel和Simes法),即對多個假設按照一定的順序進行檢驗。如果有足夠的證據表明亞組的療效優于全人群的療效時,可以考慮使用固定順序檢驗策略,即先檢驗亞組療效,如果有統計學意義,再檢驗全人群的療效,否則停止檢驗。
值得注意的是,由于亞組屬于全人群的一部分,使用統計量的聯合分布來確定檢驗界值,可以提高檢驗效能,但由于數據有限,估計統計量的相關系數往往不可靠,并可能增加I類錯誤。因此,使用基于統計量的聯合分布來確定檢驗界值的多重性調整方法需要特別謹慎。
(四)結果的解釋
亞組分析結果的解釋必須具有臨床意義,以支持藥物的上市和說明書的撰寫。例如,在一項臨床試驗中預先以某一目標亞組和全人群共同作為主要的分析人群,經過多重性調整后的統計分析可以得出下述三個結論之一:①與對照組相比,試驗藥物在全人群中的療效差異有統計學意義而目標亞組的療效差異無統計學意義;②目標亞組的療效有統計學意義而全人群的療效無統計學意義;③全人群和目標亞組的療效都有統計學意義。需要注意的是,如果結論③是由于藥物在目標亞組中的療效較大所致,而其余亞組很少甚至不獲益,此時,將其使用限定于該目標亞組可能更加合適。
六、支持性亞組分析
一般情況下,確證性臨床試驗的目的是驗證藥物在全人群中的有效性以及各主要亞組之間療效的一致性,后者通過支持性亞組分析來實現。常用的支持性亞組分析方法包括:①描述性分析(如療效的點估計)和區間估計;②圖形顯示(如森林圖);③模型法(如在主要分析模型中加入藥物與定義目標亞組變量之間的交互作用)。使用何種方法應在方案及統計分析計劃書中充分考慮和說明。
需要指出的是,當各亞組的樣本量較少或亞組間樣本量分布不均衡時,藥物與亞組變量交互作用的檢驗效能往往不足。為此,可以考慮選取寬松的檢驗水準(例如α=0.10)進行檢驗,同時要考慮各亞組間療效差異的臨床意義。如果交互作用顯著,則提示試驗藥物在各亞組間的療效可能不同。
在確證性臨床試驗中,如果試驗藥物的療效在全人群中有統計學意義,通常需要報告亞組分析的結果,包括各亞組療效的點估計及其置信區間。需要注意的是,如果對全人群療效和各亞組的療效同時進行分析,則各亞組療效與全人群療效的方向應該一致,否則需要進一步分析其不一致的原因。
如果各亞組間的療效差異具有臨床意義,應考慮按照以下幾個步驟探索其可能的原因:
①定義亞組的變量是否與相應的預后或預測因素有關。這些因素通常從早期臨床試驗、文獻報告或醫療實踐中獲知,可以是內在因素(如遇藥物代謝酶相關的基因多態性等遺傳因素)、外在因素(如疾病嚴重程度、吸煙狀況和BMI等)或治療方法(如不同劑量的合并用藥)等。
②如果定義亞組的變量與相應的預后或預測因素有關,則應進行進一步分析。如首先分析預后因素是否具有預測作用,如果有預測作用說明該因素會影響患者對藥物的應答或療效;然后,分析預后因素在各亞組的試驗組和對照組中的分布是否均衡,如果不均衡則其可能是亞組間療效差異的原因。
③如果通過上述分析,亞組間療效的差異仍無法解釋,則需考慮進一步的探索性分析以識別造成此差異的其他可能因素,對試驗結果給出合理的解釋。
七、其他考慮
(一)非劣效試驗中的亞組分析
亞組分析在只有陽性對照的雙臂非劣效臨床試驗中要十分謹慎。當在各亞組間對試驗藥療效進行非劣效評價時,其結果依賴于陽性對照藥相對于安慰劑的療效在各亞組中的一致性。若陽性對照藥相對于安慰劑的效應與亞組變量有關時,則非劣效界值的選擇應考慮這些特征變量在研究人群中的分布。由于非劣效界值的確定通常使用歷史數據,因此,如果亞組變量在試驗人群中的分布與歷史數據不同,則會影響非劣效檢驗結論的正確性。要強調的是,非劣效界值的確定應當基于陽性對照藥療效(相對于安慰劑)的盡可能多的歷史數據的meta分析結果,而不是基于主觀選擇部分試驗數據或者部分亞組人群數據的分析結果。
(二)安全性亞組分析
安全性亞組分析主要用于研究與藥物安全性相關的風險因素,即探究具有一定特征的亞組人群可能對藥物產生的不良反應。
獲益-風險評估是亞組安全性分析不可或缺的一部分。安全性亞組分析與有效性亞組分析略有不同。安全性亞組分析雖然可以由預后因素(如年齡、是否有并發癥等)或預測因素(如疾病分期、基因分型等)定義亞組,但前者更為常見。
亞組人群的安全性分析具有一定的挑戰,特別是對低發生率或者潛伏期較長的安全性事件,由于樣本量較小或隨訪時間較短,較難在試驗期間發現和驗證。如果現有數據表明試驗藥物在特定亞組人群中與某一嚴重不良事件(SAE)有潛在的關聯,則可以考慮有針對性地設計一個大型的具有足夠檢驗效能的臨床試驗,驗證試驗藥物在該亞組人群中是否會引起嚴重的不良反應。
(三)與監管機構的溝通
當臨床試驗設計包含確證性亞組分析時,鼓勵申請人就臨床試驗設計中的關鍵問題與監管機構進行溝通。溝通的內容包括但不限于試驗設計的類型、亞組的選擇、I類錯誤控制、一致性和可信性等方面的評價策略。
八、參考文獻
[1] ICH. ICH E5: Ethnic Factors in the Acceptability of foreign Clinical Data E5 (R1). ICH Harmonised Tripartite ( https://database.ich.org/sites/default/files/E5_R1 Guideline.pdf ), 1998.
[2] EMA. Guideline on the investigation of subgroups in confirmatory clinical trials. European Medicines Agency (EMA) ( https://www.ema.europa.eu/en/documents/scientific-guideline/guideline-investigation-subgroups-///confirm/i/i/iatory-clinical-trials_en.pdf ), 2019.
[3] Julien Tanniou, Ingeborg Van Der Tweel, Steven Teerenstra, and Kit CB Roes. Subgroup analyses in confirmatory clinical trials: time to be specific about their purposes. BMC Medical Research Methodology, 16(1):20, 2016.
[4] Mohamed Alosh, Mohammad F Huque, Frank Bretz, and Ralph B D’Agostino Sr. Tutorial on statistical considerations on subgroup analysis in confirmatory clinical trials. Statistics in medicine, 36(8):1334-1360, 2017.
[5] Ilya Lipkovich, Alex Dmitrienko, and Ralph D’Agostino Sr. Tutorial in biostatistics: data-driven subgroup identification and analysis in clinical trials. Statistics in medicine, 36(1):136-196, 2017.
[6] James F Burke, Jeremy B Sussman, David M Kent, and Rodney A Hayward. Three simple rules to ensure reasonably credible subgroup analyses. BMJ, 351:h5651, 2015.
[7] Wei-Yin Loh Loh, Luxi Cao, and Peigen Zhou. Subgroup identification for precision medicine: a comparative review of thirteen methods. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 9(5):e1326, 2019.
[8] Peter M Rothwell. Subgroup analysis in randomised controlled trials: importance, indications, and interpretation. The Lancet, 365(9454):176-186, 2005.
[9] Alex Dmitrienko, Christoph Muysers, Arno Fritsch, and Ilya Lipkovich. General guidance on exploratory and confirmatory subgroup analysis in late-stage clinical trials. Journal of Biopharmaceutical Statistics, 26(1):71-98, 2016.
[10] Alex Dmitrienko and Ralph D’Agostino Sr. Traditional multiplicity adjustment methods in clinical trials. Statistics in Medicine, 32(29):5172-5218, 2013.
[11] Yan D Zhao, Alex Dmitrienko, and Roy Tamura. Design and analysis considerations in clinical trials with a sensitive subpopulation. Statistics in Biopharmaceutical Research, 2(1):72-83, 2010.
[12] Lynda Anne Szczech, Jesse A Berlin, and Harold I Feldman. The effect of antilymphocyte induction therapy on renal allograft survival: a meta-analysis of individual patient-level data. Annals of Internal Medicine, 128(10):817-826, 1998.
[13] David M Herrington, Timothy D Howard, Gregory A Hawkins, David M Reboussin, Jianfeng Xu, Siqun L Zheng, K Bridget Brosnihan, Deborah A Meyers, and Eugene R Bleecker. Estrogen-receptor polymorphisms and effects of estrogen replacement on high-density lipoprotein cholesterol in women with coronary disease. New England Journal of Medicine, 346(13):967-974, 2002.
[14] Fibrinolytic Therapy Trialists. Indications for fibrinolytic therapy in suspected acute myocardial infarc-tion: collaborative overview of early mortality and major morbidity results from all randomised trials of more than 1000 patients. The Lancet, 343(8893):311-322, 1994.
[15] Morris J Brown. Matching the right drug to the right patient in essential hypertension. Heart, 86(1): 113-120, 2001.
[16] Heart Protection Study Collaborative Group . MRC/BHF Heart Protection Study of cholesterol-lowering with simvastatin in 5963 people with diabetes: a randomised placebo-controlled trial. The Lancet, 361 (9374):2005-2016, 2003.
[17] PROGRESS Collaborative Group . Randomised trial of a perindopril-based blood-pressure-lowering regimen among 6105 individuals with previous stroke or transient ischaemic attack. The Lancet, 358 (9287):1033-1041, 2001.
[18] Janet Woodcock and Lisa M LaVange. Master protocols to study multiple therapies, multiple diseases, or both. New England Journal of Medicine, 377(1):62-70, 2017.
[19] Nigel Stallard, Susan Todd, Deepak Parashar, Peter K Kimani, and Lindsay A Renfro. On the need to adjust for multiplicity in confirmatory clinical trials with master protocols. Annals of Oncology, 30(4): 506-509, 2019.
[20] Lu Cui, HM James Hung, Sue Jane Wang, and Yi Tsong. Issues related to subgroup analysis in clinicaltrials. Journal of biopharmaceutical statistics, 12(3):347-358, 2002.
[21] Dennis J Slamon, Brian Leyland-Jones, Steven Shak, Hank Fuchs, Virginia Paton, Alex Bajamonde, Thomas Fleming, Wolfgang Eiermann, Janet Wolter, and Mark Pegram. Use of chemotherapy plus a monoclonal antibody against her2 for metastatic breast cancer that overexpresses her2. New England Journal of Medicine, 344(11):783-792, 2001.
[22] Edward H Romond, Edith A Perez, John Bryant, Vera J Suman, Charles E Geyer Jr, Nancy E Davidson, Elizabeth Tan-Chiu, Silvana Martino, Soonmyung Paik, and Peter A Kaufman. Trastuzumab plus adjuvant chemotherapy for operable her2-positive breast cancer. New England Journal of Medicine, 353 (16):1673-1684, 2005.
[23] Conor A Bradley. Pembrolizumab improves os across pd-l1 subgroups. Nature Reviews Clinical Oncology, 16(7):403, 2019.
[24] Richard M Ransohoff. Natalizumab for multiple sclerosis. New England Journal of Medicine, 356(25): 2622-2629, 2007.
[25] Jie Chen, Joseph Heyse, and Tze Leung Lai. Medical Product Safety evaluation: Biological Models and Statistical Methods. Chapman & Hall/CRC Press, 2018.
[26] Robert Hemmings. An overview of statistical and regulatory issues in the planning, analysis, and inter-pretation of subgroup analyses in confirmatory clinical trials. Journal of Biopharmaceutical Statistics, 24(1):4-18, 2014.
[27] Van Cutsem, E., M. Peeters, S. Siena, Y. Humblet, A. Hendlisz, B. Neyns, J.-L. Canon, J.-L. Van Laethem, J. Maurel, and G. Richardson (2007). Open-label phase iii trial of panitumumab plus best supportive care compared with best supportive care alone in patients with chemotherapy-refractory metastatic colorectal cancer. Journal of Clinical oncology 25(13), 1658-1664, 2007.
[28] Prenen, H., S. Tejpar, and E. Van Cutsem (2010). New strategies for treatment of kras mutant metastatic colorectal cancer. Clinical Cancer Research,16(11): 2921-2926, 2010.
[29] Amado, R. G., M. Wolf, M. Peeters, E. Van Cutsem, S. Siena, D. J. Freeman, T. Juan, R. Sikorski, S. Suggs, and R. Radinsky (2008). Wild-type kras is required for panitumumab efficacy in patients with metastatic colorectal cancer. Journal of Clinical Oncology, 26(10): 1626-1634, 2008.
[30] Cappuzzo, F., T. Ciuleanu, L. Stelmakh, S. Cicenas, A. Szcz´ esna, E. Juhász, E. Esteban, O. Molinier, W. Brugger, and I. Melez´?nek (2010). Erlotinib as maintenance treatment in advanced non-small-cell lung cancer: a multicentre, randomised, placebo-controlled phase 3 study. The lancet oncology, 11(6): 521-529, 2010.
重現性(Reproducibility):臨床試驗的結果可在類似的研究條件下重現的能力。
分類器(Classifier):使用患者的一組特征(如基因表達)和分類標簽(如藥物應答或耐藥)數據,擬合一個分類函數或模型,通過相應的特征對患者進行分類或定義亞組,并可對無標簽的患者進行預測。
風險分數(Risk Score):將多個患者基線特征變量通過一定的方法轉換成能夠預測患者結局的單一變量,后者通常稱為風險分數。
I類錯誤(Type I Error):當原假設為真而檢驗結果拒絕了原假設的錯誤,其概率通常用a表示,并用其作為檢驗水準。
內在因素(Intrinsic Factors):指患者個體的遺傳、生理和病理特征,是一個人“內在”的生物特征,而不是由個人所在的環境決定。
確證性亞組分析(Confirmatory Subgroup Analysis):按照預先制定的計劃,以特定的亞組為研究的主要目標人群,能夠對I類錯誤進行控制的亞組分析,以確證目標亞群患者的療效。
生物學合理性(Biological Plausibility):生物學特征與研究終點(如主要終點、不良事件等)之間因果關聯推理的合理性。
適應性設計 (Adaptive Design):按照預先制定的計劃,在期中分析時根據試驗期間累積的數據對試驗做出相應修改的臨床試驗設計,這種修改又稱為適應性修改。適應性修改計劃必須在臨床試驗開始前的試驗方案和統計分析計劃中預先設定。
適應性富集設計(Adaptive Enrichment Design):按照預先制定的計劃,根據臨床試驗數據的期中分析結果,在保證試驗合理性和完整性的前提下,允許在試驗過程中適應性地更新入排標準,選擇最有可能從治療中獲益的患者入組的自適應設計。
探索性亞組分析(Exploratory Subgroup Analysis):通過亞組分析探索藥物對不同亞組患者可能存在的療效或者安全性上的差異,此類分析通常不對I類錯誤進行控制,主要關注的是其結果在生物學或者臨床上的合理性。
一致性(Consistency):在亞組分析中,不同亞組間顯示出相同或相似的治療效果。
異質性(Heterogeneity):在臨床試驗中,異質性體現在個體和群體兩個水平,前者通常是指患者間具有不同的特征,個體性質或狀態的不同可能會導致不同的患者對治療有不同的應答;后者通常是指不同中心、種族、地域等患者群體具有不同的特征,有可能導致不同患者群體對治療有不同的應答。
外在因素(Extrinsic Factors):指與患者居住地的環境和文化相關的因素。外在因素往往與遺傳和基因無關,更多是由文化和行為決定。
亞組分析(Subgroup Analysis):將患者根據其特征變量值分成不同的亞組、并估計各亞組的療效和/或安全性的分析策略。
支持性亞組分析(Supportivie Subgroup Analysis):通過亞組分析探討藥物的療效和/或安全性在各亞組中的一致性,為試驗全人群的研究結論提供進一步的支持。
中文 |
英文 |
安全性亞組分析 |
Safety Subgroup Analysis |
變異度 |
Variability |
病理生理學 |
Pathophysiology |
Bonferroni單步檢驗法 |
Bonferroni Single-step Procedure |
重現性 |
Reproducibility |
遞歸分割樹方法 |
Recursive Partitioning Tree Method |
多重性 |
Multiplicity |
多重性調整 |
Multiplicity Adjustment |
非劣效界值 |
Noninferiority Margin |
分層隨機化 |
Stratified Randomization |
固定樣本量設計 |
Fixed Sample Design |
回退法 |
Fallback Procedure |
獲益-風險評估 |
Benefit-risk evaluation |
I類錯誤 |
Type I Error |
交互樹方法 |
Interaction Tree Method |
可信度 |
Credibility |
聯合分布 |
Joint Distribution |
描述性分析 |
Descriptive Analysis |
內在因素 |
Intrinsic Factors |
確證性亞組分析 |
Confirmatory Subgroup Analysis |
生物標志物 |
Biomarkers |
生物學合理性 |
Biological Plausibility |
適應性設計 |
Adaptive Design |
適應性富集設計 |
Adaptive Enrichment Design |
探索性亞組分析 |
Exploratory Subgroup Analysis |
外在因素 |
Extrinsic Factors |
原假設 |
Null Hypothesis |
異質性 |
Heterogeneity |
支持性亞組分析 |
Supportive Subgroup Analysis |
逐步多重檢驗法 |
Stepwise Multiple Testing Procedure |
主要終點 |
Primary Endpoint |
準確度 |
Accuracy |
總I類錯誤 |
Familywise Error Rate (FWER) |
示例1:帕博利珠單抗免疫治療小細胞肺癌的亞組分析
在一項PD-1免疫制劑帕博利珠單抗(Pembrolizumab)Ⅲ期臨床試驗中,共納入1274名既往未經治療的局部晚期或轉移性非小細胞肺癌患者(EGFR和ALK基因均無突變),患者PD-L1表達水平TPS≥1%。將其按照1:1的比例隨機分配至兩組,分別接受帕博利珠單抗或鉑類化療,主要終點是預先定義的三個亞群(依次為TPS≥50%,20%≤TPS<50%和1%≤TPS<20%)的總生存率(OS)。分析結果顯示,在中位隨訪期為12.8個月期間內,三個亞組中接受帕博利珠單抗治療的OS均明顯長于接受鉑類化療的患者(第一組: HR=0.69,95%CI=0.56-0.85,P=0.0003;第二組:HR=0.77,95%CI 0.64-0.92,P=0.0020;第三組:HR=0.81,95%CI=0.71-0.93,P=0.0018)。試驗組和對照組的中位OS在三個亞組中分別為20.0 vs 12.2(月)、17.7 vs 13.0(月)和16.7 vs 12.1(月)。據此,FDA將帕博利珠單抗的適應癥擴展到PD-L1表達水平TPS低至1%的非小細胞肺癌患者。
示例2:那他珠單抗治療復發-緩解型多發性硬化癥的獲益-風險評估
那他珠單抗(Tysabri)是第一個由FDA批準用于治療多發性硬化癥(MS)的單克隆抗體。2004年批準后不久該藥就被迫退市,其原因是兩名患者在服用了該藥物后發生了進行性多灶性白質腦?。≒ML),這是一種罕見的不可治愈且易于致命的腦部感染疾?。?8個月的隨訪期內,約有1/1000的患者并發感染PML)。一年后,FDA咨詢委員會開會,重新對患者使用該藥的獲益與風險進行了評估,認為與現有的其他治療方法相比,該藥更有效,患者完全可以接受用藥帶來的風險。于是,FDA于2006年宣布重新上市Tysabri,但只限復發-緩解型多發性硬化癥(RRMS)亞型患者在其他治療失敗或不耐受時使用。這一限制主要是出于安全性考慮,即對活動性不高的非RRMS亞型患者可能受益有限但卻面臨發生PML的風險。
《藥物臨床試驗亞組分析指導原則(征求意見稿)》起草說明
為進一步探索藥物臨床試驗中不同特征患者間的療效和安全性差異,評估不同亞組可能的獲益-風險,提供亞組分析中試驗設計和統計分析過程中的指導性建議,更好的支持對亞組分析結果的解釋,藥品審評中心組織起草了《藥物臨床試驗亞組分析指導原則(征求意見稿)》?,F將有關情況說明如下:
一、背景和目的
參與臨床試驗研究的患者由于受到各種因素的影響,往往具有不同程度的異質性,可能導致試驗藥物在不同患者中的療效不同。亞組通常是指參與臨床試驗的人群的一個子集。在確證性臨床試驗中,科學的定義和識別亞組,驗證試驗藥物在全人群中的有效性以及各主要亞組間療效的一致性,將直接影響研究決策和藥物使用說明書的撰寫。
本指導原則側重于確證性臨床試驗中的確證性和支持性亞組分析策略和方法,目的是通過對含有亞組分析的確證性臨床試驗的嚴謹設計和分析,以評價亞組人群的獲益和風險,為決策提供依據。
二、起草過程
本指導原則的起草小組基于藥審中心與南方醫科大學戰略合作建立的三方學術協調委員會,由學術界、制藥工業界和監管機構代表共同組成,保證了本指導原則高效、高質量完成。
本指導原則自2020年1月正式啟動,分別于2020年5-7月召開了三次線上專家研討會,對指導原則初稿進行了充分的討論和交流,并經藥審中心內部征求意見與審核,歷時7個月最終形成征求意見稿。起草過程中參考了國際其他監管機構如歐盟EMA等制定的相關指南。
參與制訂本指導原則的專家名單見附錄,在此一并致謝。
三、主要內容與說明
本指導原則從亞組的定義和識別、亞組分析的類型、適用范圍、一般考慮等方面闡述亞組分析需要考慮的關鍵問題。對在確證性臨床試驗中如何科學的進行亞組的選擇、分析和結果解釋給出了指導性的建議。全文主要包括概述、亞組的識別和定義、亞組分析的類型、一般考慮、確證性亞組分析、支持性亞組分析、其他考慮以及附錄等內容。
(一)概述
闡述了本指導原則的起草背景、目的和適用范圍。
(二)亞組的識別和定義
主要闡述了亞組的識別應基于不同亞組間的療效差異,一般源于早期研究或確證性臨床試驗的探索性分析。“亞組”通常由患者的一個或多個變量來進行定義,且應具有一定的臨床意義。定義亞組的變量通常為基線變量,包括人口學特征(如年齡、性別)、實驗室檢查指標、基因組相關標志物、疾病的嚴重程度或分型、臨床狀況(如合并癥、伴隨用藥)、地區(如國家、試驗中心)和環境因素等。
(三)亞組分析的類型
根據不同的研究目的,可以分為探索性亞組分析、支持性亞組分析和確證性亞組分析三個類型。詳細闡述了不同類型的亞組定義順序、統計分析(包括是否需要進行多重性調整)和結果的解釋。
(四)一般考慮
詳細闡述了進行亞組分析時需要考慮的關鍵問題,包括生物學上的合理性及臨床意義、目標人群的異質性程度、亞組分析結果的可信度、主要終點指標與亞組分析等方面。
(五)確證性亞組分析
闡述了在確證性臨床試驗中對事先指定的目標亞組進行假設檢驗的確證性亞組分析需要考慮的關鍵問題,主要包括亞組的選擇、試驗設計類型、多重性調整和亞組分析結果的解釋等。
(六)支持性亞組分析
介紹了常用的支持性亞組分析方法,并闡述了在各亞組間的療效差異具有臨床意義時,考慮探索其可能原因的步驟。
(七)其他考慮
亞組分析中還有一些其他需要考慮的問題:包括非劣效試驗設計中的亞組分析、安全性亞組分析以及在進行確證的亞組分析時,申辦方應該就臨床試驗設計中的關鍵問題和監管機構進行溝通。
(八)附錄
附錄部分提供了參考文獻、詞匯表、中英文詞匯對照、亞組分析的研究案例。
參與制訂《藥物臨床試驗亞組分析指導原則(征求意見稿)》的專家名單
外部專家:殷悅
三方學術協調委員會:陳平雁、王駿、狄佳寧
(其余按姓氏筆劃順序):王北琪、王秋珍、王勇、尹平、孫鳳宇、田正隆、閆波、李康、何崑、陳剛、陳杰、陳峰、辛曉娜、歐春泉、趙耐青、賀佳、郭翔、譚銘、衡明莉秘書:吳瑩、段重陽