小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

《藥物臨床試驗適應(yīng)性設(shè)計指導(dǎo)原則》意見稿來了!

 rodneyzhang 2020-05-13

為了促進藥物臨床試驗各相關(guān)方對臨床試驗適應(yīng)性設(shè)計的理解與合理應(yīng)用,經(jīng)廣泛調(diào)研和討論,我中心組織起草了《藥物臨床試驗適應(yīng)性設(shè)計指導(dǎo)原則(征求意見稿)》。
       我們誠摯地歡迎社會各界對征求意見稿提出寶貴意見和建議,并及時反饋給我們,以便后續(xù)完善。征求意見時限為自發(fā)布之日起3個月。
       您的反饋意見請發(fā)到以下聯(lián)系人的郵箱:
       聯(lián)系人:潘建紅、繆欣怡
       聯(lián)系方式:panjh@cde.org.cn,miaoxy@cde.org.cn
       感謝您的參與和大力支持。
                                                                                                                           國家藥品監(jiān)督管理局藥品審評中心
                                                                                                                                         2020年5月13日

《藥物臨床試驗適應(yīng)性設(shè)計指導(dǎo)原則(征求意見稿)》起草說明

一、背景和目的

傳統(tǒng)的臨床試驗多是基于試驗前期有限的數(shù)據(jù)而設(shè)計,容易產(chǎn)生較大的設(shè)計偏差。適應(yīng)性設(shè)計因其可根據(jù)試驗過程中積累的數(shù)據(jù)對試驗做出相應(yīng)的修改,以修正初始設(shè)計時的偏差,從而增加試驗的成功率,提高試驗的效率,使得療效具有優(yōu)勢的藥物能盡快應(yīng)用于臨床實踐。

采用含有適應(yīng)性修改的臨床試驗將對試驗設(shè)計、統(tǒng)計分析方法和試驗操作流程提出更高的要求,因此,監(jiān)管機構(gòu)亟需制訂相關(guān)的指南予以支持并加以規(guī)范。國外一些藥品監(jiān)管機構(gòu)已經(jīng)針對如何在藥物臨床試驗中采用適應(yīng)性設(shè)計展開較多研討,并體現(xiàn)在相關(guān)的指導(dǎo)原則或框架文件中。ICH也于2019年將臨床試驗適應(yīng)性設(shè)計列為正式議題,正在進行國際間的協(xié)調(diào)。

本指導(dǎo)原則定位于支持化學(xué)藥、生物制品和中藥的確證性臨床試驗,同時對探索性研究也提供參考,旨在厘清藥物臨床試驗中適應(yīng)性設(shè)計的相關(guān)定義,明確適應(yīng)性設(shè)計在臨床試驗中的注意事項和適用范圍,以期為工業(yè)界利用適應(yīng)性設(shè)計支持藥物研發(fā)和注冊上市提供科學(xué)可行的指導(dǎo)意見。

二、起草過程

本指導(dǎo)原則的起草小組基于藥審中心與南方醫(yī)科大學(xué)戰(zhàn)略合作建立的三方學(xué)術(shù)協(xié)調(diào)委員會,由學(xué)術(shù)界、制藥工業(yè)界和監(jiān)管機構(gòu)代表共同組成,保證了本指導(dǎo)原則高效、高質(zhì)量完成。

本指導(dǎo)原則自2019年5月正式啟動,分別于2019年7月和10月召開兩次專家研討會,歷時12個月最終形成該征求意見稿,并將其翻譯成英文。

參與制訂本指導(dǎo)原則的專家名單見附錄,在此一并致謝。

三、指導(dǎo)原則框架

本指導(dǎo)原則分為六個部分,內(nèi)容如下:

(一)引言

主要闡述了本指導(dǎo)原則制定的背景、目的和應(yīng)用范圍。

(二)適應(yīng)性設(shè)計中需要考慮的因素

適應(yīng)性設(shè)計是否適用于即將開展的藥物臨床試驗需要慎重思考。由于適應(yīng)性設(shè)計在設(shè)計、實施和統(tǒng)計分析方面的復(fù)雜性,只有在充分考慮采用該設(shè)計的合理性、可行性、完整性后,才可以有效避免或應(yīng)對操作偏倚以及其他各種挑戰(zhàn)。本指導(dǎo)原則對需要考慮的主要因素進行了歸納,并闡明了保證試驗質(zhì)量的操作流程。

(三)常用的適應(yīng)性設(shè)計

本指導(dǎo)原則梳理介紹了幾種常用的適應(yīng)性設(shè)計類型,包括成組序貫設(shè)計、樣本量重新估計、兩階段無縫適應(yīng)性設(shè)計、適應(yīng)性富集設(shè)計、適應(yīng)性主方案試驗設(shè)計、多重適應(yīng)性設(shè)計,以期為藥物研發(fā)時選擇合適的試驗設(shè)計提供思路。該部分內(nèi)容涵蓋對每種設(shè)計類型定義的介紹和適用情景,并梳理了每種設(shè)計類型從合理性、可行性、完整性三方面需要注意的問題,并給出了一定建議。

(四)適應(yīng)性設(shè)計的其他考慮

臨床試驗中適應(yīng)性設(shè)計的應(yīng)用對統(tǒng)計分析提出了新的挑戰(zhàn),本指導(dǎo)原則對在試驗設(shè)計和統(tǒng)計分析時可采用的貝葉斯方法和模擬方法進行了介紹。內(nèi)容包括對以上兩種方法的定義、原理、適用場景、注意事項等的總結(jié)。

(五)監(jiān)管的考慮

鑒于適應(yīng)性設(shè)計的復(fù)雜性,申辦方應(yīng)在設(shè)計試驗時及早與監(jiān)管部門溝通,以便爭取更多的時間用來完善方案。本部分內(nèi)容指出了需要與監(jiān)管部門溝通的幾種場景,并對溝通交流時申辦方應(yīng)提供的資料作出了明確的要求。此外,本部分內(nèi)容還對試驗過程中可能出現(xiàn)臨時需要對試驗方案做出修改,或基于試驗外部數(shù)據(jù)進行方案修改的情況提出了重點考慮內(nèi)容。

(六)附錄

本指導(dǎo)原則的附錄部分包括常見的適應(yīng)性設(shè)計類型的案例和詞匯表。

附錄

參與制訂《藥物臨床試驗適應(yīng)性設(shè)計指導(dǎo)原則》的專家名單

主要執(zhí)筆人: 何崑、陳剛、周賢忠、潘建紅、繆欣怡

三方學(xué)術(shù)協(xié)調(diào)委員會:陳平雁、王駿、狄佳寧

(其余按姓氏筆劃順序):

王北琪、王秋珍、王勇、尹平、田正隆、閆波、李若冰、李康、何崑、陳剛、陳杰、陳峰、歐春泉、周軍、趙耐青、賀佳、郭翔、譚銘、繆欣怡、潘建紅

學(xué)術(shù)秘書吳瑩,段重陽

藥物臨床試驗適應(yīng)性設(shè)計指導(dǎo)原則

(征求意見稿)

國家藥品監(jiān)督管理局藥品審評中心

2020年5月

藥物臨床試驗適應(yīng)性設(shè)計指導(dǎo)原則

一、 引言

本指導(dǎo)原則側(cè)重于討論臨床試驗中采用適應(yīng)性設(shè)計的重要概念和原則,主要從監(jiān)管角度來討論一些常用的適應(yīng)性設(shè)計,提出建議供申辦方在計劃使用適應(yīng)性設(shè)計時予以考慮,同時也提出了一些具體要求,目的是幫助申辦方評估是否采用以及如何進行適應(yīng)性設(shè)計,以支持新藥臨床試驗申請和新藥上市申請。對于申辦方提交的適應(yīng)性設(shè)計方案,監(jiān)管部門會依據(jù)提交的材料及臨床試驗中所涉及的各種因素,在綜合評估后給出具體的咨詢意見。

適應(yīng)性設(shè)計可能會涉及多種統(tǒng)計方法,因此,在具體設(shè)計適應(yīng)性臨床試驗方案時,申辦方應(yīng)同時參考其它相關(guān)的ICH指導(dǎo)原則和國內(nèi)指導(dǎo)原則。

臨床試驗最為常用的設(shè)計是固定樣本量的設(shè)計,也常被稱為傳統(tǒng)設(shè)計,被廣泛地用于確證性試驗,它是指對試驗的數(shù)據(jù)僅在試驗終止時做一次有效性分析并在試驗進行中沒有對試驗進行任何的分析和修改。很多確證性試驗是基于前期有限的數(shù)據(jù)而設(shè)計,有可能存在較大的偏差。如何根據(jù)試驗期間累積的數(shù)據(jù)對試驗做出相應(yīng)的修改從而修正設(shè)計的偏差就成為試驗設(shè)計時需要考慮的一個重要問題。適應(yīng)性設(shè)計是對固定樣本量的設(shè)計進行某些調(diào)整的設(shè)計,本指導(dǎo)原則中適應(yīng)性設(shè)計被定義為:按照預(yù)先設(shè)定的計劃,在期中分析時根據(jù)試驗期間累積的數(shù)據(jù)對試驗做出相應(yīng)修改的臨床試驗設(shè)計,這種修改又稱為適應(yīng)性修改。適應(yīng)性修改計劃必須在臨床試驗開始前的試驗方案和統(tǒng)計分析計劃中預(yù)先設(shè)定。

成組序貫設(shè)計是最早應(yīng)用于臨床試驗的適應(yīng)性設(shè)計,其后,適應(yīng)性設(shè)計較廣范地用于樣本量的重新估計。在2007年歐盟EMA和 2010年美國FDA發(fā)布適應(yīng)性設(shè)計監(jiān)管指南后,適應(yīng)性設(shè)計的研究逐步推廣和發(fā)展到了多種類型的試驗設(shè)計,例如從多個劑量中篩選出具有潛在獲益劑量的設(shè)計,到目前的多個目標(biāo)人群、多個假設(shè)、多個終點和多重檢驗等更為復(fù)雜的設(shè)計。隨著更多新的理論方法不斷地推出以及應(yīng)用經(jīng)驗不斷地增多,越來越多的適應(yīng)性設(shè)計在臨床試驗中得以應(yīng)用,幾乎涵蓋了藥物研發(fā)的各個階段和所有的疾病領(lǐng)域。

許多臨床試驗的失敗源于前期信息有限導(dǎo)致的設(shè)計偏差,而適應(yīng)性設(shè)計因為在試驗期間可以根據(jù)試驗期間累積的數(shù)據(jù)對方案進行修改,以修正初始設(shè)計的偏差,從而顯著增加了試驗的成功率。適應(yīng)性設(shè)計還可以提高試驗的效率,如減少試驗所需要的樣本量、縮短不同研究階段之間的時間間隔、選擇更合適的終點、選擇更合適的目標(biāo)人群、利用相同數(shù)量的受試者獲得更多的數(shù)據(jù)等。此外,復(fù)雜的適應(yīng)性設(shè)計還可以在一個試驗中同時處理多個試驗?zāi)繕?biāo)、多種試驗藥物和多種疾病。

盡管適應(yīng)性設(shè)計具有上述諸多優(yōu)勢,但由于其復(fù)雜性,同時也給試驗設(shè)計、數(shù)據(jù)分析和結(jié)果解釋,特別是試驗的實施,帶來了諸多挑戰(zhàn)和問題,例如,怎樣控制整體I類錯誤率、怎樣選擇分析模型和怎樣估計療效,以及因試驗實施困難可能導(dǎo)致的操作偏倚等,這些都限制了適應(yīng)性設(shè)計的應(yīng)用。

本指導(dǎo)原則主要適用于化學(xué)藥、生物制品和中藥的確證性臨床試驗,對于探索性研究也具有參考意義。

二、 適應(yīng)性設(shè)計中需要考慮的因素

在決定是否采用適應(yīng)性設(shè)計之前,應(yīng)全面深入地權(quán)衡適應(yīng)性設(shè)計和傳統(tǒng)設(shè)計之間的優(yōu)劣,尤其是適應(yīng)性設(shè)計在設(shè)計、實施和統(tǒng)計分析方面的復(fù)雜性,以及由此而帶來的在試驗實施中可能會引入的、不可避免的操作偏倚以及其他各種挑戰(zhàn)。是否采用適應(yīng)性設(shè)計需綜合考慮諸多因素,特別是合理性(validity)、完整性(integrity)和可行性(feasibility)。

(一)合理性

適應(yīng)性設(shè)計的合理性是指所采用的統(tǒng)計分析方法不會導(dǎo)致療效的估計產(chǎn)生偏倚。試驗的合理性是關(guān)于試驗結(jié)果的可信度、可解釋性和說服力的綜合描述。保持試驗的合理性意味著應(yīng)該有正確的統(tǒng)計推斷方法,例如怎樣計算調(diào)整后的p值、怎樣估計效應(yīng)量及置信區(qū)間,以及怎樣衡量不同階段治療效果的一致性。

由于本指導(dǎo)原則的關(guān)注重點是能夠支持注冊的確證性試驗,因此要求試驗的整體I類錯誤率嚴(yán)格控制在雙側(cè)0.05(或單側(cè)0.025)的水平。判斷適應(yīng)性設(shè)計是否合理,最重要的標(biāo)準(zhǔn)是所使用的統(tǒng)計方法能否控制整體I類錯誤率。對有些適應(yīng)性設(shè)計來說,如采用雙側(cè)檢驗,由于不同階段的p值不能反映組間比較的方向,有可能使得最終的整體p值難以解釋。為避免這種情況,可在試驗方案中選擇單側(cè)檢驗。但對另一些適應(yīng)性設(shè)計,例如不對稱的雙邊假設(shè),雙側(cè)檢驗會是更合適的選擇。除了某些特殊情形外,適應(yīng)性修改都需調(diào)整試驗的I類錯誤率。

適應(yīng)性設(shè)計可能同時涉及多個目標(biāo)人群、多個假設(shè)、多個終點或多重檢驗,故對統(tǒng)計分析方法的合理性有著很高的要求。如果對適應(yīng)性修改沒有相應(yīng)的合理有效的統(tǒng)計方法,則不宜采用該設(shè)計。此外,由于適應(yīng)性設(shè)計的復(fù)雜性,在某些情況下沒有適用的統(tǒng)計推斷的理論公式,統(tǒng)計方法的合理性在一定程度上需要基于模擬方法進行驗證,這有可能又增加了額外的不確定性。

適應(yīng)性設(shè)計的分析需要結(jié)合來自多個階段的數(shù)據(jù),各個階段療效估計的不一致性不僅會使基于合并數(shù)據(jù)的統(tǒng)計推斷變得困難,還會導(dǎo)致試驗結(jié)果難以解釋。另外許多適應(yīng)性修改是以達到統(tǒng)計學(xué)陽性結(jié)果為目的,如果最終統(tǒng)計檢驗結(jié)果雖為陽性但臨床獲益太小,也不足以支持所驗證的藥物療效。

(二)完整性

適應(yīng)性設(shè)計的完整性是指對試驗操作所引入偏倚的良好控制。保持試驗的完整性意味著按照預(yù)先設(shè)定的方案進行修改和保持期中分析結(jié)果的盲態(tài),以求最大限度地減少操作偏倚。

避免引入操作偏倚是所有臨床試驗的最基本要求。適應(yīng)性設(shè)計由于涉及臨床試驗許多方面的修改,有可能影響后續(xù)試驗的執(zhí)行,對保持試驗的完整性增加了額外的難度。因此,適應(yīng)性設(shè)計的所有期中分析都應(yīng)該由獨立于申辦方的適應(yīng)性設(shè)計委員會或第三方專家及其獨立統(tǒng)計支持團隊完成,并保證期中分析的結(jié)果不為申辦方、研究者和受試者所知悉,以免影響后續(xù)試驗的執(zhí)行和引入操作偏倚。在大多數(shù)情形下,如果適應(yīng)性設(shè)計不是特別復(fù)雜,可由獨立數(shù)據(jù)監(jiān)查委員會同時負(fù)責(zé)適應(yīng)性調(diào)整的操作和執(zhí)行;如果適應(yīng)性設(shè)計較為復(fù)雜,申辦方可以考慮選擇具備適應(yīng)性修改專業(yè)知識的專家組成獨立數(shù)據(jù)監(jiān)查委員會;如果適應(yīng)性設(shè)計極為復(fù)雜,而數(shù)據(jù)監(jiān)查委員又無足夠的相關(guān)經(jīng)驗,則有必要設(shè)置一個獨立的適應(yīng)性設(shè)計委員會。根據(jù)復(fù)雜的程度,適應(yīng)性設(shè)計委員會中可以包含多名統(tǒng)計師。因適應(yīng)性修改涉及多個環(huán)節(jié),設(shè)立一個有效的防火墻以防止期中分析結(jié)果外泄而造成可能的操作偏倚是執(zhí)行中最為重要的任務(wù)。為此,適應(yīng)性設(shè)計的方案應(yīng)包含一個完善的操作流程,特別是關(guān)于如何設(shè)置相關(guān)信息的訪問權(quán)限。同時,為避免不可控制因素對試驗結(jié)果的影響,還要考慮怎樣避免根據(jù)試驗所做的修改而被間接地推出期中分析的結(jié)果。應(yīng)該注意的是,適應(yīng)性設(shè)計委員會在所有提供給申辦方的任何修改的建議中,均不應(yīng)涉及具體的期中分析結(jié)果。申辦方也要準(zhǔn)備好所有需要的標(biāo)準(zhǔn)操作流程,并將所有涉及適應(yīng)性修改的相關(guān)程序融入其中,同時記錄好所有實際操作的過程以備在申報新藥時審查。以上這些因素都應(yīng)該在試驗的設(shè)計階段仔細考慮,并特別需要在試驗進行中嚴(yán)格地執(zhí)行,以免影響試驗的完整性和試驗結(jié)論的可靠性。

(三)可行性

適應(yīng)性設(shè)計的可行性是指試驗的適應(yīng)性修改能否在實際中實施。由于適應(yīng)性設(shè)計比傳統(tǒng)設(shè)計更為復(fù)雜,并且實施和分析更加困難,在規(guī)劃適應(yīng)性設(shè)計之前,需要考慮以下因素:適應(yīng)性調(diào)整策略應(yīng)該能夠保障試驗的合理性和完整性;相對于試驗周期,應(yīng)該有充裕的時間根據(jù)試驗累積數(shù)據(jù)的分析結(jié)果進行適應(yīng)性修改和后續(xù)試驗的執(zhí)行;期中數(shù)據(jù)收集和數(shù)據(jù)清理應(yīng)該可以快速完成,以便按預(yù)定計劃完成期中分析而無需中途暫停招募受試者;應(yīng)該能夠快速修改隨機化程序/藥物供應(yīng)系統(tǒng);應(yīng)該具備足夠的藥物供應(yīng)管理的能力以及能夠負(fù)擔(dān)增加的藥物供應(yīng);應(yīng)該提前準(zhǔn)備好適應(yīng)性設(shè)計的數(shù)據(jù)采集系統(tǒng);應(yīng)該保證與各相關(guān)方的溝通順暢有效;應(yīng)該能夠配備專業(yè)軟件來完成復(fù)雜設(shè)計和相關(guān)分析的計算等,以滿足試驗運行中適應(yīng)性修改和執(zhí)行的需求。同時,在試驗設(shè)計階段,申辦方可以與研究者溝通,根據(jù)臨床考慮提出一個試驗的目標(biāo)列表,評估所考慮的適應(yīng)性設(shè)計在實際中能夠順利進行的可行性。如果相關(guān)適應(yīng)性修改難以實施,則應(yīng)該考慮其它設(shè)計。

綜上所述,若計劃采用適應(yīng)性設(shè)計,需要仔細地評估其是否確有優(yōu)勢。若無法決策,可以采用模擬方法與傳統(tǒng)設(shè)計比較,以評估適應(yīng)性設(shè)計的效率,并選出較優(yōu)的設(shè)計。如果評估后適應(yīng)性設(shè)計沒有體現(xiàn)出太多的優(yōu)勢,建議謹(jǐn)慎考慮適應(yīng)性設(shè)計。

三、 常用的適應(yīng)性設(shè)計

適應(yīng)性設(shè)計是按照預(yù)先計劃,根據(jù)累積的臨床試驗數(shù)據(jù)的分析結(jié)果,在保證試驗的合理性和完整性的前提下,對臨床試驗方案進行修改。一方面,適應(yīng)性修改是“按預(yù)先設(shè)定的計劃”進行的,而不是臨時提出的修改方案;另一方面,適應(yīng)性修改是一個自我學(xué)習(xí)的過程,即通過對累積數(shù)據(jù)的不斷學(xué)習(xí),相應(yīng)地修改試驗方案,以適應(yīng)不斷變化的研究環(huán)境。因此,適應(yīng)性設(shè)計旨在更好地改進進行中的臨床試驗,而不是因設(shè)計本身缺陷而有極大可能導(dǎo)致臨床試驗失敗所做的臨時補救。

適應(yīng)性設(shè)計在應(yīng)用中涉及范圍很廣,限于篇幅,本指導(dǎo)原則僅討論幾種常用的適應(yīng)性設(shè)計,包括成組序貫設(shè)計、樣本量重估、兩階段無縫適應(yīng)性設(shè)計、適應(yīng)性富集設(shè)計、適應(yīng)性主方案試驗設(shè)計、多重適應(yīng)性設(shè)計。這些設(shè)計的原理和方法也適用于大多數(shù)其他適應(yīng)性設(shè)計。此外,本章節(jié)中所討論的方法將會通過幾個假想的案例予以說明(見附錄2)。

(一)成組序貫設(shè)計

成組序貫設(shè)計是指方案中預(yù)先計劃在試驗過程中進行一次或多次期中分析,依據(jù)每一次期中分析的結(jié)果做出后續(xù)試驗的決策,決策通常有四種可能:①依據(jù)優(yōu)效性終止試驗;②依據(jù)無效性終止試驗;③依據(jù)安全性終止試驗;④繼續(xù)試驗。期中分析的時間可以基于日歷時間,也可基于累積數(shù)據(jù)的占比,如受試者入組比例或發(fā)生目標(biāo)事件數(shù)的比例。如果期中分析至少有一次療效分析,且均有以無效性或優(yōu)效性提前終止試驗的可能,則應(yīng)調(diào)整每次分析的I類錯誤率,并將整體I類錯誤率控制在雙側(cè)0.05(或單側(cè)0.025)水平。調(diào)整I類錯誤率的常用方法包括Pocock方法、O'Brien & Fleming方法和Lan & DeMets方法。由于期中分析僅使用了部分?jǐn)?shù)據(jù),結(jié)果仍有較大的不確定性,評估有效性的方法應(yīng)較為保守以增加結(jié)論的可靠性。無效性終止試驗的設(shè)計分為綁定邊界和非綁定邊界。綁定的無效性邊界會降低拒絕無效假設(shè)的概率,因此可以在控制整體I類錯誤的前提下,適當(dāng)放寬優(yōu)效性邊界,提高得到陽性結(jié)果的概率,但在期中分析結(jié)果一旦跨越無效性邊界時必須終止試驗。非綁定邊界即使在試驗結(jié)果跨越該邊界時,獨立數(shù)據(jù)監(jiān)查委員會基于全面考慮后仍然可以建議試驗繼續(xù)進行。

選擇期中分析的時間點也要仔細考慮。如果成組序貫調(diào)整計劃中存在以優(yōu)效性提前終止試驗的可能,時間點的選擇應(yīng)該考慮期中的數(shù)據(jù)是否充分以便能夠提供可靠的療效估計和安全性評價的結(jié)果,也包括重要的次要終點以及一些重要的亞組結(jié)果的估計。若期中分析是要驗證藥物的安全性和無效性,時間點則應(yīng)該側(cè)重于如何最大程度地保護受試者。

(二)樣本量重新估計

樣本量重新估計是依據(jù)預(yù)先設(shè)定的期中分析計劃,利用累積的試驗數(shù)據(jù)重新計算樣本量,以保證最終的統(tǒng)計檢驗?zāi)苓_到預(yù)先設(shè)定的目標(biāo)或修改后的目標(biāo),并同時能夠控制整體I類錯誤率。

初始樣本量的估計通常取決于效應(yīng)量、主要終點的變異度、試驗隨訪時間、受試者脫落率等諸多因素,而這些常?;谝酝难芯繑?shù)據(jù)。多數(shù)情況下,試驗設(shè)計階段樣本量的估計所需要的參數(shù)信息往往不夠充分,可能會導(dǎo)致錯估樣本量。適應(yīng)性設(shè)計中的樣本量重新估計為此類問題提供了有效的解決方案。

樣本量重新估計的方法可以分為盲態(tài)方法和非盲態(tài)方法。

盲態(tài)方法,也稱為非比較分析方法(non-comparative analysis),是指期中分析時不使用實際試驗分組的信息,或者雖然使用了實際試驗分組的信息,但未做任何涉及組間比較的分析,如在期中分析時對兩個治療組的數(shù)據(jù)合并后做的匯總分析。

盲態(tài)方法的樣本量重新估計是指根據(jù)累積的數(shù)據(jù),計算樣本量的重要參數(shù)(如合并方差或標(biāo)準(zhǔn)差),然后對樣本量進行重新估計,因期中分析時不涉及組間的療效比較,故一般不需要調(diào)整I類錯誤率。該方法比較容易實施,一般不會引入操作偏倚,而且相關(guān)的統(tǒng)計方法也較為完善,只需要在試驗設(shè)計的階段預(yù)先做好規(guī)劃。

非盲態(tài)方法,也稱比較分析方法(comparative analysis),是指期中分析時使用了試驗分組信息(包括各組的真實名稱或可區(qū)分的分組代碼)的分析,分析內(nèi)容涉及組間的比較。

非盲態(tài)方法的樣本量重新估計是指根據(jù)累積數(shù)據(jù)以及分組信息,計算樣本量的重要參數(shù)(如每組的效應(yīng)量),然后對樣本量進行重新估計,因期中分析涉及組間的療效比較,通常需要對I類錯誤率進行相應(yīng)調(diào)整。

非盲態(tài)分析的樣本量重新估計需要預(yù)先在研究方案中闡明,包括何時進行重新估計、決策時使用什么標(biāo)準(zhǔn)、重新估計時使用什么方法、如何調(diào)整檢驗水準(zhǔn)α以便控制整體I類錯誤率、由誰執(zhí)行非盲態(tài)分析,以及最后由誰執(zhí)行整個操作過程。應(yīng)該特別注意,一個試驗中一般建議只做一次樣本量重新估計。當(dāng)重新估計的樣本量少于初次設(shè)計的樣本量時,除非有非常特別的理由,通常不接受樣本量減少的調(diào)整。

適應(yīng)性設(shè)計中是否采用非盲態(tài)樣本量重新估計需要考慮多種因素。例如,若有比較可靠的前期數(shù)據(jù),非盲態(tài)下樣本量重新估計是否必要?采用非盲態(tài)下樣本量重估所付的代價(如檢驗水準(zhǔn)調(diào)整)與初始設(shè)計時略微放大樣本量相比,哪種策略更為有利?期中分析能否很快完成,是否可能因為入組較快完成而導(dǎo)致沒有充足時間用來調(diào)整試驗?在什么時間點進行期中分析?因此,設(shè)計應(yīng)根據(jù)試驗本身的特點,仔細考慮各種因素,然后選擇出最合適的方法。

樣本量重新估計的方法有很多文獻可供參考,可根據(jù)具體試驗選擇一種合適的方法。

(三)兩階段無縫適應(yīng)性設(shè)計

兩階段無縫適應(yīng)性設(shè)計,是指將一個試驗分為兩個階段,在第1階段結(jié)束時進行期中分析,依據(jù)預(yù)先設(shè)定的判斷標(biāo)準(zhǔn),對第2階段的試驗進行適應(yīng)性修改。無縫設(shè)計通常分為操作無縫設(shè)計和推斷無縫設(shè)計。操作無縫設(shè)計可將第一階段試驗受試者排除在主要分析之外,不需要對I類錯誤進行調(diào)整。推斷無縫設(shè)計在主要分析中包含第一階段試驗受試者,并根據(jù)自適應(yīng)的性質(zhì)和假設(shè)檢驗策略作出相應(yīng)的調(diào)整。

根據(jù)試驗?zāi)繕?biāo)和試驗終點,兩階段設(shè)計一般可分為四種類型,即同目標(biāo)/同終點、同目標(biāo)/不同終點、不同目標(biāo)/同終點和不同目標(biāo)/不同終點。任何一個兩階段無縫適應(yīng)性設(shè)計都可以被適當(dāng)?shù)貧w類,可根據(jù)具體試驗選擇合適的方法。

如果試驗在兩個階段的試驗組數(shù)也相同,成組序貫設(shè)計可視為同目標(biāo)/同終點試驗中的一個特例。兩階段無縫試驗中,常見的是I/II期無縫適應(yīng)性設(shè)計和II/III期無縫適應(yīng)性設(shè)計。前者多用于探索性試驗,在第1階段可能會探索一個生物標(biāo)記,并在第2階段探索其早期有效性;后者常用于確證性試驗,在第1階段可做劑量選擇,并在第2階段驗證其有效性。

獨立的II期試驗通常包括多個試驗組,如相同藥物的多個劑量水平,目的是選出合適的劑量并決定是否進行III期試驗。III期試驗是一個獨立于II期的試驗,其最終分析并不包含II期試驗的數(shù)據(jù),這種設(shè)計沒有充分地利用II期試驗的數(shù)據(jù)。推斷無縫適應(yīng)性設(shè)計的最終分析則包含了試驗的兩個階段入組的所有受試者的數(shù)據(jù)。這種設(shè)計具有很多優(yōu)點,例如可以縮短通常由II期試驗結(jié)束時到III期試驗開始時的時間間隔、減少試驗的總樣本量、縮短試驗的時長、減少試驗的費用、增加最終分析的樣本量等。同時,因第1階段入組的受試者有更長的隨訪時間,或能更早地觀察到藥物的長期安全性。

采用無縫II/III期適應(yīng)性設(shè)計需要考慮多種因素。由于期中分析時對第1階段結(jié)果可能無法進行全面深入地分析,加之選擇一個III期試驗的劑量還會涉及很多其他因素,以及適應(yīng)性設(shè)計可能帶來的設(shè)計、操作和執(zhí)行方面的困難,因此,如果對試驗藥物了解甚少,一般不宜選擇兩階段無縫適應(yīng)性設(shè)計。還有一些情形,采用兩階段無縫適應(yīng)性設(shè)計可能會有較大的風(fēng)險。例如,III期試驗的主要終點需要較長的隨訪時間,第1階段或許只能夠用替代終點進行判斷,當(dāng)替代終點與主要終點關(guān)聯(lián)性不高甚至較差時,用替代終點選擇III期試驗的劑量會帶來很大的不確定性。又如,在達到主要終點所需要的時間較長而入組時間又較短的情況下,為避免過多的受試者進入未選中的劑量組,需要暫停入組等待期中分析的結(jié)果,由此可能會引發(fā)出其他的問題。

以上討論的兩階段適應(yīng)性設(shè)計的方法也可以直接應(yīng)用于其他類似的試驗,例如第1階段涉及不同藥物的選擇,或者聯(lián)合用藥和單藥的選擇。

(四)適應(yīng)性富集設(shè)計

以兩階段無縫適應(yīng)性設(shè)計為背景,適應(yīng)性富集設(shè)計(adaptive enrichment design)是指試驗第1階段結(jié)束后,根據(jù)期中分析的結(jié)果,依據(jù)預(yù)先設(shè)定的標(biāo)準(zhǔn)對目標(biāo)人群進行適應(yīng)性調(diào)整,以決定第2階段的目標(biāo)人群。試驗的第2階段可能繼續(xù)在全人群中進行,或者僅入組亞群并有可能需要做一些對應(yīng)的適應(yīng)性調(diào)整,或者加大樣本量繼續(xù)入組全人群,這同時也自然地加大了亞群的入組率。試驗的最終分析目標(biāo)可能僅是全人群,或可能僅是亞群,或可能是全人群和亞群,其側(cè)重點則由α的分配比例來決定。試驗的最終分析將包含試驗的兩個階段入組的所有受試者的數(shù)據(jù),并有相應(yīng)的調(diào)整方法以控制整體I類錯誤率。

如果已知試驗藥物只對某特定亞群有效,那么,臨床試驗應(yīng)該只在該亞群中招募受試者。但實際中更為常見的情形是試驗藥物有可能對某亞群有較大的療效,但不清楚對全人群是否也有足夠大的療效。在這種情況下,如果試驗藥物對全人群有足夠大的療效,只入組亞群受試者就會失去顯示對全人群有效的機會;如果試驗藥物對全人群療效較小但對某亞群有效,入組全人群受試者極有可能得不到預(yù)期的陽性結(jié)果,同時也失去了顯示對亞群有效的機會。采用兩階段無縫適應(yīng)性設(shè)計來選擇目標(biāo)人群,利用試驗本身的結(jié)果以便可以更科學(xué)地選擇出目標(biāo)人群,增加藥物研發(fā)的成功率。

因為適應(yīng)性設(shè)計中目標(biāo)人群的選擇涉及全人群和亞群,如果第1階段的期中分析采用非盲態(tài)下的組間比較,應(yīng)明確定義兩個人群的統(tǒng)計假設(shè)和相應(yīng)的統(tǒng)計方法,以控制整體I類錯誤率。

對于目標(biāo)人群的選擇標(biāo)準(zhǔn),可以基于疾病特征、預(yù)后生物標(biāo)志物或預(yù)測生物標(biāo)志物等各種標(biāo)準(zhǔn)。一般而言,采用公認(rèn)的疾病相關(guān)特征或預(yù)后相關(guān)生物標(biāo)志物來選定目標(biāo)人群,試驗的設(shè)計和操作會相對簡單。目前,采用預(yù)測生物標(biāo)志物來選擇目標(biāo)人群的研究日趨增多,但許多預(yù)測生物標(biāo)志物的臨床價值尚不明確。如果試驗要用一個全新的預(yù)測生物標(biāo)志物來選擇目標(biāo)人群,必須要有對應(yīng)的診斷方法。所用診斷方法必須已經(jīng)被監(jiān)管部門批準(zhǔn)上市,如果沒有,可能需要同時研發(fā)。如果試驗數(shù)據(jù)最終不支持所研發(fā)的體外診斷試劑(未能獲得器械監(jiān)管部門批準(zhǔn)上市申請),會直接導(dǎo)致試驗中關(guān)于試驗藥物的結(jié)論也不可靠。此外,如果需要同時研發(fā)伴隨治療的體外診斷試劑尚未確定亞群界定的閾值,若使用部分前期入組的受試者來確定閾值,這些受試者應(yīng)該從最終的分析數(shù)據(jù)集中剔除,以免最終的陽性結(jié)果難以解釋。為更好的理解生物標(biāo)志物預(yù)測的準(zhǔn)確性和全面評估試驗的結(jié)果,通常鼓勵將非目標(biāo)人群的信息也納入研究。

在未能充分了解亞群中藥物效應(yīng)的情況下,決定是否采用適應(yīng)性設(shè)計選擇目標(biāo)人群較為困難,同時也有較大的風(fēng)險。如果無視有療效的目標(biāo)亞群,在全人群中可能得不到陽性結(jié)果,或者即使在全人群中得到了陽性結(jié)果,但在非目標(biāo)亞群患者中實際無效,從而導(dǎo)致倫理問題。另一方面,如果實際有療效的目標(biāo)人群為全人群和若干亞群,而通過試驗僅僅選擇出了其中的一個亞群,導(dǎo)致有效的藥物得不到充分地利用。

(五)適應(yīng)性主方案試驗設(shè)計

主方案試驗設(shè)計是指一個整體臨床試驗方案含有多個子方案,不同的子方案可同時檢驗一種藥物對于多種疾病的臨床效果,也可同時檢驗多種藥物對于一種疾病的臨床效果,或者同時檢驗多種藥物對于多種疾病的臨床效果。每一個子方案可以是單臂試驗,也可以是隨機對照試驗。如果子方案都是隨機對照試驗,各個子方案有可能共用一個對照組,也可能有各自的對照組。主方案試驗也用來泛指由患者特定特征(如疾病、組織學(xué)類型、分子標(biāo)記物)為標(biāo)志的臨床試驗。主方案試驗具有很多優(yōu)點,例如能夠為患者提供最大的入組機會并選擇最合適的受試藥物的機會。常見的主方案設(shè)計包括籃式試驗、傘式試驗和平臺試驗。

適應(yīng)性主方案設(shè)計是指在主方案設(shè)計中包含了一種或多種適應(yīng)性調(diào)整的設(shè)計,它可以靈活地采用多種適應(yīng)性調(diào)整,例如添加一個或多個新的子方案,提前結(jié)束一個或多個子方案,重新估計樣本量,調(diào)整檢驗的假設(shè)、主要終點和主要統(tǒng)計方法,或?qū)Σ煌淖臃桨冈O(shè)計做不同的適應(yīng)性調(diào)整。

主方案試驗需要統(tǒng)一管理,設(shè)有統(tǒng)一管理機構(gòu),如機構(gòu)審查委員會、獨立數(shù)據(jù)監(jiān)查委員會、獨立審查委員會。實施時需要采用中央隨機化系統(tǒng)、電子數(shù)據(jù)采集系統(tǒng)、中央標(biāo)本庫和實驗室,使用統(tǒng)一設(shè)計的病例報告表、知情同意書和臨床監(jiān)查人員等。

籃式設(shè)計旨在評估一種藥物治療具有同一種生物學(xué)特征的不同疾病類型的臨床效果,該設(shè)計在一個整體臨床試驗方案中含有多個子方案,通常每一個子方案都是一個單臂試驗,而每一個子方案都針對一種或多種疾病類型。在腫瘤學(xué)領(lǐng)域,有時使用腫瘤組織學(xué)進行傳統(tǒng)的試驗非常困難或很難實現(xiàn),而基因測序和全基因組分析已經(jīng)實現(xiàn)了詳細的分子生物學(xué)分類,籃式試驗就是為了適應(yīng)這一新的分類變化提出的。

傘式設(shè)計旨在評估多種藥物針對同一種疾病或生物標(biāo)記物類型的靶向治療的臨床效果,該設(shè)計在一個整體臨床試驗方案中含有多個子方案,每一個子方案針對一種或多種藥物,可能是單臂試驗或隨機對照試驗。傘式試驗常用來為確證性研究選擇候選藥物,也可用來作為確證性研究。

平臺設(shè)計旨在評估多種治療針對多種疾病的臨床療效,該設(shè)計在一個整體臨床試驗方案中包含有多個子方案,每一個子方案都是一個隨機對照試驗,一般會采用同一個對照組。平臺試驗通常會維持試驗長期進行,并允許新的試驗藥物隨時加入試驗平臺,同時,對照藥物隨著時間推移也可能變更。

主方案試驗雖然具有很多優(yōu)點,但由于其復(fù)雜性,在計劃、執(zhí)行、統(tǒng)一管理結(jié)構(gòu)的建立、尤其是統(tǒng)計分析等方面都面臨著較大地挑戰(zhàn)。如果計劃采用主方案試驗,應(yīng)在試驗各個方面可能涉及的各種問題做全面、深入和細致的研究后,再慎重選擇。

(六)多重適應(yīng)性設(shè)計

多重適應(yīng)性設(shè)計是指一個試驗中采用兩種或兩種以上適應(yīng)性調(diào)整方法的試驗設(shè)計。以上所討論的適應(yīng)性設(shè)計方法都可以同時用于同一個臨床試驗。例如,一個臨床試驗在第1階段結(jié)束時確定了下階段的用藥劑量,其后需要做樣本量重新估計,再其后需要選擇目標(biāo)人群。

原則上講,如果一個臨床試驗設(shè)計包含了多種適應(yīng)性調(diào)整,只要符合合理性、完整性和可行性的要求,多重適應(yīng)性設(shè)計都可以考慮。由于多重適應(yīng)性設(shè)計的復(fù)雜性,建議慎重地考慮一個試驗中是否的確有必要引入過多的適應(yīng)性調(diào)整。

四、 適應(yīng)性設(shè)計的其他考慮

(一)貝葉斯方法的應(yīng)用

貝葉斯適應(yīng)性設(shè)計是指一個使用了貝葉斯方法并同時含有適應(yīng)性調(diào)整的試驗設(shè)計。貝葉斯方法是一類統(tǒng)計方法,它根據(jù)貝葉斯原理將一個分布函數(shù)(先驗分布)總結(jié)的前期試驗的信息/數(shù)據(jù)和目前試驗中得到的數(shù)據(jù)結(jié)合在一起,從而得到一個用來總結(jié)這些信息/數(shù)據(jù)的新的分布函數(shù)(后驗分布),并基于此后驗分布函數(shù)做出統(tǒng)計推斷的方法。前期試驗的信息/數(shù)據(jù)可以基于目前試驗中將要檢驗的藥物,也可以基于其他相關(guān)的藥物。

在臨床試驗中,首要任務(wù)是要得到一個準(zhǔn)確和可靠的藥物療效估計。有時可以用一個先驗分布來總結(jié)前期試驗的信息/數(shù)據(jù)得到一個藥物療效的初始估計。因為前期試驗的信息/數(shù)據(jù)不夠充分或有其他的不確定性,其本身不能夠得到一個準(zhǔn)確和可靠的療效估計,需要在目前的試驗中收集更多的數(shù)據(jù)。根據(jù)新收集的數(shù)據(jù),對療效的初始估計(先驗分布)進行更新并得到一個新的估計(后驗分布)。用貝葉斯方法得出的療效估計??梢暈榍捌谠囼灥男畔?數(shù)據(jù)和目前試驗的數(shù)據(jù)以某種特定方式而做出的加權(quán)平均,即如果沒有目前試驗的數(shù)據(jù),療效估計就會全部基于前期試驗的信息/數(shù)據(jù);如果有目前試驗的數(shù)據(jù),療效估計就是一個加權(quán)平均。目前試驗的數(shù)據(jù)的權(quán)重會隨著其數(shù)據(jù)量的增加而加大,并向1趨近。

本指導(dǎo)原則中討論的使用基于頻率理論的適應(yīng)性設(shè)計大都可用于貝葉斯適應(yīng)性設(shè)計。由于貝葉斯方法在統(tǒng)計推斷中使用了前期或相關(guān)的信息/數(shù)據(jù),在某些方面它自然有其優(yōu)越性。貝葉斯方法的靈活性是可用一些統(tǒng)計模型來借用相關(guān)的數(shù)據(jù)。在很多情形下,獨自進行一個達到合適樣本量的臨床試驗會比較困難,若用貝葉斯方法來借用相關(guān)的數(shù)據(jù)從而得到更為可信的結(jié)論或許有其必要性。例如,兒童的臨床試驗中借用成人臨床試驗中的數(shù)據(jù);在罕見病中由于無法入組足夠多的病人而借用類似的疾病適應(yīng)癥的數(shù)據(jù);在某一區(qū)域沒有入組足夠的病人而借用相鄰區(qū)域的數(shù)據(jù);在一個非劣性臨床試驗中借用過去試驗中的數(shù)據(jù)從而減少對照組的病例數(shù)。貝葉斯方法對這些借用都會給出定量的分析和解釋。

盡管貝葉斯方法在某些方面具有優(yōu)越性,其最大的問題是統(tǒng)計推斷的結(jié)果有不確定性。使用同樣的前期試驗的信息/數(shù)據(jù)和目前試驗的數(shù)據(jù),若選擇不同的先驗分布或者即便選擇相同的先驗分布而使用不同的參數(shù)值,貝葉斯推斷也可能得出不同的結(jié)論。另外貝葉斯方法在最終的統(tǒng)計推斷時也無公認(rèn)的方法來選擇決策標(biāo)準(zhǔn)。因為這些問題,目前貝葉斯方法更多地用于Ⅰ期臨床試驗中藥物劑量的探索,Ⅱ期臨床試驗中用于選擇后續(xù)研發(fā)策略,Ⅲ期臨床試驗中的期中分析時的無效性推斷和一些預(yù)測分析,以及其他很多不以注冊為目的的分析。

由于適應(yīng)性設(shè)計的復(fù)雜性以及基于頻率理論的統(tǒng)計方法的局限性,盡管貝葉斯方法有其不足,在一些設(shè)計中使用貝葉斯方法或許是一種更為合適的選擇。如果使用貝葉斯方法,需要有足夠的前期信息/數(shù)據(jù)、文獻和研究以支持所使用的統(tǒng)計模型的合理性,包括所選擇的先驗分布及各個參數(shù)值。另外由于貝葉斯推斷基于先驗分布和參數(shù)值的選擇而導(dǎo)致的不確定性,還需要通過大量模擬結(jié)果來說明在各種假想的,有可能在實際中發(fā)生的情形下方案的實施特性,特別是要通過模擬顯示試驗中基于后驗概率所定義的決策標(biāo)準(zhǔn)是否合理,例如可用對應(yīng)于基于頻率理論的統(tǒng)計方法的整體I類錯誤率來衡量所選擇的決策標(biāo)準(zhǔn)。再者,還要考慮使用貝葉斯方法在實際中的可行性,例如如何向研究者解釋各種統(tǒng)計模型的意義,基于后驗概率所定義的決策標(biāo)準(zhǔn)的意義,藥物療效估計的解釋,基于不等應(yīng)答適應(yīng)性概率的隨機分組是否給受試者帶來額外的安全性風(fēng)險,以及更新應(yīng)答適應(yīng)性概率所帶來的延遲是否會使入組的實際操作變得極其困難等問題。這里的應(yīng)答適應(yīng)性概率是指根據(jù)已入組的病人的數(shù)據(jù)計算出的各個試驗組的療效,并以此概率來重新更新未來病人的隨機入組的比例。

鑒于貝葉斯方法中面臨的許多挑戰(zhàn),若采用貝葉斯方法,需要仔細和慎重考慮以上所討論的各種問題,事先做好研究和規(guī)劃。

(二)模擬方法的應(yīng)用

基于模擬方法的適應(yīng)性設(shè)計是指在適應(yīng)性試驗中,基于模擬方法考察所做統(tǒng)計推斷的合理性。在臨床試驗中,統(tǒng)計檢驗是在統(tǒng)計假設(shè)下基于某個分布理論或近似的正態(tài)分布理論而做出的統(tǒng)計推斷。這些分布理論或近似的正態(tài)分布理論所要求的條件在傳統(tǒng)的臨床試驗中一般都會得到滿足。為了適應(yīng)藥物研發(fā)的需求,許多新穎、復(fù)雜的試驗設(shè)計不斷出現(xiàn),例如主方案試驗同時涉及多個目標(biāo)人群、多個假設(shè)、多個終點或多重檢驗,這對推導(dǎo)統(tǒng)計檢驗的分布理論提出了新的挑戰(zhàn)。在很多極其復(fù)雜的試驗中,基于分布理論的條件有可能不再滿足,因此借助模擬方法來建立統(tǒng)計推斷所需要的依據(jù)經(jīng)常是唯一的選擇。

統(tǒng)計模擬試驗的最大優(yōu)點是在假設(shè)的臨床試驗情形下能更好地了解試驗特性。具體到臨床試驗的模擬,重要的是,怎樣選擇模擬的模型和參數(shù)使其盡可能合理地描述試驗在實際中發(fā)生的情形,并能夠控制整體I類錯誤率。因為有很多關(guān)于統(tǒng)計模擬的文獻可供參考,其涉及的模擬方法、計算機語言、模擬軟件、模擬誤差的控制等諸多計算細節(jié)就不在此一一討論。

若無明確的分布理論依據(jù),通過模擬方法來證明臨床試驗中統(tǒng)計檢驗的整體I類錯誤率能在零假設(shè)下完全得到控制從理論上來說是不可能的。整體I類錯誤率涉及整個零假設(shè)空間,即假設(shè)試驗和對照藥物療效相同,這從理論上來說有無窮的可能性,故任何一個模擬都無法窮舉所有的情形以便驗證。怎樣在模擬中排除一些明顯不合理的情形使其更符合實際,則需要從疾病特征和歷史數(shù)據(jù)來考慮,并使基于縮小的零假設(shè)空間的模擬結(jié)果從統(tǒng)計角度仍具有可靠性。另外在模擬時,除了考慮怎樣選擇主要參數(shù)外,還要考慮滋擾參數(shù)、入組率、脫落率/刪失率、隨訪時間和模擬的準(zhǔn)確率等諸多其他因素。在選擇這些參數(shù)后,再加入適應(yīng)性設(shè)計中涉及的各種修改,以及有可能涉及的多個目標(biāo)人群、多個終點和多重檢驗,以便顯示所提出的統(tǒng)計方法在臨床試驗中經(jīng)過多重調(diào)整后的I類錯誤率仍可得到控制。

鑒于基于模擬方法的統(tǒng)計推斷具有不確定性,除非應(yīng)用的適應(yīng)性設(shè)計非常有必要,并且比傳統(tǒng)的臨床試驗確有很大的優(yōu)勢,否則需要綜合各個方面的因素再進行慎重地選擇。如果有充足的醫(yī)學(xué)文獻、前期的數(shù)據(jù)等證據(jù)顯示應(yīng)用適應(yīng)性設(shè)計具有必要性,并且可靠的模擬方法、模擬結(jié)果顯示適應(yīng)性設(shè)計確實具有很大的優(yōu)越性,則可以考慮一個基于模擬方法的適應(yīng)性設(shè)計。

五、 監(jiān)管的考慮

鑒于適應(yīng)性設(shè)計的復(fù)雜性,申辦方應(yīng)在設(shè)計試驗時及早與監(jiān)管部門溝通,以便爭取更多的時間用來完善方案。

(一)與監(jiān)管部門的溝通

對于以探索性研究為目的的適應(yīng)性設(shè)計,不一定需要與監(jiān)管部門溝通交流。但是,若試驗有可能影響很多受試者的安全性,如病例數(shù)較大的主方案試驗;或試驗的早期以探索性研究為目的,但晚期有可能演化成以確證性研究為目的,則有必要與監(jiān)管部門進行溝通交流。通常以確證性研究為目的的適應(yīng)性設(shè)計都應(yīng)與監(jiān)管部門提前進行溝通交流,以便在設(shè)計早期有充分的時間考慮監(jiān)管部門的建議、顧慮或意見,尤其是對于復(fù)雜或采用了全新方法的設(shè)計。凡經(jīng)備案的與監(jiān)管部門達成的一致意見應(yīng)反映在修訂的試驗方案中。

(二)對申報資料的要求

申辦方準(zhǔn)備遞交的資料應(yīng)包含所有用來支持采用適應(yīng)性設(shè)計的理論、文獻和數(shù)據(jù)以便監(jiān)管部門審評。資料的準(zhǔn)備應(yīng)主要圍繞預(yù)先設(shè)定的調(diào)整計劃,充分論述醫(yī)學(xué)意義、合理性、完整性和可行性。

醫(yī)學(xué)意義是判斷采用適應(yīng)性設(shè)計是否合適的重要因素。申報資料中應(yīng)包含用來支持調(diào)整后試驗結(jié)果仍然具有醫(yī)學(xué)意義的充分證據(jù)。比如,在經(jīng)過一次或多次調(diào)整后,對試驗結(jié)果的解釋有可能變得非常困難,或者試驗結(jié)果最終達到統(tǒng)計學(xué)陽性但無醫(yī)學(xué)意義。

合理性主要針對的是統(tǒng)計方法,最重要的判斷標(biāo)準(zhǔn)是所使用的統(tǒng)計方法能否將整體I類錯誤率控制在雙側(cè)0.05(或單側(cè)0.025)的水平。申報資料中應(yīng)包括預(yù)先設(shè)定的調(diào)整計劃,所有調(diào)整的程序和細節(jié),以及所引用的全部文獻。如果適應(yīng)性設(shè)計極為復(fù)雜且無具體的理論公式,可能需要通過模擬方法來說明。申辦方在計劃時需要考慮模擬結(jié)果能否經(jīng)過第三方獨立的驗證。

完整性考慮的是試驗的操作和執(zhí)行,判斷標(biāo)準(zhǔn)是所使用的設(shè)計不會因操作或執(zhí)行引入偏倚。申報資料中應(yīng)包含所有操作流程,特別是怎樣設(shè)定防火墻以保證分析結(jié)果不被泄露。對于數(shù)據(jù)監(jiān)查委員會負(fù)責(zé)的適應(yīng)性調(diào)整,可參考其他相關(guān)的指導(dǎo)原則。

可行性旨在評估試驗可能要做的適應(yīng)性修改能否在實際中實施,這一點需要申辦方做出綜合判斷。

以上只是申報資料應(yīng)該包含的基本內(nèi)容。如果申辦方認(rèn)為還有其它資料有助于與監(jiān)管部門的溝通交流,也可一并申報遞交。

(三)其他的考慮

原則上,適應(yīng)性設(shè)計中的修改計劃必須在臨床試驗開始前的試驗方案和統(tǒng)計分析計劃中預(yù)先設(shè)定。一般來說不建議對試驗進行非預(yù)先設(shè)定的修改。但在臨床試驗的操作實踐中,基于本試驗中的數(shù)據(jù)提示需要對試驗進行非預(yù)先設(shè)定的修改,此時應(yīng)經(jīng)過謹(jǐn)慎考慮后在保證不破壞試驗的合理性、完整性及可行性的前提下對試驗做出合理的修改,并需提前與監(jiān)管機構(gòu)進行溝通確認(rèn)。此外,基于外部數(shù)據(jù)對于一個進行中的臨床試驗做出某些修改,并不屬于適應(yīng)性修改,而是通過試驗方案的修正案來體現(xiàn),通常需與監(jiān)管部門進行溝通。根據(jù)外部數(shù)據(jù)對試驗方案進行修改的情形有很多,例如,某試驗中對標(biāo)志物為陰性的病人藥物毒性太大或者同一類藥物剛完成的試驗顯示僅對標(biāo)志物為陽性的病人有效,需要修改目標(biāo)人群僅為陽性病人;同一類藥物剛完成的試驗顯示某主要終點的選擇不合適,或新發(fā)布的相應(yīng)指南對主要終點另有定義,需要修改主要終點;新的標(biāo)準(zhǔn)治療的改變,需要修改標(biāo)準(zhǔn)治療的對照組,或因無法繼續(xù)入組病人而需要提前終止試驗。申辦方尤其要注意這些修改是僅基于外部數(shù)據(jù),而非基于進行中的試驗本身的結(jié)果。

參考文獻

1. CDE. 臨床試驗數(shù)據(jù)監(jiān)查委員會的建立和實施指導(dǎo)原則. 2020

2. Bauer P, K?hne K. Evaluation of experiments with adaptive interim analyses. Biometrics1994; 50:1029–1041, correctioninBiometrics1996; 52:380.

3. Bauer P,Kieser M. Combining different phases in the development of medical treatments within a single trial. Statistics in Medicine 1999; 18: 1833-1848.

4. Bauer P,Posch M. Letter to the Editor. Modification of the sample size and the schedule of interim analyses in survival trials based on data inspections by H. Schaefer and H.-H. Mueller, Statistics in Medicine 2001; 20: 3741–3751. Statistics in Medicine 2004; 23: 1333–1335.

5. Chang M. Adaptive design method based on sum of p-values. Statistics in Medicine 2007; 26:2772–2784.

6. Chen C, Li X, Li W, Beckman RA. Adaptive Expansion of Biomarker Populations in Phase 3 Clinical Trials. Contemporary Clinical Trials2018;71:18-85.

7. ChenJYH, DeMets DL, Lan GKK. Increasing the sample size when the unblinded interim results is promising. Statistics in Medicine 2004; 23:1023-1038.

8. ChowSC, Chang M. Adaptive Design Methods in Clinical Trials. CRC Press;2nd edition 2011.

9. Chow SC, Shao J, Wang H, Locknygina Y. Sample size calculations in clinical research. Chapman & Hall/CRC, 3rd edition2018.

10. Cui L, Hung HMJ, Wang SJ. Modification of sample size in group sequential clinical trials. Biometrics 1999; 55:853-857.

11. EMA Scientific Guidelines: Reflection paper on methodological issues in confirmatory clinical trials planned with an adaptive design. https://www.ema./en/human-regulatory/research-development/scientific-guidelines;2007.

12. FDA Draft Guidance for Industry. Adaptive Designs for clinical trials of drugs and biologics. https://www./drugs/guidances-drugs/all-guidances-drugs2018.

13. Friede T, Kieser M. Sample size recalculation in internal pilot study designs: a review. Biometrical Journal2006;48:537–555.

14. Friede T, Parsons N, Stallard N. A conditional error function approach for subgroup selection in adaptive clinical trials.Statistics in Medicine2012; 31:4309–4320.

15. Friede T, Stallard Nigel. A comparison of methods for adaptive treatment selection. Biometrical Journal 2008;50:767–781.

16. Gould AL. Interim analyses for monitoring clinical trials that do not materially affect the Type I error rate. Statistics in Medicine 1992; 14:1039-1051.

17. HochbergY. A sharper Bonferroni procedure for multiple tests of significance. Biometrika1988; 75: 800–802.

18. Jenkins M, Stone A, Jennison C. An adaptive seamless phase II/III design for oncology trials with subpopulation selection using correlated survival endpoints. Pharmaceutical Statistics 2011; 10:347–356.

19. Lan KG,DeMetsDL.Discrete Sequential Boundaries for Clinical Trials. Biometrika1983; 70:659–663.

20. Lehmacher W, Wassmer G. Adaptive sample size calculations in group sequential trials. Biometrics 1999; 55: 1286–1290.

21. Maca J, Bhattacharya S, Dragalin S. et al.Adaptive Seamless Phase II/III Designs Background, Operational Aspects, and Examples. Drug Information Journal 2006; 40: 463-474.

22. Marcus R, Peritz E, Gabriel KR. On closed testing procedures with special reference to ordered analysis of variance.Biometrika1976; 63:655–660.

23. Müller HH, Sch?fer H. Adaptive group sequential designs for clinical trials: Combining the advantages of adaptive andof classical group sequential approaches. Biometrics2001; 57:886–891.

24. Müller HH, Sch?fer H. A general statistical principle for changing a design any time during the course of a trial. Statistics in Medicine2004; 23:2497–2508.

25. O’Brien PC, Fleming TR. A Multiple Testing Procedure for Clinical Trials.Biometrics 1979; 549–556.

26. Pocock SJ, Group Sequential Methods in the Design and Analysis of Clinical Trials. Biometrika 1977; 64:191–199.

27. Proschan MA, Hunsberger SA. Designed extension of studies based on conditional power. Biometrics 1995; 51:1315–1324.

28. Rosenblum M, Van Der Laan MJ. Optimizing randomized trial designs to distinguish whichsubpopulations benefit from treatment. Biometrika 2011; 98: 845-860.

29. Shih WJ. Sample size re-estimation – a journey for a decade. Statistics in Medicine 2001; 20:515-518.

30. Shih WJ, Li G, Wang Y. Methods for flexible sample-size design in clinical trials: Likelihood, weighted, dual test, and promising zone approaches. Contemporary Clinical Trials 2016; 47: 40-48.

31. Simes RJ. An improved Bonferroni procedure for multiple tests of significance. Biometrika 1986; 73:751–754.

32. Stallard N, Hamborg T, Parsons N, Friede T. Adaptive designs for confirmatory clinical trials with subgroup selection. Journal of Biopharmaceutical Statistics2014; 24:168–187.

33. Wang SJ, Hung HMJ, O’Neill RT. Adaptive patient enrichment designs in therapeutic trials. Biometrical Journal2009;51:358–374.

34. Wassmer G, Brannath W. Group sequential and confirmatory adaptive designs in clinical trials. Springer; 2016.

35. Wu PS, Lin M, Chow SC. On sample size estimation and re-estimation adjusting for variability in confirmatory trials. Journal of Biopharmaceutical Statistics2016; 26:44-54.

36. Zhang JJ, Blumenthal G, He K, Tang S, Cortazar P, Sridhara R. Overestimation of the effect size in group sequential trials. Clinical Cancer Research 2012; 18: 4872-4876.

附錄1、詞匯表

期中分析(Interim analysis):是指在試驗期間使用試驗累積數(shù)據(jù)進行的任何分析。同一試驗中,可以設(shè)計有一次或多次期中分析。

適應(yīng)性設(shè)計(Adaptive design):按照預(yù)先設(shè)定的計劃,在期中分析時根據(jù)試驗期間累積的數(shù)據(jù)對試驗做出相應(yīng)修改的臨床試驗設(shè)計,這種修改又稱為適應(yīng)性修改。適應(yīng)性修改計劃必須在臨床試驗開始前的試驗方案和統(tǒng)計分析計劃中預(yù)先設(shè)定。

合理性(Validity):適應(yīng)性設(shè)計的合理性是指所采用的統(tǒng)計分析方法不會導(dǎo)致療效的估計產(chǎn)生偏倚。試驗的合理性是關(guān)于試驗結(jié)果的可信度、可解釋性和說服力。

完整性(Integrity):適應(yīng)性試驗的完整性是指對試驗操作所引入偏倚的良好控制。保持試驗的完整性意味著按照預(yù)先設(shè)定的方案進行修改和保持期中分析結(jié)果的盲態(tài),以求最大限度地減少操作偏倚。

可行性(Feasibility):適應(yīng)性試驗的可行性是指試驗的適應(yīng)性修改能否在實際中實施。

成組序貫設(shè)計(Group sequential design):是指方案中預(yù)先計劃在試驗過程中進行一次或多次期中分析,依據(jù)每一次期中分析的結(jié)果做出后續(xù)試驗的決策。

盲態(tài)/非比較分析方法(Blinded/Non-comparative analysis):是指期中分析時不使用實際試驗分組信息,或者雖然已知實際試驗分組信息,但未做任何涉及組間比較的分析,如在期中分析時對兩個治療組的數(shù)據(jù)合并后做的匯總分析。

非盲態(tài)分析/比較分析方法(Non-blinded/Comparative analysis):是指期中分析時使用試驗分組信息(包括各組的真實名稱或可區(qū)分的分組代碼)的分析,分析內(nèi)容涉及組間比較。

兩階段無縫適應(yīng)性設(shè)計(Two-stage seamless adaptive design):是指將一個試驗分為兩個階段,在第1階段結(jié)束時進行期中分析,依據(jù)預(yù)先設(shè)定的判斷標(biāo)準(zhǔn),對第2階段的試驗進行適應(yīng)性修改。

適應(yīng)性富集設(shè)計 (Adaptive enrichment design):是指試驗第1階段結(jié)束后,根據(jù)期中分析結(jié)果,依據(jù)預(yù)先設(shè)定的標(biāo)準(zhǔn)對目標(biāo)人群進行適應(yīng)性調(diào)整,以決定第2階段的目標(biāo)人群。

主方案試驗設(shè)計(Master protocol design):是指一個整體臨床試驗方案含有多個子方案,不同的子方案可同時檢驗一種藥物對于多種疾病的臨床效果,也可同時檢驗多種藥物對于一種疾病的臨床效果,或者同時檢驗多種藥物對于多種疾病的臨床效果。

適應(yīng)性主方案設(shè)計(Master protocol with adaptive designs):是指在主方案設(shè)計中包含了一種或多種適應(yīng)性調(diào)整的設(shè)計。

多重適應(yīng)性設(shè)計(Multiple adaptive design):是指一個試驗中采用兩種或兩種以上適應(yīng)性調(diào)整方法的試驗設(shè)計。

貝葉斯方法(Bayesian method):是一類統(tǒng)計方法,它根據(jù)貝葉斯原理將一個分布函數(shù)(先驗分布)總結(jié)的前期試驗的信息/數(shù)據(jù)和目前試驗中得到的數(shù)據(jù)結(jié)合在一起,從而得到一個用來總結(jié)這些信息/數(shù)據(jù)的新的分布函數(shù)(后驗分布),并基于此后驗分布函數(shù)做出統(tǒng)計推斷的方法。

貝葉斯適應(yīng)性設(shè)計(Bayesian adaptive design):是指一個使用了貝葉斯方法并同時含有適應(yīng)性調(diào)整的試驗設(shè)計。

基于模擬方法的適應(yīng)性設(shè)計(Simulation-based adaptive design):是指在適應(yīng)性試驗中,基于模擬方法考察所做統(tǒng)計推斷的合理性。

附錄2、適應(yīng)性設(shè)計案例

示例中涉及的各種試驗設(shè)計內(nèi)容、統(tǒng)計方法選擇,以及具體參數(shù)設(shè)置僅為便于簡潔闡述設(shè)計要點,并不具有普遍適用性和全面性。

示例1:成組序貫設(shè)計試驗

假想一個多中心、隨機、雙盲、陽性藥平行對照的III期優(yōu)效性臨床試驗,目的是驗證試驗藥對某適應(yīng)癥的癥狀改善效果,主要終點是治療52周時某連續(xù)型變量較基線的變化值,并可假設(shè)該變量近似服從正態(tài)分布。

試驗采用成組序貫設(shè)計,期中分析計劃為:在入組n1例受試者時進行第一次期中分析(安全性分析),n2例時進行第二次期中分析(無效性分析),n3例時進行第三次期中分析(有效性或無效性分析)。

基于上述設(shè)計,根據(jù)預(yù)期的效應(yīng)參數(shù)(如兩組變化值的均數(shù)及共同標(biāo)準(zhǔn)差)、檢驗效能(如 90%)、各組分配比例、設(shè)定的整體I類錯誤率水平(如單側(cè)0.025)及相應(yīng)的控制方法等,可計算出試驗所需的總樣本量,并制定三次期中分析的決策策略如下:

1) 第一次期中分析時,由獨立數(shù)據(jù)監(jiān)查委員會(DMC)綜合分析安全性數(shù)據(jù),如果DMC認(rèn)為試驗藥物存在較嚴(yán)重的安全性問題,可建議終止試驗。此次期中分析僅以安全性為目的,因此無需進行α調(diào)整。

2) 第二次期中分析時,考察對照組的主要終點變化值相較于試驗組是否更優(yōu),若對照組較優(yōu),則因試驗藥物無效性提前終止試驗。此次期中分析僅考察無效性,不涉及有效性判斷,因此無需進行α調(diào)整。

3) 第三次期中分析時,采用非綁定邊界方法,將針對試驗藥物療效的統(tǒng)計檢驗所得P值與兩條邊界進行比較,邊界值的確定基于某一αβ的消耗函數(shù)方法,如果P值小于下邊界, 則以有效性提前終止試驗;如果P值大于上邊界, 則由DMC經(jīng)綜合考慮后提出試驗終止或繼續(xù)進行的建議;如果P值在上下界值之間,則試驗繼續(xù)進行。

示例2:盲態(tài)下樣本量重估

假想一個隨機、雙盲、安慰劑平行對照的III期優(yōu)效性臨床試驗,主要終點為訪視第4周時某量表評分相對于基線的變化值,并假設(shè)其近似服從正態(tài)分布。預(yù)期試驗組與對照組主要終點指標(biāo)之差的總體均數(shù)為6.0,標(biāo)準(zhǔn)差為10.0,設(shè)定名義檢驗水準(zhǔn)為單側(cè)0.025,檢驗效能為90%,采用兩組平衡設(shè)計,求得總樣本量為120例(每組60例)。假設(shè)20%的脫落率,則初始設(shè)計的總樣本量為150例??紤]到將參數(shù)標(biāo)準(zhǔn)差預(yù)設(shè)為10.0可能不準(zhǔn)確,故計劃利用期中分析時進行樣本量重估。

期中分析計劃為:在完成或中止試驗的受試者達到約50%初始樣本量時進行盲態(tài)下期中分析,計算累積數(shù)據(jù)的合并標(biāo)準(zhǔn)差,若求得的合并標(biāo)準(zhǔn)差大于原假定的10.0,則根據(jù)此參數(shù)重新估算最終的總樣本量,估算時其它參數(shù)與初始假設(shè)保持一致;若求得的合并標(biāo)準(zhǔn)差小于10.0,則樣本量保持150例不變。根據(jù)期中分析重估的樣本量或原始樣本量,繼續(xù)入組受試者直至試驗結(jié)束,不對I類錯誤率進行調(diào)整。假設(shè)進行期中分析時求得的合并標(biāo)準(zhǔn)差為13.66,根據(jù)標(biāo)準(zhǔn)差為13.66,均數(shù)與初始設(shè)計一樣為6.00,重新計算的樣本量為220,考慮20%的脫落率,則總樣本量重估為275例。

示例3:非盲態(tài)下樣本量重估

假想一個多中心、隨機、雙盲、陽性藥平行對照的III期優(yōu)效性臨床試驗。主要終點是24周時某標(biāo)準(zhǔn)分?jǐn)?shù)較基線的變化值,并假設(shè)其近似服從正態(tài)分布,療效分析采用Z檢驗。根據(jù)試驗預(yù)期參數(shù)(如兩組樣本均值之差為δ0,標(biāo)準(zhǔn)差σ=1)和其它所需要素(如α=0.025,檢驗效能1-β=90%),確定初始總樣本量為N

假設(shè)計劃在完成n1例時進行期中分析并重新估計樣本量。用n2=N-n1表示初始設(shè)計下第2階段的樣本量,而根據(jù)期中分析組間比較結(jié)果求得的第2階段所需樣本量表示為n2*,則n2*-n2即是需要增加的樣本量,N*表示增加后的總樣本量。

n2*的確定需要采用合理的適應(yīng)性修改方法。由于不同的適應(yīng)性修改方法各有優(yōu)劣,且有些方法在某些條件下可能是其它方法的特例,因此難以將方法進行明確劃分,具體選用哪種方法應(yīng)根據(jù)具體試驗?zāi)康?、假設(shè)和分析方法而定,也可以選擇模擬分析的方法。以下簡略地介紹這些常用方法的設(shè)計要點。需注意,鑒于研發(fā)費用的限制,很多方法在計算時會設(shè)置樣本量上限;而考慮到最小檢驗療效的臨床意義,也有很多方法在計算時對其進行了考慮。以下介紹并未將這兩點因素考慮在內(nèi)。

1)希望區(qū)域(promising zone)方法:根據(jù)期中分析結(jié)果計算條件檢驗效能CP(Nz1),并將其分為三個區(qū)域,即,和,z1為僅基于第1階段n1例數(shù)據(jù)得出的Z統(tǒng)計量。若CP(Nz1)≤,可終止試驗;若CP(Nz1)≥,可繼續(xù)試驗;若<CP(N,z1)<,重新估計樣本量:在滿足CP(Nz1)>50%時,樣本量的重新估計不會增加I類錯誤率。對于樣本量的重新估計,可利用期中分析所得兩組療效之差代入樣本量計算公式,計算新的樣本量N*,使之滿足CP(N*,z1)=1-β。最終分析時基于調(diào)整后樣本量N*計算Z檢驗統(tǒng)計量,與z1-α(不需要調(diào)整)進行比較以判斷其有效性。

2)加權(quán)統(tǒng)計量方法:也可視為一種逆正態(tài)分布組合函數(shù)方法,但更簡便。根據(jù)期中分析結(jié)果,基于某種標(biāo)準(zhǔn)(如條件檢驗效能)計算出調(diào)整后樣本量N*。令,,則最終的檢驗統(tǒng)計量為Z*=w1Z1 + w2Z2*,并與z1-α(不需要調(diào)整)進行比較,這里,Z*服從標(biāo)準(zhǔn)正態(tài)分布,Z1為僅基于第1階段n1例數(shù)據(jù)得出的Z統(tǒng)計量,Z2*為僅基于調(diào)整后第2階段n2*例數(shù)據(jù)得出的Z統(tǒng)計量。需注意上述權(quán)重的計算基于試驗初始設(shè)計的n1n2,但這類加權(quán)統(tǒng)計量方法也可以只指定n1而不需要確定初始總樣本量N。

3)極大似然比方法:設(shè)定擬達到的目標(biāo)CP(N*,z1)值,據(jù)此調(diào)整拒絕域的臨界點c,其由公式?jīng)Q定 (式中和分別表示標(biāo)準(zhǔn)正態(tài)分布的累積分布函數(shù)和概率密度函數(shù)),這里z1<k,k基于所選α消耗函數(shù)方法(若有有效性檢驗)決定。最終分析基于調(diào)整后兩階段的樣本計算Z統(tǒng)計量,并與調(diào)整后的臨界點c進行比較。

4)條件誤差函數(shù)方法:選擇滿足一定條件的遞增函數(shù)A(z),記zA-1(1-A(z1)), 則n2*=2(zA+zβ)212,δ1是期中分析所得療效估計值,zβ是標(biāo)準(zhǔn)正態(tài)分布的上β分位數(shù),則n2*-n2即是需要增加的樣本量。最終分析利用調(diào)整后第2階段病例計算的Z2*值與進行比較,判斷有效性。

5)基于P值之和的方法:N*= |δ0/δ1|2N,這里δ1 是基于期中分析數(shù)據(jù)估計的療效值。基于n1n2*分別計算兩個階段的Pp1p2,將p1 + p2與 0.2236 進行比較,判斷有效性。此方法要求期中分析數(shù)據(jù)所得的療效估計值δ1不能與初始設(shè)定的δ0反方向,且不能減少樣本量。

示例4:兩階段無縫II/III期適應(yīng)性設(shè)計試驗

假想一個驗證某新藥用于改善某癥狀的多中心、隨機、雙盲、陽性藥平行對照、優(yōu)效性臨床試驗,主要終點是第8周時某種分?jǐn)?shù)較基線的變化值,并假設(shè)其近似服從正態(tài)分布。計劃采用兩階段無縫II/III期的適應(yīng)性設(shè)計,II期試驗包含兩個藥物組(高和低劑量)和一個對照組,隨機分組率為1:1:1, 預(yù)期療效為兩組受試者間平均改進分?jǐn)?shù)差值δ,設(shè)定單側(cè)α=0.025和檢驗效能1-β(如 90%),計算出一個劑量組和對照組比較的樣本量N。試驗的第3n1個受試者完成8周隨訪后第1階段結(jié)束,總樣本量為N+n1(兩比較組總受試者數(shù)N加未選上劑量組在第1階段的受試者數(shù)n1)。

對于第1階段,令p11p12分別表示低劑量組vs.對照組(零假設(shè)為H011:低劑量組與對照組無差別)和高劑量組vs.對照組(零假設(shè)為H012:高劑量組與對照組無差別)Z檢驗的P值結(jié)果,采用閉合方法和Hochberg方法進行多重性調(diào)整,則檢驗低、高劑量組與對照組均無差別(H011∩H012)的P值是pint1= min[2*min(p11, p12),max (p11, p12)]。經(jīng)多重性調(diào)整后,第1階段所選劑量組與對照組療效比較的P值應(yīng)取p1=max (pint1, min (p11, p12))。

對于第2階段,入組病例數(shù)為原定兩組樣本量N減去第1階段兩組受試者數(shù)2n1,即N-2n1,將入組病例隨機分配至選定的劑量組和對照組。試驗終止時,分別根據(jù)第1階段和第2階段的受試者計算各階段P值,分別記為p1q。采用逆正態(tài)組合檢驗,計算,并與α=0.025進行比較判斷有效性,這里權(quán)重w1等于第1階段三個組的受試者例數(shù)相對于試驗入組總例數(shù)之比的平方根,即;權(quán)重w2等于第2階段兩個組的受試者例數(shù)相對于試驗入組總例數(shù)之比的平方根,即。

示例5:適應(yīng)性富集設(shè)計

假想一個多中心、隨機、雙盲、陽性藥平行對照、優(yōu)效性兩階段臨床試驗。主要終點為總生存期(OS),次要終點為無進展生存期(PFS)。假設(shè)全人群中風(fēng)險比HR(F)為0.75,陽性亞組中風(fēng)險比HR(S)為0.55。設(shè)定檢驗水準(zhǔn)為單側(cè)0.025,檢驗效能為 90%,并根據(jù)其它所需參數(shù)計算出在全人群中所需要的總死亡數(shù)為N0。

試驗計劃在入組40%時利用期中分析進行目標(biāo)人群選擇。由于該試驗受試者總生存期較長,故用PFS作為期中分析時目標(biāo)人群選擇的依據(jù),決策策略為:①如果估計的HR(F)<0.85且HR(S)<0.65,第2階段在陽性亞組和全人群中繼續(xù)試驗;②如果HR(F)≥0.85且HR(S)<0.65,第2階段僅入組陽性亞組;③如果HR(F)<0.85且HR(S)≥0.65,第2階段繼續(xù)在全人群中試驗,且不對陽性亞組進行分析;④如果HR(F)≥0.85且HR(S)≥0.65,則以無效性終止試驗。

p1F, p1Sp1FS,以及p2F, p2Sp2FS來分別表示零假設(shè)H0F,H0S 和H0F∩H0S在兩個階段對應(yīng)的P值。對組合檢驗H0F∩H0S使用逆正態(tài)組合函數(shù)和閉合方法,可將整體I類錯誤率控制在單側(cè)0.025水平。如采用Simes方法,則檢驗(H0F∩ H0S)的P值為pFS= min (2min(pF, pS), max (pF, pS))。記,其中,w1 =w2 = , n1n2是分別表示兩階段的死亡病例數(shù)。在最終分析時,檢驗H0F∩H0S  P值為C(p1FS, p2FS),當(dāng)C(p1FS, p2FS)≤0.025時,可拒絕H0F∩H0S。如果在第2階段僅入組亞組,則當(dāng)C(p1FS, p2S)≤0.025時,可拒絕H0F∩H0S。同理,對H0F和H0S可分別利用C(p1F, p2F)和C(p1S, p2S)來檢驗。再基于閉合方法,若同時拒絕H0F∩H0S和H0F,則可最終拒絕H0F;若同時拒絕H0F∩H0S和H0S,則可最終拒絕H0S。

對于該試驗,如果第1階段的檢驗基于PFS而第2階段的檢驗基于OS,則最終計算出的兩階段P值涵義難以解釋,因此,試驗設(shè)計為第1階段的決策基于PFS的描述性統(tǒng)計量結(jié)果,而最終計算兩階段P值時則均基于OS的P值結(jié)果。對于以生存期為終點的試驗,無論第1階段入組受試者的終點事件發(fā)生在哪個階段,計算時均應(yīng)將其歸在第1階段的結(jié)果內(nèi),否則,兩階段的獨立性假設(shè)將不再成立,導(dǎo)致I類錯誤率增加。

示例6:適應(yīng)性主方案試驗

假想一個驗證新藥治療有BRAF V600E正突變的罕見癌癥患者的優(yōu)效性臨床試驗,主要終點是經(jīng)獨立終點委員會確認(rèn)的客觀緩解率,并有持續(xù)緩解時間的記錄。采用多中心、單臂籃式設(shè)計,試驗入選受試者必須是經(jīng)中心試驗室確診具有BRAF V600E突變的晚期病例,包括5個隊列,分別是間變性甲狀腺癌、膽道癌、胃腸道間質(zhì)瘤、毛細胞白血病和小腸腺癌。

在此試驗中,雖然所有受試者按照同一個方案入組,但5個隊列中的每一個隊列都可被視為一個獨立的試驗,其結(jié)果都可單獨用來支持相應(yīng)隊列的申報。由于試驗?zāi)康氖侵С中滤幧陥?,因此必須事先確定樣本量,應(yīng)該根據(jù)優(yōu)效性的決策規(guī)則分別計算每一隊列所需的樣本量。對于將兩個或多個隊列數(shù)據(jù)合并申報的考慮,由于本試驗缺乏足夠數(shù)據(jù)支持試驗藥對具有BRAF V600E正突變的患者有同樣的作用機理和相似療效,因此,將任意兩個或多個隊列數(shù)據(jù)合并以支持對應(yīng)合并隊列新藥申報的做法是不被接受的。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多