行業(yè)資訊
Industry news
全部行業(yè)動(dòng)態(tài)
All industry dynamic
政策法規
Policies regulations
研發(fā)動(dòng)態(tài)
Research news
近日,國家藥監局藥品審評中心發(fā)布了《藥物臨床試驗數據遞交指導原則(征求意見(jiàn)稿)》,如下:
CDE公開(kāi)征求《藥物臨床試驗數據遞交指導原則(征求意見(jiàn)稿)》!
藥物臨床試驗數據遞交指導原則
(征求意見(jiàn)稿)
目錄
一、背景與目的
二、臨床試驗數據相關(guān)資料及其說(shuō)明
(一)原始數據庫
(二)分析數據庫
(三)數據說(shuō)明文件
(四)注釋病例報告表
(五)程序代碼
三、臨床試驗數據相關(guān)資料的格式
(一)便攜文檔格式
(二)可擴展標記語(yǔ)言格式
(三)純文本格式
(四)研究數據傳輸格式
(五)數據集拆分
(六)數據集名稱(chēng)、變量名稱(chēng)及變量長(cháng)度
(七)數據集標簽及變量標簽
四、其它相關(guān)事項
(一)試驗數據的可追溯性
(二)電子通用技術(shù)文檔下的數據文件
(三)外文數據庫
(四)與監管機構的溝通
參考文獻
附錄1:常用原始數據集
附錄2:STF
附錄3:文件夾結構
附錄4:詞匯表
附錄5:中英文詞匯對照
藥物臨床試驗數據遞交指導原則(征求意見(jiàn)稿)
藥物臨床試驗數據是申辦方向監管機構遞交的重要資料之一,對于監管機構和申辦方來(lái)說(shuō)都是寶貴的資源。規范的收集、整理、分析和呈現臨床試驗數據對于提高藥物臨床研發(fā)的效率和質(zhì)量、縮短審評時(shí)間具有重要的作用,并且有利于藥品全生命周期管理,促進(jìn)研發(fā)或監管的信息互通或共享。
申辦方遞交的臨床試驗數據若不遵循一定的規范,熟悉和理解數據結構及內容將占用大量的審評資源。某些情況下,申辦方或監管機構可能需要針對多來(lái)源的臨床試驗數據進(jìn)行匯總分析,數據沒(méi)有規范化,整合利用也幾乎難以實(shí)現。
臨床試驗數據相關(guān)的申報資料通常包括數據庫及其相應的數據說(shuō)明文件、數據審閱說(shuō)明、程序代碼和注釋病例報告表(annotated Case Report Form,aCRF)。本指導原則主要對臨床試驗數據遞交的內容及格式提出了具體要求,旨在指導申辦方規范遞交臨床試驗數據及相關(guān)資料,同時(shí)有助于數據管理、統計分析等相關(guān)從業(yè)人員更好的開(kāi)展臨床試驗中的相關(guān)工作。
本指導原則基于國際監管機構數據遞交要求以及國內現狀制定,申辦方應基于本指導原則要求準備相關(guān)資料。鼓勵申辦方以臨床數據交換標準協(xié)會(huì )(Clinical Data Interchange Standards Consortium,CDISC)標準遞交臨床試驗數據及相關(guān)的申報資料。隨著(zhù)對臨床試驗數據標準的認識與實(shí)踐的發(fā)展和提高,本指導原則會(huì )酌情修訂完善。
原始數據庫通常應包含從病例報告表(Case Report Form,CRF)和外部文件中直接收集的原始數據,還可能包括極少量的衍生數據,如序號、研究日等。原始數據庫中的缺失數據不應進(jìn)行填補。為滿(mǎn)足數據遞交的要求,直接收集的數據可能需要進(jìn)行必要的標準化或編碼(例如,調整數據庫中數據集名稱(chēng)/標簽、數據集中變量名稱(chēng)/標簽,在適用的情況下對變量值進(jìn)行標準化編碼,如國際醫學(xué)用語(yǔ)詞典(Medical Dictionary for Regulatory Activities,MedDRA)等)。
原始數據庫通常包含多個(gè)原始數據集,原始數據集應按主題進(jìn)行組織并命名,數據集通常以?xún)蓚€(gè)字母組成的代碼命名,如受試者人口學(xué)數據集(dm)、不良事件數據集(ae),實(shí)驗室檢查數據集等(lb)。臨床試驗中常見(jiàn)的原始數據集命名詳見(jiàn)附錄1。
在反映各受試者觀(guān)測結果的數據集(如附錄1中的dm,ae,lb等數據集)中必須包括研究標識符、受試者唯一標識符等標識符變量;受試者標識符(SUBJID)必須包括在dm數據集中。常用到的標識符舉例說(shuō)明如下:
研究標識符:變量名為STUDYID,字符型,研究的唯一標識符,即研究編號。
受試者唯一標識符:變量名為USUBJID,字符型,每一受試者在整個(gè)試驗申請(包含多個(gè)臨床研究)的過(guò)程中應當賦予一個(gè)唯一的標識符。在所有數據集(包括原始數據集與分析數據集)中,同一個(gè)受試者應當有完全相同的唯一標識符。當受試者參加了多個(gè)研究,各個(gè)研究之間的USUBJID應當保持一致。遵循這一規則對于合并同一受試者在不同研究中的數據尤其重要(如隨機對照試驗或擴展性研究)。
受試者標識符:變量名為SUBJID,字符型,SUBJID是參加試驗的受試者的標識符。如果同一受試者在一個(gè)試驗中篩選多次,其SUBJID應當不同。
訪(fǎng)視名稱(chēng)(VISIT,字符型)和訪(fǎng)視編號(VISITNUM,數值型)等時(shí)間變量應該包括在適用的數據集中。VISITNUM應根據時(shí)間順序從小到大賦值。
分析數據庫是為統計分析衍生新建的數據庫,用于產(chǎn)生和支持臨床總結報告中的統計分析結果。分析數據庫中可以包含原始數據及基于原始數據按照一定規則衍生的數據,如對缺失數據填補后的數據等。
分析數據庫通常包括多個(gè)分析數據集。構建分析數據集時(shí),可能會(huì )將衍生和收集的數據(來(lái)自各原始數據集或其它分析數據集)合并到一個(gè)數據集中,構建時(shí)應遵循以下原則:①分析數據集必須清晰地反映在臨床研究中所支持的統計分析的內容。②分析數據集必須具備可追溯性,其中衍生數據的具體規則應在相應的數據說(shuō)明文件中加以詳細說(shuō)明。③分析數據集結構和內容應該能經(jīng)過(guò)很少的編程即可進(jìn)行統計分析。
分析數據庫應包含分析時(shí)所需的所有變量,包括衍生變量,且所有衍生變量均應能通過(guò)原始數據庫生成。分析數據集通常以“adxxxxxx”命名,分析數據集的命名應盡量與原始數據集保持對應,如:adcm、adae、adlb等。
受試者水平分析數據集是必不可少的一個(gè)分析數據集(命名為adsl)。在該數據集中,每一受試者應有一條記錄,內容應包括但不限于人口統計學(xué)、疾病因素、治療組、其它可能影響治療應答的預后因素、重要事件的日期、研究人群劃分等信息。
對于有些終點(diǎn)(如某些量表評分),從原始數據集到可用于最終統計分析的分析數據集需要經(jīng)過(guò)一系列衍生過(guò)程,如有必要,為方便最終分析數據集創(chuàng )建而衍生的中間變量/數據集也應一同包含在分析數據庫中遞交。
遞交的原始數據庫和分析數據庫必須有相應的數據說(shuō)明文件。數據說(shuō)明文件是一份用來(lái)描述遞交數據的文件,至少應包含遞交數據庫中各數據集名稱(chēng)、標簽、基本結構描述及每一數據集中各變量的名稱(chēng)、標簽、類(lèi)型及衍生變量的衍生過(guò)程。
數據說(shuō)明文件是監管機構審評時(shí)準確理解遞交數據內容最重要的文件之一。申辦方應確保每個(gè)變量的編碼列表和來(lái)源都有清晰的定義,并且易于查找。如果使用外部字典,需要在數據說(shuō)明文件中指明所用的字典及版本。需要通過(guò)數據說(shuō)明文件建立起數據間良好的可追溯性(如:原始數據集與CRF、分析數據集與原始數據集之間),以便于監管機構的審閱。申辦方需要在數據說(shuō)明文件中提供相關(guān)細節,尤其是和衍生變量相關(guān)的詳細說(shuō)明,必要時(shí)可使用程序代碼輔助說(shuō)明。
數據審閱說(shuō)明是對原始數據庫/分析數據庫說(shuō)明文件的進(jìn)一步補充,有助于審評人員更好的理解與使用遞交的數據,必要時(shí)應遞交。數據審閱說(shuō)明提供除呈現在數據說(shuō)明文件之外的其它內容,包括但不限于研究數據使用說(shuō)明、研究報告與數據之間的關(guān)系、研究文檔(比如試驗方案,統計分析計劃,臨床研究報告等)中部分關(guān)鍵信息及其它特殊情形說(shuō)明等。數據審閱說(shuō)明并不旨在取代針對數據庫的數據說(shuō)明文件,而是通過(guò)文檔描述的方式來(lái)幫助審評人員更準確、高效的理解與使用所遞交的數據庫、相關(guān)術(shù)語(yǔ)及數據說(shuō)明文件信息等。
數據說(shuō)明文件一般為可擴展標記語(yǔ)言(Extensible Mark-up Language,XML)或便攜文檔格式(Portable Document Format,PDF)文件遞交,數據審閱說(shuō)明應采用PDF文件。
注釋病例報告表是在空白CRF的基礎上,對采集的受試者數據(電子化的或者紙質(zhì)的)信息單元(即字段信息)與遞交原始數據集中對應的變量或者變量值之間映射關(guān)系的具體描述。aCRF文件應采用PDF文件。
實(shí)踐中,CRF中可能會(huì )收集一些遞交數據庫中沒(méi)有的數據內容,這類(lèi)數據應在aCRF上明確標注為“不遞交”(“NOT SUBMITTED”),并在遞交數據審閱說(shuō)明中闡明不遞交這些數據的理由。
申辦方應遞交程序代碼,程序代碼包括但不限于分析數據集的衍生過(guò)程、主要和次要療效指標分析結果的生成過(guò)程等。申報資料中遞交的程序代碼,應可讀性強(有注釋?zhuān)⒁锥⒖蓤绦校话獠砍绦蛘{用,尤其應避免大型宏程序的嵌套。程序代碼一般采用TXT文件。
便攜文檔格式是一種開(kāi)放文檔格式,其獨立于應用軟件、硬件和操作系統。申報遞交資料中遵循人用藥品注冊技術(shù)要求國際協(xié)調委員會(huì )(ICH)電子通用技術(shù)文檔(Electronic Common Technical Document, eCTD)格式要求的其它文檔可采用PDF文件。建議使用PDF 1.4以上的版本進(jìn)行文檔的遞交。所有PDF文件都應以.pdf作為文件擴展名。
可擴展標記語(yǔ)言是由國際萬(wàn)維網(wǎng)協(xié)會(huì )(World Wide Web Consortium,W3C)定義的一種數據交換語(yǔ)言。它可以被任何文本編輯器打開(kāi)、編輯和創(chuàng )建,用來(lái)傳輸和存儲數據。XML格式文件能夠便捷地在不同系統之間進(jìn)行信息交互。所有XML格式文件必需以.xml結尾作為文件擴展名。
純文本格式文檔(TXT)具有格式簡(jiǎn)單、體積小、存儲簡(jiǎn)單方便等諸多特點(diǎn),也是計算機及許多移動(dòng)終端支持的通用文件格式。所有TXT文件都應以.txt作為文件擴展名。
申報資料中的數據集通常采用XPT格式,一個(gè)XPT文件對應一個(gè)數據集,數據集名稱(chēng)需要和XPT的文件名保持一致,其文件后綴名統一為.xpt。例如不良事件數據集(Adverse Event, AE)ae.xpt,合并用藥數據集(Concomitant Medication, CM)cm.xpt等。建議采用SAS數據傳輸格式第5版本(SAS Transport Format V5,簡(jiǎn)稱(chēng)XPT V5)或以上版本作為數據遞交格式。申辦方應確保所遞交的數據集在不同物理環(huán)境都不存在亂碼的情形。
當數據庫中單個(gè)數據集因存儲大小不滿(mǎn)足相關(guān)要求而需要拆分時(shí),在數據審閱說(shuō)明中,應詳細說(shuō)明拆分數據集的規則及合并的詳細步驟,以確保審評人員能夠生成與申辦方拆分前相同的數據集。
對數據集名稱(chēng)和變量名稱(chēng)要求如下:
數據集名稱(chēng)只能包含小寫(xiě)字母和數字,并且必須以小寫(xiě)字母開(kāi)頭。且數據集名稱(chēng)的最大長(cháng)度為8個(gè)英文字符。
變量名稱(chēng)只能包含大寫(xiě)英文字符和數字,并且必須以字母開(kāi)頭。且變量名稱(chēng)的最大長(cháng)度為8個(gè)英文字符。
每個(gè)字符型變量的長(cháng)度,應該設置為在此研究所有數據集里該變量的最大實(shí)際變量值長(cháng)度,有效控制文件的大小。一般變量設置變量值長(cháng)度最大不超過(guò)200字節,必要時(shí)拆分變量。拆分時(shí),字節不可截斷,盡量保持每個(gè)拆分變量語(yǔ)句的完整性。
為了便于審閱,數據集標簽和變量標簽應使用中文,長(cháng)度不超過(guò)40字節,必要時(shí)可以包含英文字母、下劃線(xiàn)或數字,但不能以數字開(kāi)頭,另外,也不能包含下列情形:
·不成對的半角或全角單引號、雙引號
·不成對的半角或全角括號
·特殊字符
審評中的一個(gè)重要環(huán)節是對數據來(lái)源的準確理解,即數據的可追溯性。可追溯性為審評人員理解統計分析結果(試驗報告中的報表)、分析數據及與原始數據之間的關(guān)系提供了技術(shù)許可。
數據的可追溯性確保審評人員能夠準確地:
·理解分析數據集的構建
·確定用于衍生變量的觀(guān)測記錄以及相應算法
·理解相關(guān)統計結果的計算方法
·建立相關(guān)技術(shù)從原始數據到相應的報表之間的聯(lián)系
申辦方在遞交原始數據庫時(shí)應確保監管部門(mén)能夠利用原始數據庫衍生出與申辦方一致的分析數據庫,利用分析數據庫能夠直接重現出與申辦方一致的統計分析結果。可追溯性還可以通過(guò)提供數據從收集階段到遞交階段的詳細流程圖來(lái)輔助解釋。
在采用eCTD申報時(shí),所有文檔、試驗數據和相關(guān)支持性文件需要按照指定的文件夾結構進(jìn)行整理。所有遞交的文件都應該在正確的文件夾內,并使用適當的研究標簽文件(Study Tagging File,STF)進(jìn)行標識。STF和文件夾結構見(jiàn)附錄2和附錄3。
當涉及到用外文數據庫做注冊申報時(shí),數據集標簽、變量標簽、數據集中不良事件名稱(chēng)、合并用藥通用名稱(chēng)、伴隨疾病名稱(chēng)、縱庫中臨床終點(diǎn)名稱(chēng)(對應橫庫中的變量標簽)應為中文。CRF、aCRF、數據說(shuō)明文件、數據審閱說(shuō)明應同時(shí)遞交相對應的中文版本。數據庫中的中文翻譯應與所有其它文件保持一致。
申辦方根據具體臨床試驗數據特點(diǎn)及復雜程度,若需要,可在Pre-NDA會(huì )議上與監管機構就臨床試驗數據庫及相關(guān)資料的遞交進(jìn)行溝通,以方便審評人員快速、準確地理解申辦方遞交的臨床試驗數據。
1.CFDA:臨床試驗數據管理工作技術(shù)指南. 2016年7月.
2.FDA:StudyData Technical Conformance Guide. Oct 2019.
3.PMDA:Revisionof Technical Conformance Guide on Electronic Study Data Submissions. Jan 2019.
4.CDISC:StudyData Tabulation Model Implementation Guide. Nov 2018.
5.CDISC:AnalysisData Model Implementation Guide. Oct 2019.
表1 常用原始數據集及命名
數據集 |
命名 |
遞交要求 |
人口學(xué) |
dm |
必須遞交 |
病史 |
mh |
如適用 |
不良事件 |
ae |
如適用 |
既往與伴隨用藥 |
cm |
如適用 |
暴露 |
ex |
如適用 |
受試者處置 |
ds |
如適用 |
調查問(wèn)卷 |
qs |
如適用 |
方案違背 |
dv |
如適用 |
實(shí)驗室檢查 |
lb |
如適用 |
心電圖 |
eg |
如適用 |
生命體征 |
vs |
如適用 |
臨床事件 |
ce |
如適用 |
體格檢查 |
pe |
如適用 |
疾病應答 |
rs |
如適用 |
標題元素的name屬性值 |
說(shuō)明 |
data-tabulation-dataset-legacy |
原始數據庫(非CDISC標準) |
data-tabulation-dataset-sdtm |
原始數據庫(CDISC標準) |
data-tabulation-data-definition |
原始數據庫數據說(shuō)明文件、數據審閱說(shuō)明 |
analysis-dataset-adam |
分析數據庫(CDISC標準) |
analysis-dataset-legacy |
分析數據庫(非CDISC標準) |
analysis-data-definition |
分析數據庫數據說(shuō)明文件、數據審閱說(shuō)明 |
annotated-crf |
注釋CRF |
analysis-program |
編程程序代碼 |
編碼列表(Code List):是指變量可能的取值,包括在試驗數據涉及數據相應的標準編碼、行業(yè)通用編碼或申辦方自定義的編碼。
病例報告表(Case Report Form, CRF):按試驗方案所規定設計的一種印刷的、光學(xué)的或電子的文件,用來(lái)記錄每一名受試者在研究過(guò)程中的全部信息報告給申辦者。
電子通用技術(shù)文檔(Electronic Common Technical Document, eCTD):用于藥品注冊申報和審評的電子注冊文件。通過(guò)可擴展標記語(yǔ)言將符合CTD規范的藥品申報資料以電子化形式進(jìn)行組織、傳輸和呈現。
數據說(shuō)明文件(Data Define File):一份用來(lái)描述遞交數據的文件,至少應包含遞交數據庫中各數據集名稱(chēng)、標簽、基本結構描述及每一數據集中各變量的名稱(chēng)、標簽、類(lèi)型及衍生變量的衍生過(guò)程。
數據審閱說(shuō)明(Data Reviewer’s Guide):是對數據說(shuō)明文件的進(jìn)一步補充文件,包括但不限于研究數據使用說(shuō)明、研究報告與數據之間關(guān)系、研究文檔中部分關(guān)鍵信息及其它特殊情形說(shuō)明等。
注釋病例報告表(aCRF):是在空白病例報告表的基礎上,對采集的受試者數據(電子化的或者紙質(zhì)的)信息單元(即字段信息)與遞交原始數據集中對應的變量或者變量值之間映射關(guān)系的具體描述。
中文 |
英文 |
注釋病例報告表 |
aCRF (annotated Case Report Form) |
受試者水平分析數據集 |
ADSL (Subject Level Analysis Dataset) |
臨床數據交換標準協(xié)會(huì ) |
CDISC (Clinical Data Interchange Standards Consortium) |
病例報告表 |
CRF (Case Report Form) |
臨床總結報告 |
CSR (Clinical Study Report) |
電子通用技術(shù)文檔 |
eCTD (electronic Common Technical Document) |
國際人用藥品注冊技術(shù)要求協(xié)調會(huì ) |
ICH (International Council for Harmonization of Technical Requirements for Pharmaceuticals for Human Use) |
國際醫學(xué)用語(yǔ)詞典 |
MedDRA (Medical Dictionary for Regulatory Activities) |
新藥申請 |
NDA (New Drug Application) |
便攜文檔格式 |
PDF (Portable Document Format) |
研究標簽文件 |
STF (Study Tagging File) |
國際萬(wàn)維網(wǎng)協(xié)會(huì ) |
W3C (World Wide Web Consortium) |
可擴展標記語(yǔ)言 |
XML (Extensible Mark-up Language) |