分析数据模型(ADaM)被用来支持临床研究数据统计分析与相关审评工作。
通常递交给美国FDA的数据有四种类型:
分析数据集及其元数据
研究列表数据集及其元数据
受试者概览
数据清单
ADaM规定了分析数据集的数据结构及其元数据。
研究数据列表(SDTM)数据集目的是展现所有采集的临床数据,并不足以支持统计分析,达到临床试验检验科学假设的目的,而ADaM则弥补了这种不足。
ADaM中,变量与记录,甚至整个数据集都可能是衍生的,以满足特定的科学和医学评价的目的。
ADaM的构架,使得审阅者能够清晰地理解递交中的分析数据集中所有数据点的来源、衍生及基于分析数据集的分析结果。
三种ADaM标准数据结构:
受试者水平分析数据集(ADSL)
基本数据结构(BDS)
发生情况分析数据机构(OCCDS)
1)受试者水平分析数据集(ADSL)
每个受试者只允许拥有一条记录,包含受试者水平人群标识、每个阶段计划与实际治疗信息、人口学特征信息、分层和亚组信息,以及重要的日期等。
除包含必要的常规变量外,还包括试验中其他用来描述受试者试验信息的重要变量。
基于CDISC的临床试验数据申报中,即使没有其他可用分析数据提交,ADSL和它相关的元数据也要求必须提供。
2)基本数据结构(BDS)
每个受试者的每个分析参数,在每个分析时间点可包含一条或多条记录。分析时间点的有无取决于分析的需要。
包括分析参数相关的变量,如分析参数(PARAM)、分析值(AVAL)、基线(BASE)、相对基线变化(CHG)等。
支持参数和非参数分析,比如方差分析(ANOVA)、协方差分析(ANCOVA)、类别分析、Logistic回归、CMH检验、Wilcoxon秩和检验、事件发生时间分析等。
3)发生情况分析数据机构(OCCDS)
用于发生类情况的分析,如计算有某记录或词的受试者频数,通常包括结构化层级的词典编码分类(如MedDRA的LLT、PT、HLT、HLGT、SOC水平等)。
包括用于不良事件、伴随用药及病史的典型分析。
通常,发现类数据可以很好地纳入BDS结构,而事件类和干预类数据可以很好地纳入OCCDS结构。
也有例外:比如暴露数据,来自SDTM干预类结构,但一般用BDS结构,因为其分析不是简单的记录计数,尽管有时会用OCCDS结构的中间数据集来帮助衍生BDS中的综合参数。
建立良好的ADaM数据集需要遵循以下基本原则:
分析数据集和相关的元数据,必须清楚地阐明用于支持临床研究统计分析的数据集的内容和来源。
分析数据集和相关的元数据必须具备可追溯性,以助于理解分析值(分析结果或者分析变量)的来源,即分析值和它前身之间数据体系或关系。元数据也必须提供在什么时间分析值被推导或者输入的相应的标识。
分析数据集必须在常用的软件工具上可以使用。
分析数据集和相关的元数据,必须促进清楚无歧义的交流。理想的元数据也必须提供在什么时间分析值被推导或者输入的相应的标识。
分析数据集的结构和内容,应该满足最少化的统计分析编程工作量。这样的数据集称为“可分析的”。