知识分享|FDA有源医疗器械指导原则草案:医疗器械软件(SaMD) 临床评价(三)
8.0 附录
8.1 医疗器械软件定义声明
所有制造商应该如下文和第6.0节所强调,从医疗器械软件的定义声明开始,明确清晰地阐明医疗器械软件的预期用途。一般来说,这些方面可以分为以下两大要素,以适当地描述医疗器械软件的预期用途:
“医疗器械软件所提供的信息对医疗决策的意义”,其中指明了医疗器械软件的预期医疗用途。声明应解释医疗器械软件如何符合医疗器械定义中所述的一种或多种用途,例如为诊断、预防、监测、治疗等提供按如下子类别组织的信息:
a. 治疗或诊断 - 医疗器械软件所提供的信息将用于立即或近期的行动:
i. 通过连接到其他医疗器械、医药产品、通用启动器或给人体提供治疗的其它装置来治疗/预防或减轻疾病或病症
ii. 诊断/筛查/检查疾病或病症(即,使用传感器、数据或来自其他硬件或软件设备的关于疾病或病症的其他信息)
i. 为安全有效地使用医药产品或医疗器械提供强化支持,帮助治疗。
ii. 通过分析相关的信息来帮助诊断,帮助预测疾病或病症的风险,或帮助做出明确的诊断。
c. 告知临床管理 - 医疗器械软件所提供的信息不会引起立即或近期的行动:
i. 告知用于治疗、诊断、预防或减轻疾病或病症的可选方案。
ii. 通过汇总相关的信息(例如,疾病,病情,药物,医疗器械,人口等)来提供临床信息
预期的“病症或病情状态”:鉴于患者的健康状况、疾病的进展和相关的干预类型和立即性、目标人口和用户类型(受过训练的用户或非专业用户),确定适合某种疾病或病症的预期用途。声明的这一部分将用以下结构化的子类别来表示:
a. 危急的病症或病情 – 在此病症或病情下,准确和/或及时的诊断或治疗行动对于避免死亡、长期残疾或个别患者其它严重的健康恶化或减轻对公众健康的影响是至关重要的。在下列情形的危急的病症或病情中将考虑使用医疗器械软件:
i. 疾病或病症的类型是:
1. 威胁生命的健康状况,包括不治之症,
2. 需要重大的治疗干预,
3. 视可能影响用户反映输出信息的能力的疾病或病症的发展而定,有时候危急的。
ii. 预期的目标人口在疾病或病症方面是脆弱的(例如儿科,高危人口等)
iii. 供经过专门培训的用户使用。
b. 严重的病症或病情 – 在此病症或病情下,准确诊断或治疗对于避免不必要的干预(如活检)是至关重要的,或者及时干预对于减轻给个别患者的健康状况或公共健康造成的长期不可逆后果是相当重要的。在下列情形的严重的病症或病情中将考虑使用医疗器械软件:
i. 疾病或病症的类型是:
1. 发展适度, 通常可以治愈,
2. 不需要重大的治疗干预,
3. 为避免死亡、长期残疾或其他严重的健康恶化,干预通常不应该是时间关键的,从而使用户能够检测到错误的建议。
ii. 目标人口在疾病或病症方面并不脆弱。
iii. 预期供经过专门训练的用户或普通用户使用
注:拟在没有专业人员的支持下由普通用户在本处所述的“严重的病症或病情”中使用的医疗器械软件应被视为在“危急的病症或病情”中使用的医疗器械软件。
c. 非严重的病症或病情 – 在此病症或病情下,准确诊断和治疗是重要的,但对于旨在减轻对个别患者健康状况或公共健康的长期不可逆后果的干预并非关键。在下列情形的非严重的病症或病情中将考虑使用医疗器械软件:
i. 疾病或病症的类型是:
1. 缓慢,疾病状态的发展是可预测的 (可能包括轻微的慢性疾病或状态),
2. 可能无法治愈;可以有效管控,
3. 只需轻微的治疗干预,
4. 干预通常是非侵入性的,为用户提供检测错误建议的能力。
ii. 预期的目标人口是可能并非总是患者的个体。
iii. 预期供经过专门训练的用户或普通用户使用
C. 医疗器械软件的核心功能的说明[1],其中鉴识了医疗器械软件的关键特性/功能,这对于在预期的病症或病情下医疗器械软件所提供的信息对于医疗决策的意义至关重要。此描述只应包含关键的特性。(关于适用性,见第6.0节)
欲了解与两大因素和制定医疗器械软件定义声明相关的更多细节和信息,请参阅第5.0节和第6.0节。
8.2 澄清医疗器械软件定义
本附录提供了一个典型列表,列出了符合或不符合医疗器械软件定义的特性和功能。此列表并不详尽;仅旨在阐明和帮助确定何时认为一种特性或功能是医疗器械软件。医疗器械软件的实例:
系SaMD(医疗器械软件)的软件实例:
• 在通用计算平台(即,不具有医疗目的计算平台)上运行的医用软件被认为是医疗器械软件。例如,利用在消费性数码相机上的嵌入式处理器上运行的三轴加速度计诊断病症的软件被认为是医疗器械软件。
• 连接到硬件医疗器械但并非该硬件医疗器械实现其预期医疗目的所需的软件是医疗器械软件,而不是该硬件医疗器械的附件。例如,允许商业上可用的智能手机查看从磁共振成像(MRI)医疗器械获得的用于诊断目的图像的软件是医疗器械软件,而不是磁共振成像医疗器械的附件。
• 医疗器械软件定义说明陈述“医疗器械软件能够在通用(非医疗用途)计算平台上运行”。在这些通用计算平台上运行的医疗器械软件可以位于硬件医疗器械中,例如,在位于图像采集硬件医疗器械中的通用计算平台上运行、为帮助检测乳腺癌而进行图像后处理的软件(CAD-计算机辅助检测软件)是医疗器械软件。
• 医疗器械软件定义说明陈述“医疗器械软件可能与其他医疗器械,包括硬件医疗器械和其他医疗器械软件以及通用软件相连接。”如果软件所提供的参数成为不同的硬件医疗器械或其他医疗器械软件的输入,那么该软件是医疗器械软件。例如,提供在线性加速计中使用的信息的治疗规划软件是医疗器械软件。
[1]这些可能包括对于保持由医疗器械软件制造商进行的风险管理过程所确定的安全性、有效性和性能状况属性至关重要的特定功能。
非SaMD(医疗器械软件)的软件实例:
医疗器械软件定义陈述“医疗器械软件(SaMD)被定义为适用于一种或多种医疗用途并且不属于硬件医疗器械的一部分的软件。”被认为是“一部分”的软件实例包括用于在输注泵中“驱动或控制”电机和泵送药物的软件;或在植入式起搏器或其他类型的硬件医疗器械中用于闭环控制的软件。这些类型的软件有时被称为“嵌入式软件”、“固件”或“微代码”,不是“SaMD(医疗器械软件)”。
即使与硬件医疗器械分开销售,硬件医疗器械执行硬件医疗器械的预期用途所需的软件也不是医疗器械软件。
依靠医疗器械的数据但不具有医疗用途的软件(例如对医疗器械的传输数据进行加密的软件)不是医疗器械软件。
使能进行患者注册、安排就诊、语音通话和视频通话等临床通讯和工作流程的软件不是医疗器械软件。
所提供的参数成为医疗器械软件的输入的软件如果没有医疗用途,则不是医疗器械软件。例如,包括搜索和查询功能的数据库本身或者被医疗器械软件使用时不是医疗器械软件。
8.3 SaMD分类
本节描述了基于两大因素对医疗器械软件进行分类的方法,该两大因素代表能够增加或减少医疗器械软件对患者造成危害性处境的可能性:
病症或病情状态;
医疗器械软件所提供的信息对于医疗决策的意义.
类别IV判定标准 –
i. 在危急的病症或病情下提供信息来治疗或诊断疾病或病情的医疗器械软件是类别IV,被认为具有非常高的影响。
类别III判定标准 –
i. 在严重的病症或病情下提供信息来治疗或诊断疾病或病情的医疗器械软件是类别III,被认为具有高的影响。
ii. 在危急的病症或病情下提供信息来推动疾病或病情的临床管理的医疗器械软件是类别III,被认为具有高的影响。
类别II判定标准 –
i. 在非严重的病症或病情下提供信息来治疗或诊断疾病或病情的医疗器械软件是类别II,被认为具有中度的影响。
ii. 在严重的病症或病情下提供信息来推动疾病或病情的临床管理的医疗器械软件是类别II,被认为具有中度的影响。
iii. 在危急的病症或病情下提供信息来告知疾病或病情的临床管理的医疗器械软件是类别II,被认为具有中度的影响。
类别I判定标准 –
i. 在非严重的病症或病情下提供信息来推动疾病或病情的临床管理的医疗器械软件是类别I,被认为具有低的影响。
ii. 在严重的病症或病情下提供信息来告知疾病或病情的临床管理的医疗器械软件是类别I,被认为具有低的影响。
iii. 在非严重的病症或病情下提供信息来告知疾病或病情的临床管理的医疗器械软件是类别I,被认为具有低的影响。
下图描述了以影响和功能为基础的SaMD分类。如上表所示,医疗器械软件对患者或公众健康的影响分为四个类别(类别I,II,III,IV),而功能性(告知或推动临床管理,治疗或诊断)包括三个类别。该分类框架以GHTF分类原则文件中所制定的分类规则为基础,涵盖个人风险、公共健康风险、用户技能以及所提供的信息的重要性。虽然分类框架本身不是一种监管分类,它为旨在确定适当的监管程度的这种分类建立了通往共同的词汇和方法的一条路径。
8.4 医疗器械软件临床评价概念的说明性实例
下文说明不同实例的一系列问题,这些问题可能有助于确定所需的临床评价水平。
实例: 检测房颤的算法
医疗器械软件确定无疑地表明(成功标准)该算法能够以65%的阳性预测值检测房颤。
这是临床上适合预期用途的标准吗?
为充分评估这一标准(阴性预测值,样本量等),还有哪些其他的临床性能规范是必要的?
此检测适用哪些人口?这是否会影响成功标准?
这是否为目前的护理标准提供了具有临床意义的结局/结果?
实例:算法解读心肌梗塞
医疗器械软件确定无疑地表明(成功标准)该算法能够以90%的准确性解释心肌梗塞。
结果的灵敏度和特异性是什么?
这如何影响临床工作流程?
90%的准确性如何符合当前的护理标准或者如何与现有的解释器械/医疗器械软件进行比较?
比较/黄金标准是什么?
医疗器械软件的医疗保健使用情况(环境)和对临床管理的重要性是什么?
病情的严重程度以及与不准确结果相关的风险是什么?
实例: 脑电图分析
医疗器械软件确定无疑地表明医疗器械软件能够基于脑电图确定癫痫发作的位置?
关于脑电图信号与癫痫发作位置的关联性,科学有效性是什么?
如果没有现有的黄金标准,诊断或管理标准是什么,这在器械使用环境下是否具有临床意义?
测试结果是否证明有足够的临床性能(特异性,选择性,阳性预测值,阴性预测值等)?
与目前的护理标准相比,此类医疗器械软件输出的可用性如何显示优点?
8.4.1 临床评价概念的说明性实例 – 皮肤病
实例 – 皮肤病1
定义声明
基于上述定义声明,医疗器械软件告知临床管理。鉴于皮肤病情的范围包括与恶性皮肤病变有关的信息,因此在危急的病症或病情下使用医疗器械软件。
这是用于非诊断目的的类别II.i医疗器械软件的一个实例。
临床评价
作为类别II.i非诊断性医疗器械软件,建议制造商进行临床评价,提供医疗器械软件的科学有效性和分析有效性的证据。
• 可在文献检索和临床研究中查找科学有效性的证据,证据可能包括在皮肤病科中使用已知的诊断规则,例如用于标测痣的ADCDE(也可以被称为ABCD)规则。
• 分析有效性证据可能包括全面检查多次运行医疗器械软件处理输入和输出所产生的结果是否符合根据软件规范或用户预期所推导得出的预期或期望的属性。
实例 – 皮肤病2
定义声明
医疗器械软件提供病变特异性信息,并标记很有可能发展成为非典型痣状态或明显异常的疑似病变。医疗器械软件使用经过测试的最低图像质量的彩色校准照片跟踪病变,并及时检测边缘、大小、颜色、反射率、纹理和数量的任何变化。医疗器械软件自动标测皮肤病变,突出显示新的病变,计数,并将照片发送给皮肤科医师或皮肤病理学医师而无需用户干预。医疗器械软件推动皮肤科医师的下一个诊断行动,皮肤科医师的主要目标是确定哪些病变需要干预(切除和活检)和哪些病变是可以观察和监测的。
基于以上定义声明,医疗器械软件推动临床管理。鉴于皮肤病情的范围包括与恶性皮肤病变有关的信息,因此在危急的病情下使用医疗器械软件。
这是用于诊断用途的类别III.i医疗器械软件的一个实例。
临床评价
作为类别III.i诊断性医疗器械软件,建议制造商进行临床评价,提供医疗器械软件的临床性能证据以及科学有效性和分析有效性证据。
可在文献检索和临床研究中查找科学有效性的证据,证据可能包括在皮肤病科中使用已知的诊断规则,例如用于标测痣的ADCDE(也可以被称为ABCD)规则。
表明医疗器械软件可以像皮肤科医师一样有效地将病变分层为高风险和低风险类别的临床性能证据是证明临床性能所必需的。这可能是前瞻性试验或者回顾性临床评价经过验证的皮肤病变数据库(假设医疗器械软件的输入与在经验证的数据库中发现的高质量照片相同)。
分析有效性证据可能包括全面检查多次运行医疗器械软件处理输入和输出所产生的结果是否符合根据软件规范或用户预期所推导得出的预期或期望的属性。
对于这种诊断性医疗器械软件,应当独立地审查包括科学验证和临床性能的临床有效性证据以及将为保证医疗器械软件的安全性、有效性和性能提供输入的分析有效性证据。
实例 – 皮肤病3
定义声明
医疗器械软件通过使用高倍率镜片和外部紫外光源来检测细胞非典型性(非常大的细胞,细胞成熟不良,生长模式)或典型的恶性黑素瘤细胞,替代对活检/切除样本的组织病理学显微镜评估。
基于以上定义声明,医疗器械软件提供诊断。鉴于皮肤病情的范围包括与恶性皮肤病变有关的信息,因此在危急的病情下使用医疗器械软件。
这是用于诊断用途的类别IV.i医疗器械软件的一个实例。
临床评价
作为一种新型的类别IV.i诊断性医疗器械软件,还建议制造商进行临床评价,提供科学有效性证据以及临床性能证据来证明医疗器械软件的临床有效性和分析有效性。这样的评价应该包括:
• 通过一项研究(例如前瞻性研究)产生临床性能证据,此研究基于对被切除病变的组织病理学显微镜检查或某些基因测试来确认诊断结果和比较医疗器械软件的特异性和灵敏度。这种研究应包括考虑消除会明确表明检测到恶性病变的皮肤颜色偏差、环境光线偏差、对比度偏差及其他偏差。这也可能需要对未切除/活检的病变进行适当的随访以确认患者的结局。可能有必要考虑到某些病例可能不会呈现皮肤病变,而是显示转移性疾病。
• 应在上市后持续从用户反馈中收集更多的现实世界经验,以继续评估医疗器械软件的临床性能。
选择性权利要求和其他考虑因素
上述实例明确涉及黑素瘤或者黑素瘤在权利要求范围内。
• 如果医疗器械软件声称用于检测疔疖、烧伤、冻伤、牛皮癣、神经纤维瘤病、水痘皮肤病变等,医疗器械软件将用于严重的病症或病情而非用于危急的病症或病情,从而降低了医疗器械软件的风险状况。
• 如果医疗器械软件声称检测良性皮肤病变,如湿疹、痤疮、蜂窝织炎、瘢痕疙瘩、疣等 - 医疗器械软件将用于非严重的病症或病情,从而更进一步降低医疗器械软件的风险状况。
实例 –冠状动脉生理模拟软件
定义声明
该软件对冠状血管系统中的血流进行模拟功能评估,利用从医疗器械成像中提取的数据来求解算法和产生模拟的生理信息指标(例如,血流量,冠脉血流储备,血流储备分数,心肌灌注)。该医疗器械软件旨在产生供有资质的临床医师使用和复查的结果。这是一个后处理软件,用于临床定量和定性分析先前从临床症状稳定的冠状动脉疾病患者获得的计算机断层扫描DICOM[1]数据。该软件使用图形和文本显示冠状动脉解剖结构和功能信息,包括计算和推导的血流量化,以帮助临床医师评估冠状动脉疾病。
[1] “医学数字成像和通讯”(医学成像信息和相关数据的通讯和管理标准)。
基于上述定义声明,医疗器械软件在危急的病症或病情下推动临床管理。
这是用于非诊断用途的类别III.i医疗器械软件的一个实例。
临床评价
作为类别III.i医疗器械软件,建议制造商进行临床评价,提供医疗器械软件的科学有效性和分析有效性的证据。
• 可在文献检索和临床研究中查找科学有效性的证据,证明已经通过许多临床研究验证血流储备分数(FFR)是测量冠状动脉缺血程度的一种安全有效的方式。
• 分析有效性证据可能包括全面检查多次运行医疗器械软件处理输入和输出所产生的结果是否符合根据软件规范或用户预期所推导得出的预期或期望的属性:
○ 测试证明了医疗器械软件的适当功能性以及计算方法基础;
○ 与特定模块和组件的真实数据集相比(如自动和半自动图像分析和分割工具),证据证明了医疗器械软件输出的功能性和准确性;
○ 利用医疗器械软件从不同的图像采集系统获得的CT扫描,测试证明了医疗器械软件输出的可再现性;
○ 通过在体外模型中在稳态和脉动流动条件下流量的计算解法与激光多普勒测速仪和相衬磁共振成像(MRI)流量数据,定量证据证明了医疗器械软件的计算机建模测量方法的有效性。
○ 通过开展前瞻性国际多中心研究产生临床性能证据。该研究所产生的证据表明单边95%置信区间下界的诊断准确率超过70%。
8.6 全球协调工作组(GHTF)文件解释的医疗器械软件术语表
准确性: 一个数量的测量结果与该数量的真实值的接近程度。当医疗器械软件的输出和真值是二进制时,准确性是在所检查的输出值总数中真实结果(真阳性和真阴性)的比例。
精确度: 在不变的条件下重复测量显示相同的结果的程度(与再现性和可重现性有关)。
检出限: 医疗器械软件在临床状况的信息承载模式和分散信息注意力的随机模式之间进行甄别的能力。
线性或关联传递函数: 在输入数据范围内医疗器械软件提供的输出行为。
分析灵敏度: 医疗器械软件的输出受到输入数据影响的程度(例如,影响输入数据的参数可能包括摄动、图像分辨率、照明、数据空间分布、数据量等)。
ROC曲线: 鉴于将医疗器械软件的负值和正值分开的决策阈值是可变的,显示灵敏度和特异性之间折衷关系的一个图表
阳性预测值: 已知医疗器械软件的输出为阳性,表示患者患有疾病或病症的可能性
阴性预测值: 已知医疗器械软件的输出为阴性,表示患者没有疾病或病症的可能性
似然比: 在目标状况的患者中预期出现特定结果的可能性与在没有该状况的个体中预期出现相同结果的可能性之比
截止阈值、指数或标度: 与临床状况相关的PPV(阳性预测值)、NPV(阴性预测值)和似然比截止值。这些值应该在确认之前建立,并且必须在确定和临床上验证它们有效的方式方面证明是合理的。
真阳性: 医疗器械软件输出正确地表示特定的状况或属性存在。
真阴性: 医疗器械软件输出正确地表示特定的状况或属性不存在。
假阳性: 医疗器械软件输出错误地表示特定的状况或属性存在。
假阴性: 医疗器械软件输出错误地表示特定的状况或属性不存在。
相关文章:
暂无评论