2018年,医疗人工智能行业的发展速度依旧迅猛。在今年第一季度,汇医慧影、推想科技、深睿医疗、Airdoc、视见医疗等企业都宣布完成了新一轮的融资,金额几乎都在亿元级别。联影也发布了自己的开放的智能AI平台,全面渗透医疗AI领域。
虽然行业发展迅猛,但是有个问题一直制约着行业的发展,那就是国内还没有一家公司的新一代医疗AI产品获得医疗器械注册证。
这一方面是由于医疗AI作为一种全新的产品,拥有一定的智能,但是之前并无审批此类产品的经验和标准数据库。另一方面,国内医疗AI企业的产品还在打磨阶段,医疗是一个严谨的行业,事关民众安全。
值得说明的是,之前拿了认证的产品大多是基于之前CAD产品审批方式获得的,与最近流行的新一代医疗AI产品有些不同。
没有认证就没有市场准入资质,虽然各个创业公司有自己合理合法的营收渠道和高额的融资,但是AI公司数据、人才、算力、运营成本昂贵,如果以医疗AI产品为主营业务的公司迟迟拿不到市场准入资质,那公司的长远发展必将面临挑战。
利用深度学习技术研发的医疗AI产品为何拿不到认证,问题出在哪里,获得认证还需要解决那些问题,各家医疗AI公司,监管部门等机构做了哪些准备,中美的审批有何区别,本期将试着进行解读。
中国为什么不能像美国那样发放认证
2018年4月初,FDA批准通过了IDx公司研发的首个应用于一线医疗的自主式人工智能诊断设备——IDx-DR 的软件程序,它可以在无专业医生参与的情况下,通过查看视网膜照片对糖尿病性视网膜病变进行诊断。
这个看似简单的诊断,IDx 却整整走了21年。IDx 是一家专注于开发临床自主诊断算法的公司,单就和 FDA 在如何评估系统并确保其准确性和安全性方面的沟通,IDx就花了7年。
西门子医学影像分析首席专家周少华博士曾向记者介绍,美国FDA分三类监管医疗设备,其根据是设备的可能使用及其给病人带来的风险。第一类class I是低风险设备如医用手套;第二类class II是中等风险设备如CT机;第三类class III是最高风险设备如支架。
Al影像系统有两种:computer-aided detection (CADe) 和 computer-assisted diagnostic (CADx) 。
CADe 用于检测不正常状况abnormalities,而CADx评估疾病的存在与否,如疾病的严重性、分类或预测。
FDA 对于监管CADe软件有很多经验,并提供510(k) 的指示标准,如何做临床表现评价。但是,FDA历来把CADx系统作为class III。
但是据了解目前获得FDA审批的医疗AI 产品多是走的class II。也就是说通过降低门槛来过审批。而中国从目前的情形来看是将新一代医疗AI定位为三类医疗器械,所以审批上会有不同。
建议各家公司考虑认证三类医疗器械
汇医慧影联合创始人郭娜表示,美国近期批复的几款AI产品全都是走的ClassII的认证流程,通过跟传统CDSS(临床决策支持系统)做等同对比证明安全有效性。中国药监局的法规相对来说更严格,对临床评价的路径控制非常严格,按目前法规,基本上国内的AI产品都得走临床试验这条评价路径,耗时会比较长。
目前药监局没有发出这种降低审批标准的信号,按新的分类目录,直接给出诊断治疗建议的辅助决策软件都属于三类,如果仅仅给出量化数值,像骨密度,那就是按二类医疗器械来管理,市场上大部分的AI产品都属于三类。
2017年9月4日,CFDA发布的新版《医疗器械分类目录》医用软件中包含的辅助诊断,主要是针对之前已经出现的辅助诊断产品,比如CAD系统等。但这类并不包含自动诊断系统,对最近流行起来的人工智能软件产品的界定并不完善。
这个分类目录是相关部门根据之前辅助诊断类产品的分类、审批、发证的经验和问题重新制定的。而对于新一代医疗人工智能产品,之前并没有先例可寻。现阶段虽然有人工智能公司申报药监局认证,但是目前还没有一家公司拿到三类医疗器械。
同时,目前雅森、汇医慧影、推想、深睿、Airdoc、依图医疗等几个大公司都在积极进行三类医疗器械的申报。依图医疗表示,他们的全产品矩阵都在做三类认证。另外,Airdoc送检了中国第一台装载待检人工智能AI软件的服务器。
用于审批的标准数据库正在逐步建立
医疗人工智能产品没有获得审批的一部分原因是用于审批的标准数据库还在建设中,但是各个地区、医院的数据标准并不同。
一家公司在北京两家大医院做的临床实验即使完美,但是并不代表产品可以在某县级医院中使用,甚至由于过拟合的现象,导至在其他医院无法使用。而如何验证医疗AI产品的鲁棒性(普遍适应性),建立标准测试数据库是现阶段监管部门正在做的事情。
目前的标准测试数据库建设是按照病种进行的。据中检院官方微信发布的信息显示,2018年3月26日,标准测试数据集(眼底部分)建设完成。肺结节的标准数据库建设方案也已经定稿,近期就可以建设完成。
参与标准测试数据库建设的第二军医大学长征医院影像医学与核医学科主任刘士远介绍,标准测试数据库建设为了保证公平性,使建立的数据库能够得到大多数企业和机构的认可,在建设过程中会遵循以下三个原则:
第一是广泛性,数据要来自全国各地不同的医院,不能只局限于北上广深这些大城市的医学数据。
第二是兼容性,以肺部图像为例,目前建立标准测试数据库的时候会考虑不同层厚的CT图像,有5毫米图像,也有1-2毫米图像,甚至亚毫米图像。
第三是医学图像的标记要标准化。刘士远教授表示,搜集一定数量的图像并不难,难的是为数据打标签。
除了标准数据库外,还需要注意的几个问题
是否可以考虑先上市后临床
目前大多数医疗人工智能公司的发展都卡在了审批这个地方。医疗软件注册审批的流程大概是这样的:
从这个流程图,我们可以看到,在获得药监局认证之前,要先获得体系认证,体系认证需要3-6个月。三类医疗器械认证需要2-3年,在审批之前要等到标准数据库的建立,数据库的建立需要一定的周期。
从中检院的官微发布的信息推测,他们是按照病种进行来建立数据库,与 FDA 在如何评估系统并确保其准确性和安全性方面的沟通,IDx就花了7年时间相比,审批部门的速度已经非常快了(中间还有一个春节)。
但是每个公司涉及的病种一般在10个左右,算上临床实验的时间,审批的过程在3-4年的时间。
这个过程是由于医疗和AI本身的严谨、安全性质决定的,这是审批机构和企业无法改变的现实。可是又有多少企业可以等待这么长时间呢?我们是否可以考虑一种新的市场准入方式?
为了企业和行业的持续发展,在保证安全性和稳定性的前提下,是否可以学习药企走先上市后临床审批的方式,让行业先发展起来。
(广义上讲,药物上市后所开展的所有临床研究均称为上市后研究,狭义讲,上市后临床研究是由生产企业、医疗机构或社会团体自行组织与药品有关的应用研究。)
回顾性数据为临床提供支持
根据数据收集方式,我们可以将临床研究分为前瞻性数据收集的研究和回顾性数据收集研究。
所谓前瞻性数据收集的研究就是指预先制定研究方案,并且根据研究方案收集未来的数据。回顾性数据收集的研究则是指制定研究方案后,回顾性地收集过去的数据。
换而言之,二者的区别主要在于到底手机的是将来的数据还是过去的数据。
前瞻性数据收集研究的优点是能较好地控制的数据质量,研究的说服力强,缺点是研究产出周期较长,花费较高;回顾性数据收集研究的优点是研究产出周期短,且花费极低。
目前,我们走的是前瞻性研究,为了鼓励行业发展,当一些产品比如眼底、肺结节医疗AI产品获批后,其他产品采用回顾性研究,为临床提供支持,减少企业在临床审批过程中的时间和费用。