醫療AI器械領域“冰火兩重天”,一方面資本和企業火熱推進,另一方面卻一直未有獲批器械真正入市。
2016年被認為是人工智能+醫療在國內形成投資風口的元年,共有27家相關企業在2016年融資,其中16家企業融資金額在千萬級人民幣以上。在此之后國內各類公司爭相布局醫療AI賽道,2017年全年有超過28家創業公司獲得融資,總額超過17億人民幣。
今年醫療人工智能行業的發展速度依舊迅猛。據不完全統計,自2018年上半年以來,匯醫慧影、推想科技、深睿醫療、Airdoc、視見醫療等企業都宣布完成了新一輪的融資,金額幾乎都在億元級別。
資本熱捧之下,雖然行業發展迅猛,但由于數據庫龐大、審批流程長等眾多原因,至今國內還沒有一家公司的新一代醫療AI產品獲得醫療器械注冊證,一定程度上制約著醫療AI商業化落地的發展。
中山大學腫瘤防治中心副主任、腫瘤醫院副院長錢朝南也曾向記者指出:“AI醫療領域的泡沫很多。掌握人工智能技術的計算機專家和公司興奮活躍,一頭熱。而另外一頭,醫療應用和臨床是冷的,這種模式顯然不利于行業發展。”
門檻有差異
2017年9月4日,CFDA(國家食品藥品監督管理總局)發布新版《醫療器械分類目錄》,對醫用軟件中包含的輔助診斷進行界定,主要是針對之前已經出現的輔助診斷產品,比如CAD(評估疾病的存在與否,如疾病的嚴重性、分類或預測)系統等。但這類產品并不包含自動診斷系統,對最近發展火熱的醫療AI類產品的界定并不完善。
此分類目錄是相關部門根據之前輔助診斷類產品的分類、審批、發證的經驗和問題重新制定的。而對于新一代醫療人工智能產品,之前并沒有先例可尋。
目前雅森、匯醫慧影、推想、深睿、Airdoc、依圖醫療等多個公司都在積極進行三類醫療器械的申報。依圖醫療曾表示,他們的全產品矩陣都在做三類認證。另外,Airdoc送檢了中國第一臺裝載待檢人工智能AI軟件的服務器?,F階段雖然有多家AI醫療公司向藥監局進行申報,但是目前還沒有一家公司拿到三類醫療器械認證。
值得一提的是,今年4月初,FDA(美國食品藥品監督管理局)批準通過了IDx公司研發的首個應用于一線醫療的自主式人工智能診斷設備IDx-DR的軟件程序,該程序可以在無專業醫生參與的情況下,通過查看視網膜照片對糖尿病性視網膜病變進行診斷。這個產品的獲批上市經歷了長達21年的時間。僅IDx和FDA在如何評估系統并確保其準確性和安全性方面的溝通,就歷時7年。
美國FDA分三類監管醫療設備,其根據是設備的可能使用及其給病人帶來的風險。第一類class I是低風險設備如醫用手套;第二類class II是中等風險設備如CT機;第三類class III是最高風險設備如支架。
據此前披露的信息顯示,目前獲得FDA審批的醫療AI產品多是走的class II認證。也就是說通過降低門檻來過審批。而中國從目前的情形來看是將新一代醫療AI定位為三類醫療器械,審批門檻也有所不同。
中國食品藥品鑒定研究院光機電醫療器械檢驗室主任任海萍上周在杭州舉行的“西湖論健”人工智能助力互聯網醫療分論壇上向媒體透露:“AI領域我們已經接受了全國大概30到40個產品在中檢院報檢。”
“我國對AI有一些CAD的產品有過批準,在我們的分類目錄里面叫做決策支持和計算機分類的軟件,但是這個分類目錄是我們國家已經上市的產品的信息,不包括沒有上市的。現在比較熱的深度學習的產品沒有在這個分類目錄里面,到目前為止還沒有基于深入目錄產品批示的原因是還沒有進入到技術審評的階段。此類產品的上市首先是注冊檢驗,然后是技術審評。”針對現階段AI醫療器械監管現狀任海萍介紹到。
而對于此類AI醫療器械產品的分類,任海萍說道:“基本上我們對于一些基于新的原理,風險不太明確的產品,都會采用高類處理,現在一般都認為它是三類產品。可能將來會隨著我們的認識逐步調整分類。”
CFDA與FDA盡管監管思路相同,但門檻仍有區別。FDA可以使用真實世界的數據來進行監管決策,且已發布了一些軟件的臨床數據庫,回顧性的數據庫可以用于臨床實驗和臨床前的評價。
“總的來說,并不是所有的FDA產品上市都要進行臨床的實驗,所使用的數據集來源于真實世界的數據可以用于臨床前的評價和臨床的評價,對臨床的評價可以用前瞻性和回顧性的臨床。我們國家對AI醫療器械的產品,質量評價主要是有一些要求,不光對應AI,醫療器械的軟件,移動的軟件都有原則,同時我們有信息領域的國家標準,從八個特性來評價軟件的質量,尤其更關注AI信息的安全性和兼容性的要求。”任海萍如是說道。
前路漫漫
斯坦福大學醫學院放療科的醫學物理專業教授邢磊說道:“AI最基本的原則,它是要用以前的經驗和以前的數據來做模型,然后用模型來做決策,而現在的AI仍處于初級階段。”
另一方面,AI產品的特殊性也是造成審批流程較長,商業化落地一直“懸而未決”的原因。
AI產品特殊性體現在審批流程上,各家醫院數據庫的統一標準難以界定,除此之外,迅速的更新迭代使得長期結果很難預判,且數據的穩定性也會對監測結果造成影響。
基于這樣AI+醫療產品的特殊性,也就對審批過程中數據庫的建立提出了更高的要求。此類數據庫的建立更需要大量時間的前期投入。
AI醫療的評價首先要設計出,針對評估的產品,以及產品的預期用途、使用環境、核心功能的數據集。再者就是規范數據標注的過程,尤其是關注臨床的總則、人員的控制等。
“我們對一個產品算法是在迭代的、同樣的測試機進行。同樣的用途來測一下發現測出來的結果不太一樣。一些小的圖像的預處理,比如說旋轉、裁剪這些工作都是在AI的算法之前經常會做的一些工作,很多AI的軟件都加了前面的一些處理的工作,這些也是對于產品的影響很大。中檢院對于現在在檢的產品主要是用標準數據集的方法來進行測試,另外就是用可模擬對抗來進行測試。到現在為止我們建了兩個標準的數據庫,一個是對眼底彩照,一個是肺部的CT,也是我們國家頭兩個標準數據集。從數據的多樣性來看,我們眼底的庫是由全國10個省份11家醫院采集的13種常見案例,技術參數覆蓋得比較廣泛。”任海萍說道。
據介紹,目前中檢院在建立數據庫體系的過程中,是從全國頂尖醫院篩選醫生,僅眼底方面,在全國47個醫生中最終選擇準確率和穩定性都達到了80%到85%水平的15位醫生進行組隊。此外,全國有200多個肺部醫生報名,180多個醫生參加考試,最終選擇39個平均工作年限為13年的醫生進入中檢院,以此在最大程度上控制數據偏移,建立回顧性的數據庫。