法規(guī)動態(tài)
您的位置:首頁新聞資訊法規(guī)動態(tài)
您的位置:首頁新聞資訊法規(guī)動態(tài)
文章出處:法規(guī)動態(tài) 網(wǎng)責任編輯: 金飛鷹 閱讀量: 發(fā)表時間:2024-04-16
近日,北京市藥監(jiān)局發(fā)布《北京市人工智能醫(yī)療器械生產(chǎn)質(zhì)量管理規(guī)范檢查指南(2024版)》(以下簡稱《檢查指南》),我們將其中第四部分“設計開發(fā)”內(nèi)容轉(zhuǎn)載如下:
生產(chǎn)企業(yè)應結(jié)合質(zhì)量管理體系要求,建立人工智能醫(yī)療器械生存周期過程,開展與軟件安全性級別相匹配的產(chǎn)品質(zhì)量保證工作,確定需求分析、數(shù)據(jù)收集、算法設計、驗證與確認、部署運行、更新控制等活動要求,將風險管理、可追溯分析(需包含算法和數(shù)據(jù))貫穿于生存周期全程,形成記錄。
1. 需求分析應當以用戶需求與風險為導向,結(jié)合產(chǎn)品的預期用途、使用場景、核心功能,綜合分析法律、法規(guī)、規(guī)章、標準、用戶、產(chǎn)品、功能、性能、接口、用戶界面、網(wǎng)絡安全、警示提示等需求,明確風險管理、可追溯性分析、數(shù)據(jù)收集、算法性能、使用限制、現(xiàn)成軟件(現(xiàn)成算法)的驗證與確認等活動要求,形成相應文件。
2. 數(shù)據(jù)收集應當確保數(shù)據(jù)來源的合規(guī)性、充分性和多樣性,數(shù)據(jù)分布的科學性和合理性,數(shù)據(jù)質(zhì)控的充分性、有效性和準確性。
3. 算法性能需結(jié)合醫(yī)療實際和產(chǎn)品定位,明確假陰性與假陽性、重復性與再現(xiàn)性、魯棒性/健壯性、實時性等性能指標的適用性及其要求,并兼顧不同性能指標的制約關(guān)系。
4. 使用限制需考慮產(chǎn)品禁用、慎用等場景,準確表述產(chǎn)品使用場景,提供必要警示提示信息。
1. 數(shù)據(jù)采集
數(shù)據(jù)采集應當明確采集設備、采集過程、數(shù)據(jù)脫敏等質(zhì)控要求,并建立數(shù)據(jù)采集操作規(guī)范。若使用歷史數(shù)據(jù),應當結(jié)合樣本規(guī)模、采集難度等影響因素合理選擇數(shù)據(jù)采集方式,明確數(shù)據(jù)篩選標準并對采集的數(shù)據(jù)進行質(zhì)量評估。
采集的數(shù)據(jù)應進行數(shù)據(jù)脫敏以保護患者隱私,數(shù)據(jù)脫敏需明確脫敏的類型(靜態(tài)、動態(tài))、規(guī)則、方法以及脫敏內(nèi)容的確定依據(jù)。如使用歷史數(shù)據(jù),企業(yè)接收的數(shù)據(jù)應為脫敏后的數(shù)據(jù),不得有敏感數(shù)據(jù)流入企業(yè)。
2. 數(shù)據(jù)整理
數(shù)據(jù)整理應基于原始數(shù)據(jù)庫明確數(shù)據(jù)清洗、數(shù)據(jù)預處理的質(zhì)控要求。數(shù)據(jù)清洗應當明確清洗的規(guī)則、方法、結(jié)果,數(shù)據(jù)預處理應當明確處理的方法(如濾波、增強、重采樣、尺寸裁剪、均一化等)、結(jié)果。數(shù)據(jù)經(jīng)整理后形成基礎數(shù)據(jù)庫,需明確樣本類型、樣本量、樣本分布等信息。
3. 數(shù)據(jù)標注
數(shù)據(jù)標注應當明確標注資源管理、標注過程質(zhì)控、標注質(zhì)量評估等要求,并建立數(shù)據(jù)標注操作規(guī)范。標注過程質(zhì)控包括人員職責(如人員資質(zhì)、人員數(shù)量、職責分工)、標注規(guī)則(如臨床指南、專家共識、專家評議、文獻分析)、標注流程(如標注對象、標注形式、標注輪次、標注步驟、結(jié)果審核)、分歧處理(如仲裁人員、仲裁方式)、可追溯性(如數(shù)據(jù)、操作)等要求。數(shù)據(jù)經(jīng)標注后形成標注數(shù)據(jù)庫,樣本類型可分為數(shù)據(jù)塊(如圖像區(qū)域、數(shù)據(jù)片段)、單一數(shù)據(jù)(由多個數(shù)據(jù)塊組成)、數(shù)據(jù)序列(由多個單一數(shù)據(jù)組成)。標注數(shù)據(jù)庫的樣本量、樣本分布等要求及風險考量與基礎數(shù)據(jù)庫相同。
數(shù)據(jù)標注若使用自動標注軟件,結(jié)果不得直接使用,應由標注人員審核后方可使用。
4. 數(shù)據(jù)集構(gòu)建
基于標注數(shù)據(jù)庫構(gòu)建訓練集、調(diào)優(yōu)集(若有)、測試集,應當明確訓練集、調(diào)優(yōu)集、測試集的劃分方法、劃分依據(jù)、數(shù)據(jù)分配比例。訓練集原則上需保證樣本分布具有均衡性,測試集、調(diào)優(yōu)集原則上需保證樣本分布符合真實情況,訓練集、調(diào)優(yōu)集、測試集的樣本應兩兩無交集并通過查重予以驗證。
數(shù)據(jù)擴增(若有)應當明確擴增的對象、范圍、方式(離線、在線)、方法(如翻轉(zhuǎn)、旋轉(zhuǎn)、鏡像、平移、縮放、濾波、生成對抗網(wǎng)絡等)、倍數(shù),在線擴增亦需予以記錄,擴增需考慮數(shù)據(jù)偏倚的影響及風險。原則上不得對測試集進行數(shù)據(jù)擴增,對抗測試除外。
數(shù)據(jù)經(jīng)擴增后應當形成擴增數(shù)據(jù)庫,需列表對比擴增數(shù)據(jù)庫與標注數(shù)據(jù)庫在樣本量、樣本分布(注明擴增倍數(shù))等差異,以證實擴增數(shù)據(jù)庫樣本量的充分性以及樣本分布的合理性。
1. 算法選擇
算法選擇應當提供所用算法的名稱、類型(如有監(jiān)督學習、無監(jiān)督學習,基于模型、基于數(shù)據(jù),白盒、黑盒)、結(jié)構(gòu)(如層數(shù)、參數(shù)規(guī)模)、輸入輸出數(shù)據(jù)類型、流程圖、算法編程框架、運行環(huán)境等基本信息,并明確算法選用依據(jù),包括選用的理由和基本原則。若組合使用集成學習、遷移學習、強化學習等,需提供算法基本信息以及算法選用依據(jù)。
2. 算法訓練
算法訓練應當基于訓練集、調(diào)優(yōu)集進行訓練和調(diào)優(yōu),考慮評估指標、訓練方式、訓練目標、調(diào)優(yōu)方式、訓練數(shù)據(jù)量—評估指標曲線等要求。
3. 算法性能評估
算法性能評估應當基于測試集對算法設計結(jié)果進行評估,綜合評估假陰性與假陽性、重復性與再現(xiàn)性、魯棒性/健壯性、實時性等適用性,以證實算法性能滿足算法設計目標,并作為軟件驗證、軟件確認的基礎。若使用第三方數(shù)據(jù)庫開展算法性能評估,應當提供第三方數(shù)據(jù)庫的基本信息(如名稱、創(chuàng)建者、數(shù)據(jù)總量等)和使用情況(如測試數(shù)據(jù)樣本量、評估指標、評估結(jié)果等)。
對于黑盒算法,應開展算法性能影響因素分析,并提供算法性能影響因素分析報告,明確影響算法性能的主要因素及其影響程度,以及產(chǎn)品使用限制和必要警示提示信息。
1. 軟件驗證
軟件驗證應當基于軟件需求予以開展,保證軟件的安全有效性,并作為軟件確認的基礎。
2. 軟件確認
軟件確認測試應當基于用戶需求,由預期用戶在真實或模擬使用場景下予以開展,涵蓋現(xiàn)成軟件、網(wǎng)絡安全的測試要求,確定缺陷管理、風險管理、可追溯性分析、評審等活動要求,形成用戶測試記錄、測試報告以及評審記錄并經(jīng)批準,適時更新并經(jīng)批準。可追溯性分析此時應當分析用戶測試與用戶需求、用戶測試與風險管理的關(guān)系。同時,開展算法性能比較分析,若各類測試場景(含臨床評價)算法性能變異度較大,詳述原因并基于分析結(jié)果明確產(chǎn)品使用限制和必要警示提示信息。最后,結(jié)合算法訓練、算法性能評估、臨床評價等結(jié)果開展算法性能綜合評價,針對訓練樣本量和測試樣本量過少、測試結(jié)果明顯低于算法設計目標、算法性能變異度過大等情況,對產(chǎn)品的適用范圍、使用場景、核心功能進行必要限制。
基于測評數(shù)據(jù)庫開展的,除滿足數(shù)據(jù)庫通用要求(如數(shù)據(jù)管理、網(wǎng)絡安全與數(shù)據(jù)安全、可擴展性)外,還應滿足權(quán)威性、科學性、規(guī)范性、多樣性、封閉性和動態(tài)性要求。不應使用公開數(shù)據(jù)庫作為測評數(shù)據(jù)庫。
算法發(fā)布和更新時應在相關(guān)文件列明算法關(guān)鍵模塊的功能、接口、版本、存儲形式(如pt、pth、bin、onnx、pb、keras、ckpt、pkl等);主要功能組件模塊及相互依賴和接口關(guān)系;軟件的前后端部署方式;對基礎軟件和硬件的依賴和兼容性要求等。
人工智能醫(yī)療器械若發(fā)生算法更新、軟件更新,均應當按照質(zhì)量管理體系的要求,開展與算法更新、軟件更新的類型、內(nèi)容和程度相適宜的驗證與確認活動,將風險管理、可追溯分析貫穿于更新全程,形成記錄。此外,算法更新、軟件更新均需考慮引入回滾機制,以保證醫(yī)療業(yè)務的連續(xù)性,特別是對風險較高的軟件。
軟件版本控制應當基于合規(guī)性要求確定軟件版本命名規(guī)則,涵蓋自研軟件、現(xiàn)成軟件、算法(算法驅(qū)動型更新或數(shù)據(jù)驅(qū)動型更新)網(wǎng)絡安全的全部軟件更新類型,明確并區(qū)分重大軟件更新和輕微軟件更新,并符合軟件版本命名規(guī)則的要求。
對數(shù)據(jù)集進行用途(如訓練、調(diào)優(yōu)、測試、驗證等)的變更,應按照數(shù)據(jù)集管理體系的要求進行確認形成記錄。高控制等級的數(shù)據(jù)集停用后數(shù)據(jù)可流入低控制等級的數(shù)據(jù)集,不允許低控制等級的數(shù)據(jù)集向高控制等級流動(測試集數(shù)據(jù)可變更為訓練和調(diào)優(yōu)使用,不可將訓練集、調(diào)優(yōu)集的數(shù)據(jù)變更為測試使用)。數(shù)據(jù)集數(shù)據(jù)的變更,應按照建立數(shù)據(jù)集過程相同的質(zhì)量體系進行管理,并記錄更新內(nèi)容和版本變更。
人工智能醫(yī)療器械全生命周期過程中應當考慮網(wǎng)絡安全與數(shù)據(jù)安全問題,對網(wǎng)絡與數(shù)據(jù)安全過程的控制要求形成文件,包括數(shù)據(jù)轉(zhuǎn)移要求,數(shù)據(jù)整理、數(shù)據(jù)集構(gòu)建、算法訓練等內(nèi)部活動開展過程中的數(shù)據(jù)污染防護措施,以及數(shù)據(jù)標注、軟件確認等涉及外部活動開展過程中的數(shù)據(jù)污染防護措施及數(shù)據(jù)接口要求。
各數(shù)據(jù)庫(集)均需進行數(shù)據(jù)備份,明確備份的方法、頻次、數(shù)據(jù)恢復方法。
數(shù)據(jù)庫和數(shù)據(jù)集訪問應明確授權(quán)訪問管理要求,形成文件及記錄。
人工智能醫(yī)療器械軟件應明確算法的軟件安全性級別(輕微、中等、嚴重)并詳述判定理由。應形成算法風險管理資料,明確過擬合與欠擬合、假陰性與假陽性、數(shù)據(jù)污染與數(shù)據(jù)偏倚(如數(shù)據(jù)擴增引入的偏倚)、中外差異等風險的控制措施。
可追溯性分析應當建立控制程序,涵蓋軟件、現(xiàn)成軟件、算法及數(shù)據(jù)、網(wǎng)絡安全的控制要求,形成軟件及算法的可追溯性分析報告。使用可追溯性分析工具保證軟件開發(fā)、軟件更新過程滿足可追溯性要求,并貫穿于軟件生存周期全過程。提供算法可追溯性分析報告等相關(guān)文件及記錄,即追溯算法需求、算法設計、算法實現(xiàn)、算法驗證與確認、風險管理、數(shù)據(jù)集的管理。若無單獨文檔可提供軟件可追溯性分析報告,并注明算法可追溯性分析所在位置。
以上僅對《檢查指南》部分內(nèi)容進行轉(zhuǎn)載,如需查看全文,請點擊“閱讀原文”
信息來源:北京市藥監(jiān)局
排版整理:金飛鷹藥械
醫(yī)療器械注冊咨詢認準金飛鷹 深圳:0755-86194173 廣州:020 - 82177679 四川:028 - 68214295 湖南:0731-22881823 湖北:181-3873-5940 江蘇:135-5494-7827 廣西:188-2288-8311 海南:135-3810-3052