新聞動態

                Dynamics

                首頁 >  新聞動態  > 詳情

                《柳葉刀》子刊發布實驗室最新成果:基于病理圖像的空間圖神經網絡預測癌癥多分子結果

                10月26日,上海人工智能實驗室智慧醫療研究中心與合作伙伴公布了最新研究成果——基于病理圖像的空間圖神經網絡預測癌癥多分子結果,聚焦“AI+醫療”交叉領域。研究論文《Spatially aware graph neural networks and cross-level molecular profile prediction in colon cancer histopathology: a retrospective multi-cohort study》發表于最新一期國際學術頂級期刊《柳葉刀》(The Lancet)子刊《柳葉刀-數字醫療》(The Lancet Digital Health)(IF: 36.615)。此項研究為癌癥多尺度數據整合和臨床結果預測提供了新路徑。

                ded392634f2952f9caa79c54fb787e5.png

                論文刊登頁面

                多尺度生物信息的收集、分析和驗證為更好理解癌癥演變和藥物治療提供了關鍵信息。通過AI模型的分析,科研人員有望發現針對癌癥的關鍵標志物特征及預測多項臨床的關鍵結果。根據世界衛生組織發布的數據,直結腸癌(Colon cancer)是全球最常見三大癌癥之一,占2020年所有新發現癌癥的10%和所有癌癥死因的約9.4%。該疾病與關鍵分子的變異、組織病理學變化有密切關系,例如基因突變和蛋白質組表達。數字化的病理切片為評估癌癥微環境的空間背景提供了獨特渠道。如何探索這些空間特征是當前相關研究的重要課題之一。組織病理學中空間和拓撲結構廣泛存在與癌癥臨床研究中,但很少在定量的機器學習背景下進行探索。通過新的圖網絡模型能夠挖掘基于空間的圖像特征,有望更深刻地識別癌癥分子層的變化并加深科研人員對癌癥生物學的理解。

                420b3837f860dffd22b8e7c37ab08b1.png

                (a)展示TCGA和CPTAC病理公開數據集。(b)展示對應的癌癥基因突變數據集。(c)針對病理切片圖像,該方法建立基于腫瘤區域的圖模型(tumor tile)。(d)模型分析路線包括空間圖建立,GNN模型分析,多類別腫瘤分子預測任務建立和結果分析。

                針對以上問題,該研究提出了一種基于圖的神經網絡方法,通過腫瘤的病理切片的區域相互關聯來探索腫瘤微環境的空間信息。研究強調空間背景以構建腫瘤區域并連接圖來表示組織病理學數據,而無需明確的病理切片標注,提供有效的解決腫瘤內空間異質性的方法,這對于了解結腸癌患者的預后至關重要。研究結果發現,一系列的癌癥分子和組織病理學關聯,其結果能用來(i)推斷預后價值(例如,KRAS和TP53突變),(ii)評估細胞進展(例如,PLAGL2和POFUT1拷貝數改變),以及(iii)確定結腸癌中的靶向療法(例如,EGFR蛋白表達)。

                1beaee865ff789c9e5d57c191780fca.png

                (a)-(c)展示在結腸癌上的分子突變結果,基因組拷貝數預測結果,蛋白組學活動預測結果。(d)-(f)展示對應的p值分布。(g)-(i)展示在直腸癌上的分子突變結果,基因組拷貝數預測結果,蛋白組學活動預測結果。(j)-(l)展示對應的p值分布。

                從結果上來看,基于空間的圖模型能夠預測結腸癌(TCGA-COAD)的多項分子變量(例如基因突變、CNA基因和蛋白質表達)和直腸癌的驗證結果(TCGA-READ)。該算法在多種基因突變中展現良好的預測效果(比如FAT3,ZFHX4,CSMD1,FLG),并在蛋白表達的預測上也展現出預測能力(比如HER3,PTEN,BRAF)。其中高表達的HER3分子在不同癌癥中廣泛存在,包括大腸癌、乳腺癌、頭頸癌等。挖掘基于網絡圖的腫瘤的相關空間信息和傳統CNN模型下的特征抓取有顯著區別。該研究一共收集了超過89萬張腫瘤片區的病理數據。同時收集了每個病人的基因突變、DNA分子突變和蛋白活動指標信息。

                6b9d124d4147a07d61ade0a92165ddd.png

                圖模型在TCGA-COAD上的TP53基因突變的預測結果。(a)代表具有TP53突變結果的原始病理切片圖像。(b)顯示了五個子圖模型標記的突出區域。不同的顏色代表子圖模型中不同的關鍵腫瘤區域。(c)-(g)顯示了從五個子圖模型中識別出的前10個腫瘤區的放大視圖,這些圖塊按其重要性分數以降序排列。從腫瘤病理學的角度來看,模型2和模型3的可視化結果中常見大面積壞死,而模型1,模型4和模型5中較少見。此外,單細胞壞死在模型1的圖像中很常見,而在模型5中很少見。(h)顯示了五個子圖之間的圖測量的平均統計結果。

                在應用價值層面,本研究為癌癥多尺度數據整合和臨床結果預測提供了新路徑。不同癌癥的聯合分析將進一步挖掘該方法的臨床價值,并幫助病理學家獲得識別結腸癌分子特征及管理其他癌癥。該研究也發現,分子的類別不平衡在癌癥中很常見,這使得訓練樣本不足成為優化模型開發的主要挑戰之一。例如,TM9SF4、TPX2、TSPY26P和WWOX這樣的拷貝數改變基因在隊列中僅具有約7.69%的突變率,盡管它們在結腸分子病理學中代表了有意義的臨床相關性。通過評估跨癌癥類型的模型一致性,將基于圖的分析擴展到多癌癥環境也很有意義。癌癥的分子、病理學和預測研究的前景正在迅速演變,對分子類別長尾特征建模的持續研究將揭示更多的癌癥中基因組-病理學關聯。本論文作者為美國北卡羅來納大學計算機系博士生丁可昕,上海人工智能實驗室智慧醫療研究中心顧問、美國羅格斯大學計算機系訪問教授Mu Zhou,美國耶魯大學醫學院病理專業教授He Wang,通訊作者為上海人工智能實驗室智慧醫療研究中心教授張少霆和美國羅格斯大學計算機系教授Dimitris Metaxas。如需申請或了解課題組更多信息,請發郵件至 zhangshaoting@pjlab.org.cn,抄送jilu@pjlab.org.cn。


                【上海人工智能實驗室智慧醫療研究中心】

                旨在通過人工智能與醫學的深度交叉融合,賦能醫療健康,打造國際一流的智慧醫療研究團隊,突破人工智能相關理論和關鍵技術,建立疾病預警、早篩、診斷、治療與療效評價的智能化技術體系,形成具有廣泛國際影響力的智慧醫療成果應用及推廣體系。

                中心正面向全球招募領軍人才、青年研究員、博士后、工程師及產品經理等崗位,歡迎登陸上海人工智能實驗室官方網站(www.doiiod.net),點擊導航欄“加入我們”,在該頁面搜索框輸入“智慧醫療”查看崗位并進行投遞。

                comm@pjlab.org.cn

                上海市徐匯區云錦路701號西岸國際人工智能中心37-38層

                滬ICP備2021009351號-1

                        
                        

                              拔萝卜又叫又疼原声视频