(通訊員劉婷)11月30日上午,華中師范大學(xué)計算機學(xué)院計算機科學(xué)與技術(shù)系主任蔣興鵬教授來我院做題為《基于文本挖掘的微生物知識圖譜構(gòu)建》的講座,信息管理科學(xué)系主任陸泉教授主持。

細(xì)菌之間的交互作用是探索微生態(tài)系統(tǒng)與人類健康關(guān)聯(lián)的關(guān)鍵因素。蔣興鵬圍繞如何理解這一問題,介紹了其團隊開展的如何快速準(zhǔn)確的從海量醫(yī)學(xué)文本中挖掘出細(xì)菌交互網(wǎng)絡(luò)的一系列研究。從細(xì)菌文本中識別細(xì)菌的命名實體是難點之一,這主要是因為細(xì)菌命名實體的獨特屬性,如種類與寫法繁多、更新快等,同時細(xì)菌間的交互作用關(guān)系極其復(fù)雜,從文本中自動抽取細(xì)菌間關(guān)系也缺少標(biāo)準(zhǔn)的語料庫和正負(fù)樣本集為參考。通過標(biāo)注文本摘要的細(xì)菌實體和交互關(guān)系數(shù)據(jù),研究了基于深度學(xué)習(xí)和自然語言模型方法的細(xì)菌命名實體識別以及關(guān)系抽取方法,該方法能夠從PubMed文獻庫和維基百科等大規(guī)模數(shù)據(jù)中有效識別細(xì)菌實體以及交互關(guān)系,并構(gòu)建為多層微生物知識圖譜,為進一步的分析與預(yù)測奠定了基礎(chǔ)。
講座結(jié)束時,與會教師和研究生就自己感興趣的問題與蔣興鵬作了進一步的交流和討論。