綜合新聞
陳立宏博士等在《Nucleic Acids Research》雜志在線發(fā)表最新一版“病原菌致病因子數(shù)據(jù)庫”
病原菌致病因子數(shù)據(jù)庫(簡(jiǎn)稱VFDB,http://www.mgc.ac.cn/VFs/)由我所陳立宏博士和楊劍研究員等于2004年建立(Chen L et al, Nucleic Acids Res. 2005)并長(zhǎng)期維護(hù),經(jīng)過十多年的不斷升級(jí)和更新已經(jīng)逐步發(fā)展成為國際上最大的病原細(xì)菌毒力因子資源中心,被國內(nèi)外同行廣泛使用。
近年來新一代測(cè)序技術(shù)帶來的生物大數(shù)據(jù)對(duì)病原菌毒力因子相關(guān)的數(shù)據(jù)分析提出了新的挑戰(zhàn)。為了滿足日益增長(zhǎng)的大數(shù)據(jù)分析需求,陳立宏博士等進(jìn)一步對(duì)VFDB的基礎(chǔ)數(shù)據(jù)進(jìn)行了整合與優(yōu)化,一方面改進(jìn)了底層的數(shù)據(jù)結(jié)構(gòu),去除了冗余數(shù)據(jù),整理生成由已知毒力因子構(gòu)成的核心數(shù)據(jù)集和包括所有潛在毒力因子的完整數(shù)據(jù)集。另一方面對(duì)核心數(shù)據(jù)集中的所有毒力相關(guān)基因的注釋信息進(jìn)行了審核與精煉,提高了VFDB數(shù)據(jù)庫的數(shù)據(jù)質(zhì)量。此外,還在VFDB數(shù)據(jù)庫中新增加了不動(dòng)桿菌、氣單胞菌、無形體、伯克氏菌、柯克斯氏體、立克次氏體等六個(gè)屬的信息和數(shù)據(jù),并引入了一個(gè)全新的基于JavaScript的圖形化用戶界面。
該研究工作不僅進(jìn)一步優(yōu)化和完善了VFDB數(shù)據(jù)庫,為其后續(xù)的發(fā)展奠定了基礎(chǔ);而且產(chǎn)生出了適用于大數(shù)據(jù)快速分析的高質(zhì)量非冗余毒力因子數(shù)據(jù)集,為VFDB數(shù)據(jù)庫在大數(shù)據(jù)時(shí)代的廣泛應(yīng)用鋪平了道路。該研究論文已收編在生物信息學(xué)領(lǐng)域國際著名期刊《Nucleic Acids Research》2016年數(shù)據(jù)庫???,并于近期在線發(fā)表。