深入研究人与病毒蛋白相互作用不仅可以加深对病毒侵染宿主的致病机制的理解,还可以为抗病毒药物靶标发现提供指导。然而,现有的人与病毒蛋白互作数据资源还不完善,缺乏充分的功能注释,且通常不提供人与病毒蛋白互作的预测工具。因此,张子丁课题组开发了一个人与病毒蛋白质相互作用综合数据库(Human Virus Interaction DataBase, http://zzdlab.com/hvidb/), 它提供了全面注释的人与病毒蛋白互作数据, 并无缝集成了在线蛋白互作预测工具。此项工作已发表在Briefings in Bioinformatics上, 题为“HVIDB: a comprehensive database for human–virus protein–protein interactions”。
目前, HVIDB存储了48,643个实验验证的人-病毒蛋白互作数据, 涵盖35个病毒科, 6,633个病毒靶向宿主复合物, 3,572个宿主依赖/限制因子以及911个实验验证/预测的人与病毒蛋白互作的三维复合物结构。此外, 该数据库资源还提供了6,790个病毒靶向人类基因的组织特异性表达谱和129个病毒感染后差异表达基因的表达系列。基于这些多组学和注释性的数据, HVIDB可以使用户轻松获取各种人与病毒蛋白质相互作用的可靠信息, 并对其内在的生物学意义进行深入分析。特别是,HVIDB还集成了性能良好的机器学习模型来预测人类和病毒蛋白之间的相互作用, 包括基于序列嵌入式编码技术的随机森林模型,同源映射方法和结构域相互作用推断方法。综上,HVIDB有望作为一站式的知识库,进一步指导假设驱动的人与病毒互作相关的实验工作。
中国农业大学生物学院博士生杨晓迪为该论文的第一作者, 美国Miami大学计算科学系副教授Stefan Wuchty博士参与了部分研究工作,张子丁教授和课题组已毕业研究生杨世平博士为该论文的共同通讯作者。该研究得到了国家重点研发项目 (2017YFC1200205) 的经费支持。