标题:通过深度卷积神经网络增强和比较Hi-C数据
演讲人: 唐继军
时间: 2018-07-15 14:00-2018-07-15 15:00
地点:FIT 1-222

内容:

染色质的三维空间结构是表观遗传学领域中的一个重要分支。近几年一系列的报道证实了染色质空间结构变化在细胞分化,重编程,以及人类发育疾病中都起到了很重要的作用。尽管目前可以用于研究三维基因组的实验手段越来越多,其中最重要的还是Hi-C技术。但是由于人类基因组的庞大,想达到高分辨率的Hi-C数据,需要超过数十亿的测序深度,耗费非常巨大。卷积神经网络是深度学习领域中的一个重要构架。在计算机视觉中的超分辨率研究中,通过在高清图片中训练一个多层神经网络,即可实现对低清图片的分辨率进行提高的效果。Hi-C数据和图片有一定的相似性,但是其特点又有很大的不一样,无法直接套用超分辨率研究中的方法。尽管如此,多层神经网络在超分辨研究中的成功,显示其在深度挖掘HiC数据中也有着巨大潜力。我们的研究搭建了一个基于神经网络的提高Hi-C数据精准度的数据分析工具(HiCPlus),这个工作是深度学习3D基因组学上的先驱性的应用,其结果可以极大的提高现有的HiC数据的可用性,从而挖掘出更多的生物学意义,最终为3D基因组的的原理机制提供探索的依据。



人物介绍:

唐继军博士,美国南卡罗来纳大学计算机科学与工程系教授。1994年获得天津大学海船系船舶工程学士,1996年获得天津大学海洋 工程硕士,2004年获得美国新墨西哥大学计算机科学博士学位。从2004年起任职美国南卡罗莱纳大学工程和计算学院计算机系至终身教授。主要研究领域为生物信息和计算生物学,研究方向为算法设计分析,高性能计算,数据库构建等。主要通过算法,人工智能以及数学和统计方法,利用全基因组 数据高效和精确分析基因组进化和系统发育,建立和显示基因组三维空间模型,采集和挖掘生态和气候变化数据,以及构建相关生物信息学计算平台。迄今在国际会议和期刊上发表文章百篇,研究项目多次 获得美国NSF,NIH,NEH和其他机构的支持。