港中大深圳研究院科研团队整合搭建TEDD数据库,为基因研究提供多参数可视化查询结果
近日,香港中文大学蔡光伟教授及董梓瑞博士团队和深圳华大生命科学研究院谈聪博士团队在Nucleic Acids Research杂志上发表题为TEDD: a database of temporal gene expression patterns during multiple developmental periods in human and model organisms的论文。该论文整合分析了来自人与多种模式生物的2760个组织的RNA测序数据,以及510万个单细胞测序数据(单细胞RNA-seq和单细胞ATAC-seq),提供了从胚胎期、胎儿期、新生儿期、儿童期以及成年各个发育阶段的基因表达与染色质可及行,并整合发布TEDD(Temporal Expression during Development Database)数据库。
此次研究揭示关键基因的表达(expression)与染色质可及行(chromatin accessibility)的特殊性,是解答该基因的where(特异细胞和组织类型)、when(特殊时间点)和how(与其他基因的互作)等问题的关键,也是了解该基因在组织发育的功能以及可能的疾病致病机制的基础。随着单细胞测序技术的快速发展,越来越多的针对人类或不同模式生物不同器官与发育时间段的单细胞测序的文章相继发表,然而,如何整合与挖掘此类数据仍然是现阶段的主要难题之一。
该论文通讯作者之一,香港中文大学妇产科学系助理教授、香港中文大学深圳研究院副研究员董梓瑞博士指出:“我们整合搭建的TEDD数据库,为研究人员提供在单一目标基因、多目标基因以及无目标基因各种情况下,查询不同基因的组织类型特异性、细胞类型特异性或时间点特异性的表达与染色质可及性频谱的结果,多参数、可视化查询,为研究人员进一步研究人或模式生物发育过程中或与致病性机理相关的基因提供基础。”
TEDD通过友好的交互界面:1)使研究人员能够了解细胞类型、组织类型和时间点特异性表达模式的差异,以及所查询基因在单细胞水平上的染色质可及性特征;2)提供一个集成网络以识别在不同细胞类型、时间点和性别条件下目标基因共表达的细胞;3)分析和聚类基因的表达模式,特别是研究来源于相同GO或KEGG下的多基因的表达互作;和4)在所选细胞类型、组织类型和时间点上鉴定具有与查询基因相似或不同表达谱的基因。
TEDD应用概述
具体来说,用户通过TEDD导航栏子菜单引导即可进入相应功能页面:
1)以UMAP展示基因表达与染色质可及性。为了更好地展示数据,在输入参数(物种、组织类型和查询基因等)后,TEDD按照细胞类型、组织类型、时间点以及性别4种不同要素标记UMAP中的细胞,用户亦可手动去除某一或某些标记(如细胞类型)仅保留其感兴趣的部分,基因表达或染色质可及性以热图形式展示。为了便于比较,TEDD还可在同一界面展示两个查询结果。
2)共表达分析。在以往研究中科研人员较难确认具有多基因共同表达的细胞类型与表达比例。TEDD解决了这一难题,其提供了细胞类型、时间点以及性别3种不同要素下,共表达多个目标基因的细胞类型以及比例,供研究者挑选下一步实验的对象。
3)多基因表达趋势聚类分析。在选择参数(物种、组织类型、细胞类型和时间点等)后,TEDD提供多基因列表进行表达聚类,用户也可查询目标基因所在的GO和KEGG通路获取该通路所包含的基因列表进行表达聚类。
4)时序性特异表达基因查找。TEDD提供同一组织类型、不同时间节点中存在显著差异表达的基因;也可选择不同组织类型、细胞类型和时间节点后,在自定义差异倍数变化及最大输出基因个数的情况下,查找与已检测到差异表达基因存在相同或不同表达趋势的基因列表,供研究人员进一步探索不同基因之间的调控关系。此外,TEDD提供时序性稳定表达基因查找功能。
5)多细胞RNA表达量查询。由于单细胞实验过程中可能存在因实验原因导致细胞丢失的情况,TEDD包含多细胞RNA测序分析结果(含不同组织类型、时间节点等),供研究人员查询目标基因的表达量。
时间和组织/细胞类型特异性表达基因的研究示例
相关链接
原文链接:https://doi.org/10.1093/nar/gkac978
数据库链接:https://TEDD.obg.cuhk.edu.hk/.
项目团队
蔡光伟教授及董梓瑞博士以香港中文大学妇产科学系产前遗传诊断中心(已获得加拿大诊断Canada Diagnosis实验室认证和中国国家药品监督管理局NMPA认证)及深圳研究院遗传学与基因组学实验室为基础,长期开展产前、新生儿等的遗传检测服务。该中心是亚洲区域第一个产前芯片应用中心,目前基于基因芯片的产前诊断技术已经被香港医管局采纳为公共产前诊断技术,为香港地区高危妊娠人群提供免费检测。此外,该中心开发了包括低深度全基因组测序技术等多种技术,可有效检测拷贝数变异、结构性重组以及杂合性缺失(染色体纯合区域)等基因组变异,提高疾病致病性变异的检测以及为研究疾病发生发展机制提高平台。中心获得香港研资局、食物及卫生局、创新科技及工业局和国家、广东省及深圳市等多方面研究经费支持。
本研究获得深圳市科创委(#2021Szvup146)、香港健康与医学研究基金(#08190226, #09200236)、香港合作研究基金(#C4062-21GF)和广东省基因组学数据中心(#2021B1212100001)建设项目等经费的资助。
团队目前在深圳研究院承担的项目:
蔡光伟教授
1. 深圳市宝安区妇幼保健院与香港中文大学、香港中文大学深圳研究院合作项目:胎儿医学建设与人才培养合作(2020-2022)
2. 广西壮族自治区妇幼保健院与香港中文大学深圳研究院合作项目:高通量测序基因组拷贝数变异检测(2021-2023)
3. 深圳市宝安区妇幼保健院与香港中文大学深圳研究院合作项目:低深度全基因组测序(Low-pass WGS)临床应用研究(2018-2023)
董梓瑞博士
1. 国家自然基金面上项目:染色体插入突变的修复机制与致病机理研究(项目编号:32270678)
2. 深圳市项目-中央引导地方科技发展资金-自由探索类基础研究项目:基于DNA长片段测序对伴有超声结构畸形胎儿的染色体畸变研究(项目编号:2021Szvup146)
部分资料及图片来源:BioArtMED
https://mp.weixin.qq.com/s/xW9gpKjOm7AAAvf6byQgng