美国加州大学圣地亚哥分校(UCSD)的研究人员制作了一份人类基因组的单细胞染色质图谱,确定了240种多基因特征和与疾病特征相关的细胞类型,并注释了非编码DNA变异的风险,有利于更好地理解遗传学与疾病之间的联系。这一发现发表在12日的《细胞》杂志在线版上。
此前,科学家在公布最新的被称为“生命之书”的人类基因组图谱时称,更为精确的计算表明,人类基因数量实际在2万到2.5万之间。然而,这个估计并不能真正解释蛋白质编码基因构建过程的确切工作方式,或者不适用于患有疾病的情况。
UCSD细胞和分子医学教授、路德维希癌症研究所成员、表观基因组学中心主任任兵(音译)博士是DNA元素百科全书项目成员之一。他表示,人类基因组在20年前就已被测序,但解读这本“生命之书”的意义仍然很有挑战性。一个主要原因是,人类DNA序列中超过98%是非蛋白质编码的,我们还没有遗传密码来“解锁”这些序列中嵌入的信息。
DNA携带细胞的遗传指令。染色质中的主要蛋白质,称为组蛋白,有助于将DNA紧密包装成适合细胞核的紧凑形式。染色质捆绑DNA方式的变化与DNA复制和基因表达有关。
在对小鼠进行研究后,任兵及其合作者将注意力转向人类基因组中染色质的单细胞图谱。他们对来自多个供体的30种成人组织类型中取样的60多万个人类细胞进行了分析,然后将这些信息与来自15种胎儿组织类型的类似数据结合,揭示了222种不同细胞类型中约120万个候选顺式调控元件的染色质状态。
顺式调控元件是非编码DNA区域,调节相邻基因的转录。过去十年的研究已经证实,非编码DNA的序列变异是人类群体中多基因特征和疾病的关键驱动因素,如糖尿病、阿尔茨海默氏症和自身免疫性疾病。然而,解锁非编码DNA变异功能的一个主要障碍是缺乏人类基因组中转录调控元件的细胞类型特异性图谱,而新图谱填补了这一空白。