“垃圾基因”数据库收获全球遗传学家“粉丝”

  • 时间:
  • 浏览:0

  “打个类比,不可能 你们你们 的遗传信息是一座山,遗传学家知道这山上边有金子,但你们你们 用的是锄头。你们你们 的工作后来我我给你们你们 打造‘挖矿机’,帮你们你们 把有有哪些金子很快地挖出来来;并把你们你们 不可能 挖出来的东西展现出来,构建成资源库,方便你们你们 使用。”华中农业大学信息学院、生物医学与健康学院教授龚静原先解释你们你们 的研究。

  龚静的团队最近在英国《核酸研究》杂志先后发表3篇文章。你们你们 通过对多种癌症中遗传变异的功能进行深入分析,发现了少量可调控非编码核糖核苷酸(ncRNA)和可选折 性多聚腺苷酸化(APA)的遗传变异位点,构建了在线数据库,并开放给全球的研究者共享。

  “其中原先数据库上线另原先月,就不可能 有2原先国家1446次的访问了!”龚静接受科技日报记者采访时表示,她为个人的这个 项研究能收获世界各地的粉丝而感到欣慰。

  从“垃圾基因”上边“挖”宝

  龚静对其中一项研究进行了详细的解释,她说:“表达数量性状座位(eQTL)是指基因组还可不可以 否影响基因表达的遗传变异位点。eQTL分析是解析遗传功能和寻找致病基因的重要土法子之一,已广泛用于遗传研究中。”

  基因分为编码基因和非编码基因。然而,目前大偏离 研究专注于编码基因相关的eQTL鉴定, 非编码相关的eQTL系统分析非常少。龚静表示,非编码比编码基因数据更庞大。十年前你们你们 觉得不重要,甚至大家把它称为“垃圾基因”,但现在你们你们 发现它有不要 的功能,甚至参与到癌症的所处发展过程。

  从事生物信息技术研究多年的龚静,一年前正是就看了非编码相关eQTL系统分析的不够,决定带领团队来填补这个 空白。你们你们 使用癌症基因组图谱(TCGA)近1万多个样本的基因组和非编码表达量信息,系统分析了33种癌症中遗传变异与非 编码表达量之间的关系。

  通过大样本、多组学分析,在33种癌症中,你们你们 一共鉴定得到与长非编码相关的300多万种顺式eQTLs和70多万种反式eQTLs。你们你们 进一步将已鉴定的eQTLs和癌症病人生存信息关联并分析后,选折 了与患者总生存时间相关的823有几个长非编码RNA-eQTLs和116个microRNA-eQTLs。

  在此基础上,你们你们 构建了原先在线数据库。在这个 网站上,一些研究者还可不可以 方便地浏览及查询多种癌症相关的eQTL数据。

  有有哪些eQTL数据,将有有利于理解遗传风险等位基因如保有利于肿瘤的所处和发展,帮助遗传学家更好地认识非编码基因在癌症进展中的作用和珍物学机理,为潜在的癌症靶标的开发提供新思路。

  还可不可以 扩展到动物和植物

  本科学医和博士选折 生物信息学的背景,让龚静有了更多的跨学科思维。她认为,生物信息学家的原先重要责任后来我我为生物学家和遗传学家,以及临床工作者提供更方便的工具和数据资源。

  龚静说:“不可能 非编码相关的eQTL研究很少,这也就原因 能供你们你们 参考的研究土法子也比较少,所以土法子的选折 、数据的派发分析、相关数据库的构建等还要你们你们 知难而进。为了提高你们你们 研究的可信度和可行度,你们你们 使用的就有来自专业癌症数据库的表型样本和存活信息,有有哪些就有经过业界认证的可靠数据。”

  在数据库建设方面,如保体现专业科学的一起去又让用户易用易懂?这花费了你们你们 少量的时间。你们你们 更迭了多个版本,从配色、排版和内容的填充都经不要 次讨论,目的后来我我给一些科研人员提供原先直观的数据库,尽最大努力呈现原先专业数据库应有的价值形式。

  你们你们 的遗传研究土法子不仅还可不可以 用于癌症还可不可以 扩展到一些的疾病。一起去,还可不可以 扩展到对动物和植物的研究。近期,你们你们 通过广泛派发动物的基因组测序数据并进行除理,构建了1有几个物种的基因组参考面板,打造了原先用于动物遗传数据填补的数据库。这个 数据库还可不可以 广泛应用到动物遗传育种及品质改良等研究中。数据库中的数据及提供的工具还可不可以 极大地节省研究的成本和时间,大大提高科研下行速率 。

  龚静说,后期你们你们 将继续维护并持续更新有有哪些数据库,希望能让更多研究者受益。另外,你们你们 也考虑根据已开发的数据库和已鉴定的有潜在功能的遗传位点,将你们你们 的研究进一步深化。

  具体来说,后来我我将生物信息土法子得到的结果与人群分子流行病学、分子生物学相结合,深入挖掘遗传位点的功能,希望通不要 维度的分析寻找并鉴定这个癌症相关的生物标志物不可能 药物靶标,真正实现产学研结合,推动临床生物医学实践,以此造福大众。(吴言 记者 刘志伟)