DNA序列脱落时会发生什么?

DNA测序产生大量数据,基本上包含许多DNA字母的很短的部分。第一步是检查序列是否在我们一起开始将部分拼接之前的最高质量。

生物信息学1:质量控制

什么是挑战?

  • 在我们测序DNA样本后,我们需要一个过程来检查:
  1. 制备用于测序的DNA样品的过程的实验室阶段已经适当工作
  2. 执行测序本身的仪器已正常运行
  3. DNA样品来自单个源,没有被另一种样品的DNA污染。

我们需要做什么?

  • 质量控制是一系列广泛的程序,以确保样品和DNA序列质量很好。它用于检查所有DNA序列是:
  1. 合适的品质可以被发送并用于科学研究。
    • 评估这种方式的一种方法是通过观察测序机的每个车道的每个MM2中的DNA(在簇中测量)。
    • 对于要接受的样品,应有数十万到数百万的DNA簇/每毫米2每个车道(取决于使用的测序机)。如果群集的数量超出了某个机器的范围,则表示在排序期间出现出现问题,并且不接受样本进行进一步处理。
    • 还测量来自DNA碱基的信号的强度。信号应尽可能亮,特别是对于序列中的第一基座。如果信号是暗淡的,这意味着某些东西可能出错或者机器上的相机超出了焦点。
  2. DNA样品没有与另一种样品的DNA污染。
    • 通过将DNA序列与参考基因组对准,为该生物体对准并检查它与物种相匹配来检查。例如,如果您对鼠标基因组进行了测序,您希望看到98-99%的匹配与参考鼠标基因组和与其他参考基因组的更低匹配。它永远不会是100%,因为相同物种的个体之间总是存在一些遗传变异。
    • 在测序之前,将个体'标签'添加到每个DNA样品中。这些标签是DNA的短序列,其充当条形码以鉴定来自同一个体的DNA片段。然后,这些都可以容易地识别和排序。测序后,如果在样本中没有出现标记,当它应该是在排序之前或期间出现问题的标志。这可能是污染或人为错误的结果。
  • 将序列数据从机器上传递然后进行初级分析所需的时间大约需要三到四天完成。虽然,手动质量控制过程通常只需要一个小时。
  • 在此之后,样本将通过或失败。
  • 如果样本失败,则将丢弃失败的序列,并将再次执行测序。
  • 对于通过的所有样本,DNA序列以大数据“桶”存储在大数据上以及有关样本的附加信息。这将包括DNA序列来自哪种样品,其来自的物种和哪些研究的研究被测序。

此页面上次更新于2021-04-21