Biopython - 基因组分析

基因组是完整的DNA集合,包括其所有基因.基因组分析是指个体基因及其在遗传中的作用的研究.

基因组图

基因组图将遗传信息表示为图表. Biopython使用Bio.Graphics.GenomeDiagram模块来表示GenomeDiagram. GenomeDiagram模块需要安装ReportLab.

创建图表的步骤

创建图表的过程通常遵循以下简单模式 :

  • 为要显示的每组独立特征创建一个FeatureSet,并向其中添加Bio.SeqFeature对象.

  • 为要显示的每个图形创建一个GraphSet,并向其添加图形数据.

  • 为图表上的每个曲目创建一个曲目,并将GraphSet和FeatureSets添加到您需要的曲目中.

  • 创建一个图表,然后添加跟踪它.

  • 告诉图表绘制图像.

  • 写图像到文件.

让我们举一个输入GenBank文件的例子 :

https://raw.githubusercontent.com/biopython/biopython/m aster/Doc/examples/ls_orchid.gbk 并从SeqRecord对象读取记录,然后最终绘制基因组图.它在下面解释,

我们将首先导入所有模块,如下所示 :

>>> from reportlab.lib import colors 
>>> from reportlab.lib.units import cm 
>>> from Bio.Graphics import GenomeDiagram

现在,导入SeqIO模块读取数据 :

>>> from Bio import SeqIO 
record = SeqIO.read("example.gb", "genbank")

这里,记录从中读取序列genbank文件.

现在,创建一个空图表来添加曲目和功能集 :

>>> diagram = GenomeDiagram.Diagram(
   "Yersinia pestis biovar Microtus plasmid pPCP1") 
>>> track = diagram.new_track(1, name="Annotated Features") 
>>> feature = track.new_set()

现在,我们可以使用从绿色到灰色的替代颜色应用颜色主题更改,如下所示 :

>>> for feature in record.features: 
>>>    if feature.type != "gene": 
>>>       continue 
>>>    if len(feature) % 2 == 0: 
>>>       color = colors.blue 
>>>    else: 
>>>       color = colors.red 
>>> 
>>>    feature.add_feature(feature, color=color, label=True)

现在你可以在屏幕上看到以下回复 :

<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dc90> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dfd0> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x1007627d0> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57290> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57050> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57390> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57590> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57410> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57490> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d574d0>

让我们绘制上述输入记录的图表 :

>>> diagram.draw(
   format = "linear", orientation = "landscape", pagesize = 'A4', 
   ... fragments = 4, start = 0, end = len(record)) 
>>> diagram.write("orchid.pdf", "PDF") 
>>> diagram.write("orchid.eps", "EPS") 
>>> diagram.write("orchid.svg", "SVG") 
>>> diagram.write("orchid.png", "PNG")

执行上述命令后,您可以看到Biopython目录中保存的以下图像.

** Result **
genome.png


创建图表

您还可以以圆形格式绘制图像通过进行以下更改和减号;

>>> diagram.draw(
   format = "circular", circular = True, pagesize = (20*cm,20*cm), 
   ... start = 0, end = len(record), circle_core = 0.7) 
>>> diagram.write("circular.pdf", "PDF")

染色体概述

DNA分子包装成线状结构称为染色体.每条染色体都是由DNA紧密卷绕在称为组蛋白的蛋白质周围,这些蛋白质支持其结构.

染色体在细胞核中是不可见的 - 甚至在显微镜下 - 当细胞是不分裂.然而,构成染色体的DNA在细胞分裂过程中变得更紧密,然后在显微镜下可见.

在人类中,每个细胞通常包含23对染色体,总共这些称为常染色体的二十二对在男性和女性中看起来都是一样的.第23对,性染色体,在男性和女性之间有所不同.女性有两个X染色体拷贝,而雄性有一个X染色体和一个Y染色体.