biopython相关内容
from Bio.Blast import NCBIXML from Bio.Blast import NCBIWWW result_handle = NCBIWWW.qblast( "blastn", "nr", "CACTTATTTAGTTAGCTTGCAACCCTGGATTTTTGTTTACTGGAGAGGCC", entrez_query='"Beuten
..
我正在尝试安装biopython以便在Windows7计算机上与Python 3.3一起运行. 我已经下载了biopython可执行文件biopython-1.61.win32-py3.3-beta.exe.但是,当我尝试运行可执行文件时,收到消息“需要Python版本3.3,该文件在注册表中找不到."我的计算机上有Python版本3.3.我已经通过它运行了一个或两个月的程序.它是从文件py
..
我有两个文件. 文件1:带有基因序列的FASTA文件,其格式如下例所示: >PITG_00002 | Phytophthora infestans T30-4 conserved hypothetical protein (426 nt) ATGCATCGCTCGGGTTCCGCACGGAAAGCCCAAGGTCTGGGATTACGGGGTGGTGGTCGG TTACACTTGGAAT
..
我有一个如下所示的文本文件 ATOM 920 CA GLN A 203 39.292 -13.354 17.416 1.00 55.76 C ATOM 929 CA HIS A 204 38.546 -15.963 14.792 1.00 29.53 C ATOM 939 CA ASN A 2
..
我的RNA序列包含不同的修饰核苷酸和残基.其中一些例如N79, 8XU, SDG, I. 我想使用biopython的pairwise2.align.localms成对对齐它们.为了准确地说明这些修改后的基数,是否可以将输入不是字符串形式而是列表形式? 什么是正确的技术? 解决方案 Biopython的pairwise2模块适用于字母字符串,该字符串可以是任何东西-例如:
..
我有一个15-mer核苷酸基序,该基序使用简并的核苷酸序列.例如:ATNTTRTCNGGHGCN. 我将搜索一组序列以查找该基序的出现.但是,我的其他序列是精确序列,即它们没有歧义. 我尝试在序列中执行for循环以进行搜索,但是我无法进行非精确搜索.我使用的代码是根据 Biopython食谱上的代码建模的. > for pos,seq in m.instances.search
..
因此,我正在尝试创建一个类,该类在三个不同的帧中读取DNA字符串-一个从位置0(或第一个碱基)开始,另一个从位置1(第二个碱基)开始,另一个从位置1开始.从位置2(第三个底端)开始读取.到目前为止,这就是我一直在玩的东西: def codons(self, frame_one, frame_two, frame_three): start = frame_one
..
我正在尝试使用Bio和SeqIO打开包含多个序列的FASTA文件,编辑序列名称以在所有名称的末尾删除".seq",(> SeqID20.seq应该变为> SeqID20),然后将所有序列写入新的FASTA文件,但是出现以下错误 AttributeError: 'str' object has no attribute 'id' 这就是我开始的: with open ('lots_o
..
我希望能够在Seq对象中搜索考虑了歧义代码的子序列Seq对象.例如,以下内容应为真: from Bio.Seq import Seq from Bio.Alphabet.IUPAC import IUPACAmbiguousDNA amb = IUPACAmbiguousDNA() s1 = Seq("GGAAAAGG", amb) s2 = Seq("ARAA", amb) #
..
我写了一个Python脚本来绘制泛素蛋白的"Ramachandran图".我正在使用biopython.我正在使用pdb文件.我的脚本如下: import Bio.PDB import numpy as np import matplotlib as mpl import matplotlib.pyplot as plt phi_psi = ([0,0]) phi_psi = np.arr
..
我尝试对已经对齐的序列评分. 让我们说 seq1 = 'PAVKDLGAEG-ASDKGT--SHVVY----------TI-QLASTFE' seq2 = 'PAVEDLGATG-ANDKGT--LYNIYARNTEGHPRSTV-QLGSTFE' 具有给定参数 substitution matrix : blosum62 gap open penalty : -5 gap
..
我正在尝试使用仿射间隙罚分函数实现Smith-Waterman算法以进行局部序列比对.我想我了解如何初始化和计算计算比对分数所需的矩阵,但是对于如何追溯然后找到比对却一无所知.要生成所需的3个矩阵,我需要以下代码 for j in range(1, len2): for i in range(1, len1): fxOpen = F[i][j-1] + gap
..
我正在尝试使用Python将DNA代码转换为RNA代码... 我这样写: print('Digite a sequência DNA a ser transcrita para RNA:') my_str = raw_input() print(my_str.replace('T', 'U')) 它有效,但是..现在我需要将 A转换为U , T转换为A , G转换为C 和 C到G
..
我正在使用python创建一个程序,该程序将一组DNA序列转换为氨基酸(蛋白质)序列.然后,我需要找到一个特定的子序列,并计算存在该特定子序列的序列数.这是我到目前为止的代码: #Open cDNA_sequences file and read in line by line with open('cDNA_sequences.csv', 'r') as results: for
..
编码新手. Pytho/biopython的新手;这是我有史以来第一个在线问题. 如何打开压缩的fasta.gz文件以提取信息并在函数中执行计算.这是我正在尝试做的简化示例(我尝试了不同的方式)以及错误是什么.我正在使用的gzip命令似乎不起作用. with gzip.open("practicezip.fasta.gz", "r") as handle: for record in S
..
我不知道这里可能是什么问题 我有一些来自Biopython的模块,当使用交互式提示或通过命令行执行python脚本时,可以轻松导入这些模块. 问题是,当我尝试在可通过网络执行的cgi脚本中导入相同的biopython模块时,出现“导入错误" :否 名为Bio 的模块 这里有什么想法吗? 解决方案 有以下两种可能性: Apache(在Unix上)通常以不同的用户身
..
你好,我有一个Fasta文件,例如: >sequence1_CP [seq virus] MQCKSGTNNVFTAIKYTTNNNIIYKSENNDNIIFTKNIFNVVTTKDAFIFSKNRGIMNL DITKKFDYHEHRPKLCVFKIINTQYVNSPEKMIDAWPTMDIVALITE >sequence2 [virus] MQCKSGTNNVFTAIKYTTNNNII
..
仅供参考:这不是重复的! 在运行我的python代码之前,我在cmd提示符下安装了biopython: pip install biopython 当我尝试将其导入python时,我收到一条错误消息,提示“没有名为Bio的模块" import Bio 同一件事发生在 import biopython 应该注意,我已经更新了PIP并运行python 3.
..
我有一个FASTA文件,可以很容易地通过 SeqIO.parse 进行解析. 我对提取序列ID和序列长度感兴趣.我用这些行来做,但是我感觉太沉重了(两次迭代,转换等) from Bio import SeqIO import pandas as pd # parse sequence fasta file identifiers = [seq_record.id for seq_r
..
from Bio import SeqIO from Bio import SeqRecord from Bio import SeqFeature for rec in SeqIO.parse("C:/Users/Siva/Downloads/sequence.gp","genbank"): if rec.features: for feature in r
..