biopython相关内容
我最近受命用python编写程序,以从.pdb(蛋白质数据库)的蛋白质中找到距每种金属2埃以内的原子.这是我为此编写的脚本. from Bio.PDB import * parser = PDBParser(PERMISSIVE=True) def print_coordinates(list): neighborList = list for y in neighborL
..
我想将包含少量DNA序列的文件转换为二进制值,如下所示: A=1000 C=0100 G=0010 T=0001 FileA.txt CCGAT GCTTA 所需的输出 01000100001010000001 00100100000100011000 我尝试使用此代码解决问题,但是bin输出文件似乎无法输出所需的答案.谁能帮我吗? 代码 import s
..
必须删除pdb文件中的杂原子.这是代码,但不适用于我的测试PDB 1C4R. for model in structure: for chain in model: for reisdue in chain: id = residue.id if id[0] != ' ': chain.d
..
我在此标记了python和perl只是因为到目前为止,我一直在使用它.如果有人知道解决此问题的更好方法,我当然愿意尝试一下.无论如何,我的问题: 我需要为遵循以下格式的基因预测程序创建一个输入文件: seq1 5 15 seq1 20 34 seq2 50 48 seq2 45 36 seq3 17 20 其中seq#是GeneID,右边的数字是开放阅读框中外显子的位置.现在,
..
我需要计算Fasta文件中从10000到11000的dna序列的熵 这就是我所知道的,但是我需要计算第10,000至11,000个碱基之间的序列的熵. from math import log def logent(x): if x
..
从一个字符串说dna ='ATAGGGATAGGGAGAGAGAGCGATCGAGCTAG' 我得到了子字符串说dna.format ='ATAGGGATAG','GGGAGAGAG' 我只想打印长度可被3整除的子字符串 怎么做?即时通讯使用模,但无法正常工作! import re if mydna = 'ATAGGGATAGGGAGAGAGCAGATCGAGCTAG' print re.f
..
基本上,GenBank文件由基因条目(由"gene"宣布,然后是其对应的"CDS"条目(每个基因只有一个))组成,就像我在下面显示的两个一样.制表符分隔的两列文件,'gene'和'CDS'始终在其前后,如果使用可以使用的工具可以轻松地执行此任务,请告诉我. 输入文件: gene complement(8972..9094) /l
..
我正在尝试将Biopython(Entrez)与搜索项一起使用,这些搜索项将返回登录号(而不是GI *). 这是我的代码的一小部分摘录: from Bio import Entrez Entrez.email = 'myemailaddress' search_phrase = 'Escherichia coli[organism]) AND (complete genome[key
..
我从biopython开始,我对解析结果有疑问.我使用了教程参与进来在这里,这是我使用的代码: from Bio.Blast import NCBIXML for record in NCBIXML.parse(open("/Users/jcastrof/blast/pruebarpsb.xml")): if record.alignments: print "Que
..
我遇到了无法解决的错误. 我正在尝试执行一组最简单的命令,这些命令将执行tBLASTn算法, 在数据库(也指定为文件-> cucumber.fasta)中寻找序列(指定为"pytanie.fasta"文件的序列).结果将保存在"wynik.txt"文件中. 代码如下: from Bio.Blast. Applications import NcbitblastnCommandli
..
我的数据文件的结构如下: OTU1 PIA0 1120 OTU2 PIA1 2 OTU2 PIA3 6 OTU2 PIA4 10 OTU2 PIA5 1078 OTU2 PIN1 24 OTU2 PIN2 45 OTU2 PIN3 261 OTU2 PIN4 102 OTU3 P
..
我的生产服务器上的Django应用中出现此错误: [Errno 13]权限被拒绝:'/var/www/.config' 我从没问过要在我的代码中访问这个不存在的文件或目录.该服务器正在我的httpd.conf中定义的其他目录中运行,并且我尚未在Django设置中定义任何/var/www/元素的使用. 在我的情况下,我将biopython库与Django一起使用: from
..
我今天遇到了这个问题,想提出来看看是否有人看过它.搜索Google/SO/Biostars并没有帮助我. 我正在运行一个简单的限制性分析(针对随机生成的“基因组"),并得到此错误.如果我单独寻找带有酶的切割位点,则每种酶都适用.但是,当我将它们放入RestrictionBatch时,在类上出现错误: type object 'RestrictionType' has no attrib
..
我有一个fasta文件.从该文件中,我需要获取序列末尾和/或开头仅包含GTACAGTAGG和CAACGGTTTTGCC的序列,并将它们放入新的fasta文件中.所以这是一个例子: >m121012_054644_42133_c100390582550000001523038311021245_s1_p0/7/2516_3269 ***GTACAGTAGG***GTACACACAGAACGCG
..
我有几个已比对的DNA序列,我只想在特定位置保留可变碱基. 如果我们首先将对齐方式转换为数组,则可以完成此操作.我尝试使用Biopython教程中的代码,但出现错误. import numpy as np from Bio import AlignIO alignment = AlignIO.parse("ma-all-mito.fa", "fasta") align_array =
..
我正在编写一个python脚本(2.7版),它将指定目录中的每个输入文件(.nexus格式)更改为.fasta格式. Biopython模块SeqIO.convert可以完美地处理单个指定文件的转换,但是当我尝试使用os.walk通过目录自动执行该过程时,我无法正确地将每个输入文件的路径名传递给SeqIO.convert.我要去哪里错了?我是否需要使用os.path模块中的join()并将完整路径
..
python新手,今天,我将biopython更新为v1.70.我的大部分工作都使用spyder/IPython shell.如果有任何意义,似乎在python控制台(spyder)和Windows命令终端python安装中都更新了biopython的版本,但是IPython控制台仍在显示旧版本.是否应该单独更新,如果是,则如何更新.感谢您的回答. 解决方案 对于Windows上的Anac
..
下面的代码在窗口大小为4的每个序列中提取短序列.如何将窗口移位2步长并提取4个碱基对? 示例代码 from Bio import SeqIO with open("testA_out.fasta","w") as f: for seq_record in SeqIO.parse("testA.fasta", "fasta"): i = 0
..
我是python的新手,尤其是Biopython.我正在尝试使用Entrez.efetch从XML文件中获取一些信息,然后再读取它.上周,该脚本运行良好: handle = Entrez.efetch(db="Protein", id="YP_008872780.1", retmode="xml") records = Entrez.read(handle) 但是现在我遇到一个错误:
..
Hii我在Biopython中遇到以下错误:函数外部“返回"(文件名..第26行) 下面是myfile的代码 请帮助 # File Name RandonProteinSequences.py # standard library import os import random # biopython from Bio.Seq import Seq from Bio.Alphabet im
..