biopython相关内容

在Python/Biopython中生成所有可能的唯一肽(置换)

我有一个场景,其中我有一个具有9个氨基酸的肽框。我想通过替换此框架上最多3个氨基酸(即仅替换1个、2个或3个AA)来生成所有可能的肽。 框架为CKASGFTFS,我希望通过从20个AA池中最多替换3个AA来查看所有突变。 我们有20个不同AA(A、R、N、D、E、G、C、Q、H、I、L、K、M、F、P、S、T、W、Y、V)的池。 我刚开始编码,所以有人能帮我解决如何用Python ..
发布时间:2022-03-02 10:12:11 Python

biopython 没有名为 Bio 的模块

仅供参考:这不是重复的! 在运行我的 python 代码之前,我在 cmd 提示符下安装了 biopython: pip install biopython 然后当我尝试在 python 中导入它时,我收到一条错误消息,提示“没有名为 Bio 的模块" 导入生物 同样的事情发生在 导入biopython 需要注意的是,我已经更新了 PIP 并运行了 python 3.5.2 我 ..
发布时间:2021-12-30 19:38:33 Python

AttributeError:' list'对象没有属性' SeqRecord'-在尝试使用来自fasta文件的Biopython> SeqIO分割多个序列时

我正在尝试生成长度可变的N和C终端切片(1,2,3,4,5,6,7).但是在到达那里之前,我只是在读取fasta文件时遇到问题.我遵循的是“随机子序列"的主教程,网址为: https://biopython.org/wiki/SeqIO.但是在这种情况下,只有一个序列,所以也许这就是我出错的地方.带有示例序列和我的错误的代码.任何帮助将非常感激.我显然超出了我的深度.看来其他人也遇到过很多类似的问 ..
发布时间:2021-05-09 18:46:07 Python

熊猫读csv忽略换行符

我有一个数据集(对于在那里的compbio人来说,这是一个FASTA),上面充斥着换行符,而不是数据的定界符. 使用任何熊猫读取功能,有没有办法让熊猫在导入时忽略换行符? 样本数据: > ERR899297.10000174TGTAATATTGCCTGTAGCGGGAGTTGTTGTCTCAGGATCAGCATTATATATCTCAATTGCATGAATCATCGTATTAATG ..
发布时间:2021-04-15 19:47:50 Python

在Mac上更改默认的python版本-安装Biopython

我的Mac随python 2.7一起安装为默认python版本.但是,许多软件包和软件不再支持此版本.我搜索了几个在线论坛,以了解如何在Mac上更改默认的python版本.但是,它们似乎都不起作用.我还安装了最新版本的python,如果输入: python --version 它将版本返回为python 3.8.但是,如果我尝试安装像Biopython这样的软件包,则会收到这样的错误- ..
发布时间:2021-04-15 19:47:44 其他开发

使用biopython写入fasta文件时出错

我使用以下代码将fasta序列写入文件. 来自生物导入SeqIO的 sequence ="KKPPLLRR"#在此处添加代码output_handle = open("example.fasta","w")SeqIO.write(sequences,output_handle,"fasta")output_handle.close() 我遇到以下错误: self = ..
发布时间:2021-04-15 19:47:41 其他开发

如何在循环python中使用子字符串制作字典

我有一个包含数百万个DNA序列的fasta文件-每个DNA序列也都有一个ID. > seq1AATCAG#---->这条线的5聚物是AATCA和ATCAG&s; seq3AAATTACTACTCTCTA&s; seq19ATTACG#---->这条线的5聚体是ATTAC和TTACG 我想做的是,如果DNA序列的长度是6,那么我将使那条线的5聚体(如代码和上面所示).因此,我无法解决的问题是, ..
发布时间:2021-04-15 19:47:38 Python

如何扩展不明确的dna序列

假设您具有这样的DNA序列: AATCRVTAA 其中 R 和 V 是DNA核苷酸的歧义值,其中 R 代表 A 或 G 和 V 代表 A , C 或 G . 是否存在Biopython方法来生成可以由上述歧义序列表示的序列的所有不同组合? 例如,在这里,输出将是: AATCAATAAAATCACTAAAATCAGTAAAATCGATAA阿拉伯联合会AATCGGTAA 解 ..
发布时间:2021-04-15 19:47:35 Python

Biopython从变量而不是文件中解析

import gzip导入io来自Bio import SeqIOinfile ="myinfile.fastq.gz"fileout = open("myoutfile.fastq","w +")使用io.TextIOWrapper(gzip.open(infile,"r")))作为f:行= f.read()fileout.write(行)fileout.seek(0)计数= 0用于SeqIO ..
发布时间:2021-04-15 19:47:29 Python

AttributeError:“列表"对象没有属性"SeqRecord"-在尝试使用来自Fasta文件的Biopython> SeqIO切片多个序列时

我正在尝试生成长度可变的N和C终端切片(1,2,3,4,5,6,7).但是在到达那里之前,我只是在读取fasta文件时遇到问题.我遵循的是“随机子序列"的主教程,网址为: https://biopython.org/wiki/SeqIO.但是在这种情况下,只有一个序列,所以也许那是我出错的地方.带有示例序列和我的错误的代码.任何帮助将非常感激.我显然超出了我的深度.看来其他人也遇到过很多类似的问题 ..
发布时间:2021-04-15 19:47:21 Python

在miniconda环境中找不到模块错误Bio

我将bio python安装为 pip install biopython 以及 conda install -c conda-forge biopython .我在站点包中看到了.由于某些原因,存在 Bio 依赖性.如何解决这种依赖性? 键入“帮助",“版权",“信用"或“许可证"以获取更多信息.>>>进口生物>>>bio .__ version__'1.75'>>>来自bio impo ..
发布时间:2021-04-15 19:47:15 Python

从PDB文件中仅提取我们需要的链

我需要从PDB文件中提取特定的链(不止一个链).如何从PDB文件提取链?.这是相同的问题,并带有“已标记"答案,回答了我的问题.但是它在python 3中不起作用.它一个接一个地给出错误.有人知道我该如何在python 3中工作吗? 或任何其他针对相同类型问题的代码 谢谢. import os来自Bio import PDBChainSplitter类:def __init __( ..
发布时间:2021-04-15 19:47:09 其他开发

来自uniprot蛋白质ID python的蛋白质序列

我想知道是否有办法从uniprot蛋白质id中获得蛋白质序列.我确实检查了很少的在线软件,但它们一次只能获得一个序列,但是我有5536个vlues.biopython中是否有任何软件包可以做到这一点? 解决方案 uniprot的所有序列都可以从" http://www.uniprot.org/uniprot/" + UniprotID + .fasta.您可以使用 获得任何序列 导入请 ..
发布时间:2021-04-15 19:46:28 Python

使用biopython搜索pubmed

我正在尝试将200多个条目输入到publish中,以记录作者发表的文章数量,并通过包括其导师和机构来完善搜索范围.我尝试使用biopython和xlrd(下面的代码)执行此操作,但是对于三种查询格式(1.按名称,2.按名称和机构名称,3.按名称和导师的姓名).是否可以执行故障排除步骤,或者在使用以下指示的关键字搜索pubmed时使用其他格式? 输入查询的示例输出; search_term是包 ..
发布时间:2020-09-21 03:41:24 其他开发