bioinformatics相关内容

Perl:如何联接文本文件的两列,其中第一列的值应与第二列的值顺序匹配

我是Perl编程的初学者.我现在正在研究的问题是如何从文本文件中获取基因长度.文本文件包含基因名称(第10列),起始位点(第6列),结束位点(第7列).长度可以从第6列和第7列的差异中得出.但是我的问题是如何将基因名称(来自第10列)与从第6列和第7列的差异中得出的相应差异进行匹配.非常感谢!/p> open (IN, "Alu.txt"); open (OUT, ">Alu_subfamlen ..
发布时间:2020-09-21 03:11:51 其他开发

使用str.translate()从DNA到RNA

我正在尝试使用Python将DNA代码转换为RNA代码... 我这样写: print('Digite a sequência DNA a ser transcrita para RNA:') my_str = raw_input() print(my_str.replace('T', 'U')) 它有效,但是..现在我需要将 A转换为U , T转换为A , G转换为C 和 C到G ..
发布时间:2020-09-21 03:11:43 Python

R-Shiny中的自动多文件下载

我正在尝试弄清楚如何获取data.frame来本身作为子集,然后为每个子集编写一个.csv文件.我正在编写一个shiny应用程序,它将为不同的仪器生成模板文件,并且我需要能够为每个批次/板/任何文件获取一个文件.显然,我们可以手动进行排序,但是这样做会破坏目的. 例如,假设我有一个data.frame,其中有4列,分别命名为1)PlateID,2)SampleName,3)Well和4)Co ..
发布时间:2020-09-21 03:11:36 其他开发

如何使用python编程将一组DNA序列转换为蛋白质序列?

我正在使用python创建一个程序,该程序将一组DNA序列转换为氨基酸(蛋白质)序列.然后,我需要找到一个特定的子序列,并计算存在该特定子序列的序列数.这是我到目前为止的代码: #Open cDNA_sequences file and read in line by line with open('cDNA_sequences.csv', 'r') as results: for ..
发布时间:2020-09-21 03:11:25 Python

在fasta.gz上的SeqIO.parse

编码新手. Pytho/biopython的新手;这是我有史以来第一个在线问题. 如何打开压缩的fasta.gz文件以提取信息并在函数中执行计算.这是我正在尝试做的简化示例(我尝试了不同的方式)以及错误是什么.我正在使用的gzip命令似乎不起作用. with gzip.open("practicezip.fasta.gz", "r") as handle: for record in S ..
发布时间:2020-09-21 03:11:21 Python

Python中的递归生成器

我编写了一个函数来返回一个生成器,该生成器包含给定长度的子字符串的每个唯一组合,这些子字符串包含来自主字符串的n个以上的元素. 作为说明: 如果我有'abcdefghi'和一个长度为2的探针,并且我希望获得每个列表4个元素的阈值: ['ab', 'cd', 'ef', 'gh'] ['ab', 'de', 'fg', 'hi'] ['bc', 'de', 'fg', 'hi'] ..
发布时间:2020-09-21 03:11:18 Python

将CSV转换为Newick树

因此,我有一个csv文件,其中每一行均以以下形式表示分层数据: 'Phylum','Class','Order','Family','Genus','Species','Subspecies','unique_gi' 我想将其转换为经典的 Newick树格式,无距离.一种新颖的方法或一个python软件包都将是惊人的.谢谢! 解决方案 您可以使用一些简单的Python从CSV构建树, ..
发布时间:2020-09-21 03:11:09 Python

在两个大型词典中查找匹配键并快速完成

我正在尝试在两个不同的词典中找到对应的键.每个条目约有60万个条目. 举个例子: myRDP = { 'Actinobacter': 'GATCGA...TCA', 'subtilus sp.': 'ATCGATT...ACT' } myNames = { 'Actinobacter': '8924342' } 我想打印出放线杆菌(8924342)的值,因为它与my ..
发布时间:2020-09-21 03:10:04 Python

将一列拆分为多列

我有第一列的表: chr10:100002872-100002872 chr10:100003981-100003981 chr10:100004774-100004774 chr10:100005285-100005285 chr10:100007123-100007123 我想将其转换为3个单独的列,但无法为使用的strsplit命令定义“:"和“-". 我该怎么办? 解决方案 ..
发布时间:2020-09-21 03:07:58 其他开发

Pyparsing:提取可变长度,可变内容,可变空白子字符串

我需要从前列腺切除术最终诊断记录的平面文件中提取格里森分数.这些分数始终带有单词Gleason和两个数字,这些数字加起来便是另一个数字.在过去的二十多年中,人类一直在打字.包括各种空白约定和修饰符.以下是到目前为止我的Backus-Naur表格和两个示例记录.仅针对前列腺切除术,我们正在研究一千多例. 我之所以使用pyparsing是因为我正在学习python,并且对自己非常有限的正则表达式 ..
发布时间:2020-09-21 03:07:55 Python