dna-sequence相关内容

用Perl实现DNA到RNA的转换和蛋白质的获取

我正在做一个项目(我必须用Perl实现它,但我不擅长它),它可以读取DNA并找到它的RNA。把这些RNA分成三元组,就可以得到与之相同的蛋白质名称。我将解释这些步骤: 1)将以下DNA转录为RNA,然后使用遗传密码将其翻译为一系列氨基酸 示例: TCATAATACGTTTTGTATTCGCCAGCGCTTCGGTGT 2)要转录DNA,首先用每个DNA替换其对应的DNA(即, ..
发布时间:2022-04-07 12:01:42 其他开发

DNA序列的混沌游戏

我已尝试使用 mathematica 代码制作此地址中发布的 DNA 序列的混沌游戏:http://facstaff.unca.edu/mcmcclur/blog/GeneCGR.html 是这样的: genome = Import["c:\data\sequence.fasta", "Sequence"];基因组 = StringReplace[ToString[基因组], {"{" - ..
发布时间:2021-09-27 20:31:06 其他开发

搜索字符串,允许在字符串的任何位置出现一个不匹配

我正在处理长度为 25 的 DNA 序列(参见下面的示例).我有一个 230,000 的列表,需要查找整个基因组中的每个序列(弓形虫寄生虫).我不确定基因组有多大,但比 230,000 个序列要长得多. 我需要查找每个 25 个字符的序列,例如 (AGCCTCCCATGATTGAAACAGATCAT). 基因组被格式化为一个连续的字符串,即 (CATGGGAGGCTTGCGGAGCCT ..
发布时间:2021-06-14 20:14:36 Python

如何扩展不明确的dna序列

假设您具有这样的DNA序列: AATCRVTAA 其中 R 和 V 是DNA核苷酸的歧义值,其中 R 代表 A 或 G 和 V 代表 A , C 或 G . 是否存在Biopython方法来生成可以由上述歧义序列表示的序列的所有不同组合? 例如,在这里,输出将是: AATCAATAAAATCACTAAAATCAGTAAAATCGATAA阿拉伯联合会AATCGGTAA 解 ..
发布时间:2021-04-15 19:47:35 Python

exec()不返回进程ID

我正在使用PHP exec()函数执行问题是exec()即使进程成功运行也不返回任何PID. 过程是这样开始的: $gnuplot_path = '/usr/bin/gnuplot'; $command = 'nohup canu -d . -p E.coli gnuplot='.$gnuplot_path.' genomeSize=4.8m useGrid=false maxThr ..
发布时间:2020-11-02 00:57:59 PHP

如何捕捉一组中最长的序列

任务是找到一组中最长的序列 例如,给定DNA序列:“ AGATCAGATCTTTTTTCTAATGTCTAGGATATATCAGATCAGATCAGATCAGATCAGATC” ,它有7次AGATC。 (AGATC)匹配所有匹配项。 是否可以编写仅捕获最长序列的正则表达式,即给定文本中的 AGATCAGATCAGATCAGATCAGATC ? 如果仅使用正则表达式是不可能的,我如何遍历 ..
发布时间:2020-10-11 22:52:30 Python

R中的四配子测试

我有(将有)数据,如下所示: 个人Nuk名称位置Individual.1 Nuk。 1 Name.1 Position.1 Ind 1 A Locus_1988 23 Ind 1 A Locus_3333 15 Ind 2 A Locus_1988 23 Ind 2 G Locus_3333 15 Ind 3 G Locus_1988 23 Ind 3 A Locus_3333 ..
发布时间:2020-10-06 19:01:19 其他开发

在三个不同的框架下阅读

因此,我正在尝试创建一个类,该类在三个不同的帧中读取DNA字符串-一个从位置0(或第一个碱基)开始,另一个从位置1(第二个碱基)开始,另一个从位置1开始.从位置2(第三个底端)开始读取.到目前为止,这就是我一直在玩的东西: def codons(self, frame_one, frame_two, frame_three): start = frame_one ..
发布时间:2020-09-21 03:29:37 Python

如何找到密码子的特定频率?

我正在尝试在R中创建一个函数,该函数可以计算每个密码子的频率. 我们知道蛋氨酸是一种氨基酸,它只能由一组密码子ATG形成,因此它在每组序列中的百分比为1.而甘氨酸可以由GGT,GGC,GGA,GGG形成,因此,每个密码子将为0.25. 输入将是DNA序列,如-ATGGGTGGCGGAGGG,并且借助密码子表,它可以计算输入中每​​次出现的百分比. 请通过建议实现此功能的方法来帮助我. ..
发布时间:2020-09-21 03:23:24 其他开发

如何使用python编程将一组DNA序列转换为蛋白质序列?

我正在使用python创建一个程序,该程序将一组DNA序列转换为氨基酸(蛋白质)序列.然后,我需要找到一个特定的子序列,并计算存在该特定子序列的序列数.这是我到目前为止的代码: #Open cDNA_sequences file and read in line by line with open('cDNA_sequences.csv', 'r') as results: for ..
发布时间:2020-09-21 03:11:25 Python

为DNA序列创建数组的哈希,Perl

我有一个称为%id2seq的哈希,其中包含键$id引用的DNA序列字符串.我希望能够通过使用字符串中的位置作为参考来操纵DNA序列.例如,如果我的DNA序列是ACGTG,则我的$id将是Sequence 1,我的$id2seq{'Sequence 1'}将是ACGTG,而我的“理论" $id2seq{'Sequence 1'}[3]将是G. 我试图创建一个数组的哈希来做到这一点,但是我得到一个奇怪 ..
发布时间:2020-07-25 21:54:40 其他开发

R中的重叠比赛

我已搜索并找到此论坛讨论以实现重叠匹配的效果. 我还发现了以下 SO 问题,查找索引以执行此任务,但找不到任何有关在R语言中抓取重叠匹配项的简明扼要的信息. 在执行时,我可以通过使用积极先行断言来使用支持( PCRE )“的大多数语言来执行此任务前瞻内部的捕获组以捕获重叠的匹配项. 但是,尽管实际上以与其他语言相同的方式执行此操作,但在R中使用perl=T却没有结果. > ..
发布时间:2020-07-10 02:03:25 其他开发