dna-sequence - IT屋-程序员软件开发技术分享社区

如何使用R来反向补充DNA链

我正在尝试使用R反补DNA链，但是，我的代码不起作用。 map=c("A"="T","T"="A","G"="C","C"="G") r ..

发布时间：2022-04-15 12:25:49 r bioinformatics dna-sequence 其他开发

用Perl实现DNA到RNA的转换和蛋白质的获取

我正在做一个项目(我必须用Perl实现它，但我不擅长它)，它可以读取DNA并找到它的RNA。把这些RNA分成三元组，就可以得到与之相同的蛋白质名称。我将解释这些步骤： 1)将以下DNA转录为RNA，然后使用遗传密码将其翻译为一系列氨基酸示例： TCATAATACGTTTTGTATTCGCCAGCGCTTCGGTGT 2)要转录DNA，首先用每个DNA替换其对应的DNA(即， ..

发布时间：2022-04-07 12:01:42 perl project dna-sequence protein-database 其他开发

DNA序列的混沌游戏

我已尝试使用 mathematica 代码制作此地址中发布的 DNA 序列的混沌游戏:http://facstaff.unca.edu/mcmcclur/blog/GeneCGR.html 是这样的: genome = Import["c:\data\sequence.fasta", "Sequence"];基因组 = StringReplace[ToString[基因组], {"{" - ..

发布时间：2021-09-27 20:31:06 wolfram-mathematica dna-sequence fasta chaos 其他开发

我需要在我的文件的标题行中搜索一个模式，并用 Perl 连接下一行

我的 multi-fasta 存档格式如下: >miRNA65 dvex2345CGATGCTAGATGCTATGACAACGATGCCTCG-G>miRNA60 dvex1234T-TAA-ACTCATCATCATCATACTCATCATCATCATCAGCATATTAACAAG>miRNA65 dvex2345T-TAA-ACTTATCATCATCATACTCATCATCATCATCAGCA ..

发布时间：2021-06-14 20:22:38 regex perl pattern-matching fasta dna-sequence 其他开发

搜索字符串，允许在字符串的任何位置出现一个不匹配

我正在处理长度为 25 的 DNA 序列(参见下面的示例).我有一个 230,000 的列表，需要查找整个基因组中的每个序列(弓形虫寄生虫).我不确定基因组有多大，但比 230,000 个序列要长得多. 我需要查找每个 25 个字符的序列，例如 (AGCCTCCCATGATTGAAACAGATCAT). 基因组被格式化为一个连续的字符串，即 (CATGGGAGGCTTGCGGAGCCT ..

发布时间：2021-06-14 20:14:36 python string pattern-matching string-matching dna-sequence Python

如何扩展不明确的dna序列

假设您具有这样的DNA序列: AATCRVTAA 其中 R 和 V 是DNA核苷酸的歧义值，其中 R 代表 A 或 G 和 V 代表 A ， C 或 G . 是否存在Biopython方法来生成可以由上述歧义序列表示的序列的所有不同组合? 例如，在这里，输出将是: AATCAATAAAATCACTAAAATCAGTAAAATCGATAA阿拉伯联合会AATCGGTAA 解 ..

发布时间：2021-04-15 19:47:35 python biopython dna-sequence Python

查找字符串中的重叠长度

您知道任何一种现成的方法来获取长度以及两个字符串的重叠吗?但是，仅使用 R ，也许来自 stringr 的东西?不幸的是，我一直在看这里. str1 ..

发布时间：2021-04-15 19:46:22 r string bioinformatics overlap dna-sequence 其他开发

exec()不返回进程ID

我正在使用PHP exec()函数执行问题是exec()即使进程成功运行也不返回任何PID. 过程是这样开始的: $gnuplot_path = '/usr/bin/gnuplot'; $command = 'nohup canu -d . -p E.coli gnuplot='.$gnuplot_path.' genomeSize=4.8m useGrid=false maxThr ..

发布时间：2020-11-02 00:57:59 php exec bioinformatics pid dna-sequence PHP

如何捕捉一组中最长的序列

任务是找到一组中最长的序列例如，给定DNA序列：“ AGATCAGATCTTTTTTCTAATGTCTAGGATATATCAGATCAGATCAGATCAGATCAGATC” ，它有7次AGATC。（AGATC）匹配所有匹配项。是否可以编写仅捕获最长序列的正则表达式，即给定文本中的 AGATCAGATCAGATCAGATCAGATC ？如果仅使用正则表达式是不可能的，我如何遍历 ..

发布时间：2020-10-11 22:52:30 python python-3.x regex cs50 dna-sequence Python

R中的四配子测试

我有（将有）数据，如下所示：个人Nuk名称位置Individual.1 Nuk。 1 Name.1 Position.1 Ind 1 A Locus_1988 23 Ind 1 A Locus_3333 15 Ind 2 A Locus_1988 23 Ind 2 G Locus_3333 15 Ind 3 G Locus_1988 23 Ind 3 A Locus_3333 ..

发布时间：2020-10-06 19:01:19 r compare dna-sequence 其他开发

在三个不同的框架下阅读

因此，我正在尝试创建一个类，该类在三个不同的帧中读取DNA字符串-一个从位置0(或第一个碱基)开始，另一个从位置1(第二个碱基)开始，另一个从位置1开始.从位置2(第三个底端)开始读取.到目前为止，这就是我一直在玩的东西: def codons(self, frame_one, frame_two, frame_three): start = frame_one ..

发布时间：2020-09-21 03:29:37 python bioinformatics biopython fasta dna-sequence Python

如何找到密码子的特定频率?

我正在尝试在R中创建一个函数，该函数可以计算每个密码子的频率. 我们知道蛋氨酸是一种氨基酸，它只能由一组密码子ATG形成，因此它在每组序列中的百分比为1.而甘氨酸可以由GGT，GGC，GGA，GGG形成，因此，每个密码子将为0.25. 输入将是DNA序列，如-ATGGGTGGCGGAGGG，并且借助密码子表，它可以计算输入中每次出现的百分比. 请通过建议实现此功能的方法来帮助我. ..

发布时间：2020-09-21 03:23:24 r bioinformatics dna-sequence 其他开发

如何使用python编程将一组DNA序列转换为蛋白质序列?

我正在使用python创建一个程序，该程序将一组DNA序列转换为氨基酸(蛋白质)序列.然后，我需要找到一个特定的子序列，并计算存在该特定子序列的序列数.这是我到目前为止的代码: #Open cDNA_sequences file and read in line by line with open('cDNA_sequences.csv', 'r') as results: for ..

发布时间：2020-09-21 03:11:25 python python-3.x bioinformatics biopython dna-sequence Python

生成具有置换率的合成DNA序列

给出以下输入: my $init_seq = "AAAAAAAAAA" #length 10 bp my $sub_rate = 0.003; my $nof_tags = 1000; my @dna = qw( A C G T ); 我要生成: 一千个长度为10的标签标签中每个位置的替换率为0.003 产生如下输出: AAAAAAAAAA AATAACAAA ..

发布时间：2020-08-22 19:33:00 perl algorithm bioinformatics dna-sequence 其他开发

为DNA序列创建数组的哈希，Perl

我有一个称为%id2seq的哈希，其中包含键$id引用的DNA序列字符串.我希望能够通过使用字符串中的位置作为参考来操纵DNA序列.例如，如果我的DNA序列是ACGTG，则我的$id将是Sequence 1，我的$id2seq{'Sequence 1'}将是ACGTG，而我的“理论" $id2seq{'Sequence 1'}[3]将是G. 我试图创建一个数组的哈希来做到这一点，但是我得到一个奇怪 ..

发布时间：2020-07-25 21:54:40 arrays perl hash dna-sequence 其他开发

R中的重叠比赛

我已搜索并找到此论坛讨论以实现重叠匹配的效果. 我还发现了以下 SO 问题，查找索引以执行此任务，但找不到任何有关在R语言中抓取重叠匹配项的简明扼要的信息. 在执行时，我可以通过使用积极先行断言来使用支持( PCRE )“的大多数语言来执行此任务前瞻内部的捕获组以捕获重叠的匹配项. 但是，尽管实际上以与其他语言相同的方式执行此操作，但在R中使用perl=T却没有结果. > ..

发布时间：2020-07-10 02:03:25 regex r string dna-sequence stringi 其他开发

使用Python从Newick格式提取分支长度

我在python中有一个列表，其中包含一项，这是一种以Newick格式编写的树，如下所示: ['(BMNH833953:0.16529463651919140688,(((BMNH833883:0.22945757727367316336,(BMNH724182a:0.18028180766761139897,(BMNH724182b:0.21469677818346077913,BMNH7 ..

发布时间：2020-07-03 18:52:08 python regex dna-sequence phylogeny Python

R-如何在haploNet haplotyp网络中绘制正确的饼图{pegas} {ape} {adegenet}

使用haploNet软件包在单倍型网络上绘制某些图时，我使用互联网上可用的脚本来执行此操作.但是我认为这是有问题的.该脚本以woodmouse示例的形式提供.我使用的代码是: x ..

发布时间：2020-06-16 18:40:47 r dna-sequence phylogeny genetics 其他开发

如何在haploNet单倍型网络{pegas}中绘制饼图

我正在尝试使用{pegas}的haploNet函数绘制单倍型网络，但是我很难将来自不同种群的相同单倍型放在同一饼图中.我可以使用以下脚本构建单倍型网络: x ..

发布时间：2020-06-16 18:40:42 r dna-sequence phylogeny genetics ape-phylo 其他开发

Python正则表达式模块模糊匹配:替换计数不符合预期

背景 Python模块 regex 允许模糊匹配. 您可以指定允许的替换次数(s)，插入(i)，删除(d)和总错误(e). 匹配结果的Fuzzy_counts属性返回一个元组(0,0,0)，其中: match.fuzzy_counts[0] = count for 's' match.fuzzy_counts[1] = count for 'i' match.fuzzy ..

发布时间：2020-06-15 19:29:24 python regex mismatch dna-sequence fuzzy-comparison Python

dna-sequence相关内容