dna-sequence相关内容
我正在尝试使用R反补DNA链,但是,我的代码不起作用。 map=c("A"="T","T"="A","G"="C","C"="G") r
..
我正在做一个项目(我必须用Perl实现它,但我不擅长它),它可以读取DNA并找到它的RNA。把这些RNA分成三元组,就可以得到与之相同的蛋白质名称。我将解释这些步骤: 1)将以下DNA转录为RNA,然后使用遗传密码将其翻译为一系列氨基酸 示例: TCATAATACGTTTTGTATTCGCCAGCGCTTCGGTGT 2)要转录DNA,首先用每个DNA替换其对应的DNA(即,
..
我已尝试使用 mathematica 代码制作此地址中发布的 DNA 序列的混沌游戏:http://facstaff.unca.edu/mcmcclur/blog/GeneCGR.html 是这样的: genome = Import["c:\data\sequence.fasta", "Sequence"];基因组 = StringReplace[ToString[基因组], {"{" -
..
我的 multi-fasta 存档格式如下: >miRNA65 dvex2345CGATGCTAGATGCTATGACAACGATGCCTCG-G>miRNA60 dvex1234T-TAA-ACTCATCATCATCATACTCATCATCATCATCAGCATATTAACAAG>miRNA65 dvex2345T-TAA-ACTTATCATCATCATACTCATCATCATCATCAGCA
..
我正在处理长度为 25 的 DNA 序列(参见下面的示例).我有一个 230,000 的列表,需要查找整个基因组中的每个序列(弓形虫寄生虫).我不确定基因组有多大,但比 230,000 个序列要长得多. 我需要查找每个 25 个字符的序列,例如 (AGCCTCCCATGATTGAAACAGATCAT). 基因组被格式化为一个连续的字符串,即 (CATGGGAGGCTTGCGGAGCCT
..
假设您具有这样的DNA序列: AATCRVTAA 其中 R 和 V 是DNA核苷酸的歧义值,其中 R 代表 A 或 G 和 V 代表 A , C 或 G . 是否存在Biopython方法来生成可以由上述歧义序列表示的序列的所有不同组合? 例如,在这里,输出将是: AATCAATAAAATCACTAAAATCAGTAAAATCGATAA阿拉伯联合会AATCGGTAA 解
..
您知道任何一种现成的方法来获取长度以及两个字符串的重叠吗?但是,仅使用 R ,也许来自 stringr 的东西?不幸的是,我一直在看这里. str1
..
我正在使用PHP exec()函数执行问题是exec()即使进程成功运行也不返回任何PID. 过程是这样开始的: $gnuplot_path = '/usr/bin/gnuplot'; $command = 'nohup canu -d . -p E.coli gnuplot='.$gnuplot_path.' genomeSize=4.8m useGrid=false maxThr
..
任务是找到一组中最长的序列 例如,给定DNA序列:“ AGATCAGATCTTTTTTCTAATGTCTAGGATATATCAGATCAGATCAGATCAGATCAGATC” ,它有7次AGATC。 (AGATC)匹配所有匹配项。 是否可以编写仅捕获最长序列的正则表达式,即给定文本中的 AGATCAGATCAGATCAGATCAGATC ? 如果仅使用正则表达式是不可能的,我如何遍历
..
我有(将有)数据,如下所示: 个人Nuk名称位置Individual.1 Nuk。 1 Name.1 Position.1 Ind 1 A Locus_1988 23 Ind 1 A Locus_3333 15 Ind 2 A Locus_1988 23 Ind 2 G Locus_3333 15 Ind 3 G Locus_1988 23 Ind 3 A Locus_3333
..
因此,我正在尝试创建一个类,该类在三个不同的帧中读取DNA字符串-一个从位置0(或第一个碱基)开始,另一个从位置1(第二个碱基)开始,另一个从位置1开始.从位置2(第三个底端)开始读取.到目前为止,这就是我一直在玩的东西: def codons(self, frame_one, frame_two, frame_three): start = frame_one
..
我正在尝试在R中创建一个函数,该函数可以计算每个密码子的频率. 我们知道蛋氨酸是一种氨基酸,它只能由一组密码子ATG形成,因此它在每组序列中的百分比为1.而甘氨酸可以由GGT,GGC,GGA,GGG形成,因此,每个密码子将为0.25. 输入将是DNA序列,如-ATGGGTGGCGGAGGG,并且借助密码子表,它可以计算输入中每次出现的百分比. 请通过建议实现此功能的方法来帮助我.
..
我正在使用python创建一个程序,该程序将一组DNA序列转换为氨基酸(蛋白质)序列.然后,我需要找到一个特定的子序列,并计算存在该特定子序列的序列数.这是我到目前为止的代码: #Open cDNA_sequences file and read in line by line with open('cDNA_sequences.csv', 'r') as results: for
..
给出以下输入: my $init_seq = "AAAAAAAAAA" #length 10 bp my $sub_rate = 0.003; my $nof_tags = 1000; my @dna = qw( A C G T ); 我要生成: 一千个长度为10的标签 标签中每个位置的替换率为0.003 产生如下输出: AAAAAAAAAA AATAACAAA
..
我有一个称为%id2seq的哈希,其中包含键$id引用的DNA序列字符串.我希望能够通过使用字符串中的位置作为参考来操纵DNA序列.例如,如果我的DNA序列是ACGTG,则我的$id将是Sequence 1,我的$id2seq{'Sequence 1'}将是ACGTG,而我的“理论" $id2seq{'Sequence 1'}[3]将是G. 我试图创建一个数组的哈希来做到这一点,但是我得到一个奇怪
..
我已搜索并找到此论坛讨论以实现重叠匹配的效果. 我还发现了以下 SO 问题,查找索引以执行此任务,但找不到任何有关在R语言中抓取重叠匹配项的简明扼要的信息. 在执行时,我可以通过使用积极先行断言来使用支持( PCRE )“的大多数语言来执行此任务前瞻内部的捕获组以捕获重叠的匹配项. 但是,尽管实际上以与其他语言相同的方式执行此操作,但在R中使用perl=T却没有结果. >
..
我在python中有一个列表,其中包含一项,这是一种以Newick格式编写的树,如下所示: ['(BMNH833953:0.16529463651919140688,(((BMNH833883:0.22945757727367316336,(BMNH724182a:0.18028180766761139897,(BMNH724182b:0.21469677818346077913,BMNH7
..
使用haploNet软件包在单倍型网络上绘制某些图时, 我使用互联网上可用的脚本来执行此操作.但是我认为这是有问题的.该脚本以woodmouse示例的形式提供.我使用的代码是: x
..
我正在尝试使用{pegas}的haploNet函数绘制单倍型网络,但是我很难将来自不同种群的相同单倍型放在同一饼图中.我可以使用以下脚本构建单倍型网络: x
..
背景 Python模块 regex 允许模糊匹配. 您可以指定允许的替换次数(s),插入(i),删除(d)和总错误(e). 匹配结果的Fuzzy_counts属性返回一个元组(0,0,0),其中: match.fuzzy_counts[0] = count for 's' match.fuzzy_counts[1] = count for 'i' match.fuzzy
..