genetics相关内容
我有这个VCF format file,我想在R中读取这个文件。但是,这个文件包含一些我想跳过的多余行。我希望得到类似于结果中的内容,其中行以匹配的行#CHROM开始。 这是我尝试过的: chromo1
..
假设我有一个 DNA 序列.我想得到它的补充.我使用了以下代码,但我没有得到它.我做错了什么? s=readline()ATCTCGGCGCGCATCGCGTACGCTACTAGCp=unlist(strsplit(s,""))h=rep("N",nchar(s))取消列表(lapply(p,函数(d){对于 b in (1:nchar(s)) {如果 (p[b]=="A") h[b]="T"如
..
我试图表示一个简化的染色体,它由 N 个碱基组成,每个碱基只能是 {A, C, T, G} 之一. 我想用枚举形式化约束,但我想知道在 Go 中模拟枚举最惯用的方法是什么. 解决方案 引用语言规范:Iota> 在常量声明中,预先声明的标识符 iota 表示连续的无类型整数常量.每当保留字 const 出现在源中并在每个 ConstSpec 之后递增时,它就会重置为 0.可以用来构造
..
我在这里发布了一个问题:R 中的匹配范围合并关于合并两个文件基于一个文件中的数字落入第二个文件中的范围.到目前为止,我还没有成功地拼凑代码来实现这一点.我遇到的问题是我使用的代码逐行比较文件.这是一个问题,因为 1.) 一个文件比另一个文件长得多,以及 2.) 我需要在较长文件中的每个范围对中扫描较短文件中的行 - 而不仅仅是同一行中的范围. 我一直在使用原始问题中发布的函数,我觉得应该有一
..
为 20 个自变量(例如遗传变异,这些遗传变异中的每一个都将单独测试)和 40 个因变量运行回归模型的最有效方法是什么?我是 R 的初学者!我找到了一个解决方案,但只有当我有 1 个自变量时它才有效.不知道如果我有很多 (http://techxhum.dk/loop-multiple-变量/) 感谢您的时间. 解决方案 这是一个使用MESS 包中的mfastLmCpp() 函数的密
..
在遗传学中,非常小的 p 值很常见(例如 10^-400),我正在寻找一种方法,当 R 中的 z 分数很大时,可以得到非常小的 p 值(双尾),例如: z=40pvalue = 2*pnorm(abs(z),lower.tail = F) 这给了我一个零而不是一个非常重要的非常小的值. 解决方案 无法处理小于约 10^(-308) (.Machine$double.xmin) 的 p
..
不幸的是,我自己还没有找到解决方案.如何使用例如 matplotlib/pandas 在 python 中创建 曼哈顿图.问题在于,在这些图中,x轴是离散的. from pandas import DataFrame从scipy.stats导入制服从scipy.stats导入randint将numpy导入为np# 一些示例数据df = DataFrame({'gene' : ['gene-%i
..
我有一个SNP列表,我已经从1000个基因组试点1中获得了MAF和LD的代理SNP.我想知道当每个人都提到MAF匹配时,它们是否需要完全相同? 例如,感兴趣的SNP的MAF为0.35,如果代理SNP的MAF为0.37,是否可以用作良好的代理?给定两个> 0.8 的LD 是否绝对必须选择MAF等于0.35的代理? 由R-sq测量的 解决方案 LD取决于MAF,即高R平方表示MAF相似
..
我正在尝试安装GeneR库(http://www.bioconductor.org/packages/release/bioc/html/GeneR.html): 我正在使用win7和最新的R 2.14.2. 安装过程中的错误: > source("http://bioconductor.org/biocLite.R") trying URL 'http://www.bioconduc
..
我是R的新手,我需要解决此问题的建议: 我有2张桌子.表的开始如下所示: 表1: SNP Gene Pval Best_SNP Best_Pval rs2932538 ENSG00000007341 5.6007 rs10488631 ENSG00000064419 7.7461 rs12537284 ENSG000000
..
在遗传家谱中,X染色体数据可用于链接某些祖先.在以下位置对此进行了很好的说明: X-DNA继承图 我的Neo4j数据库具有每个“人"的节点以及将父亲和母亲连接起来的关系.每个节点都有一个属性性别(针对“人"的性别; M或F).一位女性有两个X染色体,一个来自父母双方.男性有一个X染色体,通常来自母亲. 您可以使用reduce来查看祖先继承所涉及的性别: match p=(n:Pe
..
一段时间以来,我一直在寻找这个问题的答案.乍一看似乎并不难,但现在看来颇具挑战性. 我正在寻找一种提交SNP列表(rs#)并获取这些标记所映射基因的列表的方法. 到目前为止,我主要是通过多种方法将SNP映射到疾病,途径等.或者使用基因来获取代表性SNP的列表. 此外,我对计算生物学还很陌生,因此,我希望能找到一种不高度依赖编程的解决方案. 解决方案 http://www.
..
我想生成2个连续随机变量Q1,Q2(定量特征,每个都是正常的)和2个二进制随机变量Z1,Z2(二进制特征),并且所有可能的对之间都具有给定的成对相关性其中. 说 (Q1,Q2):0.23 (Q1,Z1):0.55 (Q1,Z2):0.45 (Q2,Z1):0.4 (Q2,Z2):0.5 (Z1,Z2):0.47 请帮助我在R中生成此类数据. 解决方案 这很粗糙,但可能
..
我想生成一个图,该图按比例绘制我正在研究的生物的14条线性染色体,并在每个染色体的指定位置上带有彩色条.理想情况下,我想使用R,因为这是我有经验的唯一编程语言. 我已经探索了各种方法,例如GenomeGraphs,但是我发现这比我想要的要复杂得多,显示的数据比我要拥有的要多(例如,显示细胞原性条带),并且通常是人类染色体特有的. 我基本上想要的是14个以下尺寸的灰色条: chro
..
使用haploNet软件包在单倍型网络上绘制某些图时, 我使用互联网上可用的脚本来执行此操作.但是我认为这是有问题的.该脚本以woodmouse示例的形式提供.我使用的代码是: x
..
假设我有一个DNA序列.我想补充它.我使用了以下代码,但没有得到.我在做什么错了? s=readline() ATCTCGGCGCGCATCGCGTACGCTACTAGC p=unlist(strsplit(s,"")) h=rep("N",nchar(s)) unlist(lapply(p,function(d){ for b in (1:nchar(s)) { if (p
..
我正在尝试使用{pegas}的haploNet函数绘制单倍型网络,但是我很难将来自不同种群的相同单倍型放在同一饼图中.我可以使用以下脚本构建单倍型网络: x
..
下面的代码有麻烦.它是人口进化的实现.在我的情况下,每次都在局部最大值处达到最大适应度,并且无法达到最大可能值.请提出必要的修改及其原因. Individual.java package genetic.algorithm.project; import java.util.Random; public class Individual { public static i
..
我对GO分析非常陌生,我对如何进行基因列表感到有些困惑. 我有一个基因列表(n = 10): gene_list SYMBOL ENTREZID GENENAME 1 AFAP1 60312 actin filament associated protein 1 2 ANAPC11 51529
..
我在这里发布了一个问题: R中的匹配范围合并有关合并两个文件根据一个文件中的数字落入第二个文件中的范围.到目前为止,我未能成功地将代码拼凑在一起来完成此任务.我遇到的问题是我使用的代码逐行比较文件.这是一个问题,因为1.)一个文件比另一个文件长得多,并且2.)我需要较短文件中的行通过较长文件中的每个范围对进行扫描-而不仅仅是同一行中的范围. 我一直在使用原始问题中发布的功能,我觉得应该有一种
..