genome相关内容

导入HDF5和h5py模块时出错

我正在尝试使用predixcan软件。在其中一个脚本中,使用h5py模块。当我运行该脚本时,它给出以下错误: Could not import HDF5 expression INFO - Could not import h5py module 有人知道如何解决此错误吗? 推荐答案 如果您使用pip,请使用pip install h5py安装h5py;如果您使用蟒蛇,请使用 ..
发布时间:2022-08-13 14:59:17 Python

R中的常见基因组区间

我想推断不同样本之间的共享基因组间隔. 我的输入: sample chr start endNE001 1 100 200NE001 2 100 200NE002 1 50 150NE002 2 50 150NE003 2 250 300 我的预期输出: chr 开始结束频率1 100 150 22 100 150 2 其中“频率"是有多少样本有助于推断共享区域.在上面的例子中,fr ..
发布时间:2021-06-13 19:34:45 其他开发

通过 python (Py2neo) 将大型数据集转录为 Neo4j

过去几周我一直在尝试使用 Scikit Allel 库将基因组数据集加载到 Neo4j 中.我已经设法在 VCF 文件中加载了外显子组的所有变体以及具有相关表型数据的所有受试者,我现在只是尝试创建变体和受试者之间的关系.我在 python 方面不是很有经验,我认为这个问题不需要对基因组学或 Scikit-Allel 库有很好的理解,所以不要被那个吓到. 下面的代码有效,但速度非常慢.我认为为 ..
发布时间:2021-06-07 19:00:54 Python

一次运行Snakemake规则一个样本

我正在创建一个Snakemake工作流程,该工作流程将包装 运行命令: snakemake -j 32 --use-conda 在 ../fastq/目录中存在四个样本/外显子组时出错: GPU-BWA memProgressMeter读取对齐的碱基对在ParaBricks/src/samGenerator.cu:782处cudaSafeCall()失败:内存不足在ParaBri ..
发布时间:2021-05-13 18:42:31 其他开发

在1kb的窗口中绘制覆盖深度?

我想绘制整个基因组的平均覆盖深度,并以递增的顺序排列染色体.我已经使用samtools计算了基因组每个位置的覆盖深度.我想生成一个图(使用1kb的窗口),如图7所示:示例数据框: Chr locus depth chr1 1 20 chr1 2 24 chr1 3 26 chr2 1 53 chr2 2 71 chr2 ..
发布时间:2020-09-21 03:27:18 其他开发

将我的Shell脚本的输出组织到文本文件内的表中

我正在使用unix shell脚本,该脚本进行基因组构建然后创建系统发育.根据您使用的基因组组装器,最终输出(系统发育)可能会发生变化.我希望比较使用各种基因组组装器的效果.我已经开发出一些度量标准进行比较,但是我需要组织它们的帮助,以便我可以进行有用的分析.我想将我的数据按列导入excel. 这是我用来输出数据的脚本: echo "Enter the size (Mb or Gb) ..
发布时间:2020-09-21 03:13:12 服务器开发

如何确定基因组的特征?

在AI中,是否存在任何简单和/或非常直观的示例来说明如何将基因组实施到模拟中? 基本上,我只是经过一个简单的演练(不是教程,而是某种概括性的内容),其中详细介绍了如何实现以求和方式改变“个体"特征的基因组. 这些基因不会是这样的: 质量 实力 长度 等等. 相反,它们应该是定义上述内容,从模拟居民的实际特征中提取基因组. 我清楚我想要什么吗? 无论如何,如 ..

类似于Windows/OSX/Unix和二进制文件的Gnome glib状态

我试图了解glib关于Windows,Unix-like(不是必需的Linux)和OSX的当前情况.我正在分析是否可以将glib用于项目,并且需要所有这些OS正常工作. 我正在搜索Windows的二进制文件,发现的最后一个文件很旧(2010年和2011年).这是否意味着Gnome glib放弃了Windows支持? 我需要知道最新的glib是否仍适用于所有平台,以及是否至少计划在不久的 ..
发布时间:2020-08-12 02:35:33 服务器开发

整洁的

我尝试使用原始论文来实现自己的整洁,但是被卡住了. 比方说,我在上一代中有以下物种: Specie 1: members: 100 avg_score: 100 Specie 2: members: 150 avg_score: 120 Specie 3: members: 300 avg_score: 50 Specie 4: mem ..
发布时间:2020-07-01 04:39:20 其他开发

代表遗传算法的二进制基因组的一个明智的方法是什么?

我的上一个问题掩盖了我缺乏经验,并且基于假设。现在我更聪明了(把1和0放在一个字符串中?Pah!我笑了这个建议!) 我的问题是,我应该如何编码我的基因组? 在纸上,它们如下所示: 01010011010110010 17位编码(在某些情况下为单个,在某些情况下为组)要测试的参数 要求是: 需要可扩展。目前可能有17个,但是随着选项被 ..
发布时间:2017-08-17 00:40:13 C#/.NET

AWK:如果文件一栏落在其他文件两列声明的范围内提取线

目前我正与一个AWK的问题,我一直没能尚未解决挣扎。我有一个巨大的文件(30GB)与持有与位置的名单的基因组数据(在栏1中声明和2)和保持一个数字范围的第二列表(在第3栏第4声明和5)。我想提取在第一个文件中的所有行所在的位置秒文件中声明的范围内。作为位置是唯一的一个特定的染色体(字符)首先它已被如果字符的是相同的测试中是唯一的(即COL1在文件fil​​e2中1匹配COL3) 文件1 染色体 ..
发布时间:2016-07-28 16:38:29 Linux/Unix