snakemake相关内容

STAR索引发布到步骤4

我正在尝试使用snakemake索引管道上的参考基因组,并制定了以下规则: 规则reference_faidx_star:输入:"../resources/reference/Qrob_PM1N.fa"输出:"../resources/reference/ref/"线程数:1日志:"../results/logs/star/star_index.log"参数:gtf ="../resources ..
发布时间:2021-05-31 20:03:23 Python

一次运行Snakemake规则一个样本

我正在创建一个Snakemake工作流程,该工作流程将包装 运行命令: snakemake -j 32 --use-conda 在 ../fastq/目录中存在四个样本/外显子组时出错: GPU-BWA memProgressMeter读取对齐的碱基对在ParaBricks/src/samGenerator.cu:782处cudaSafeCall()失败:内存不足在ParaBri ..
发布时间:2021-05-13 18:42:31 其他开发

Snakemake中输入函数的并行输出

你好Snakemake社区, 在Snakemake中正确定义功能并在 params 部分中调用它时,我遇到了很多麻烦.该函数的输出是一个列表,我的目标是将列表的每一项用作shell命令的参数.换句话说,我想使用不同的参数并行运行同一外壳命令的多个作业. 这是功能: import os,globdef get_scontigs_names(通配符):scontigs = glob.g ..
发布时间:2021-05-09 20:13:16 Python

如何不使用Snakemake撤销更新的文件

即使已经有输出文件了,Snakemake也只想重新执行我的所有管道,因为我已经修改了第一个输出文件之一. 我通过使用"np --reason"运行Snakemake来弄清楚:原因:输入文件被另一个作业更新:Mapping/col.sorted.bam 如何强制Snakemake不重新运行此更新文件? 谢谢 解决方案 您可以使用选项-touch 将其标记为最新: -触 ..
发布时间:2021-05-07 18:44:55 其他开发

Snakemake-下载数据的规则

我在实施管道时遇到了一些麻烦,在该管道中,第一步是从某些服务器下载数据.据我了解,所有规则都必须具有作为文件的输入.但是,在我的情况下,“输入"是提供给脚本的ID字符串,该脚本访问服务器并下载数据. 我知道了snakemake中的远程文件选项,但是服务器我从( ENA )下载的文件不在该列表中.此外,我正在使用一个调用aspera的脚本来提高下载速度. 关于如何在snakemake中实现这种方 ..
发布时间:2021-05-02 20:32:04 其他开发

Snakemake:关于如何正确访问配置文件的困惑

这个问题是我之前问过的问题它涉及了解如何使用Snakemake正确访问配置文件.我有一个特定的问题,我需要首先解决,而在理解索引工作原理时则要解决一个一般性的问题. 我正在使用snakemake并运行从Alignment/QC到模体分析的ATAC-seq管道. A:具体问题 我正在尝试添加一条称为 trim_galore_pe 的规则,以在对齐之前从我的fastq文件中修剪适配器 ..
发布时间:2021-04-24 18:30:26 其他开发

Snakemake:我一直在获取'conda'命令在$ PATH中不可用.在SGE群集上运行时

我在这里扯头发,希望有人可以帮助我. 运行snakemake 4.8.0 我有一个snakemake管道,该管道与两个conda envs和--use-conda一起运行,并且在作为独立管道运行时可以正常工作. 但是,当我在集群上运行时,出现错误: “'conda'命令在$ PATH中不可用." 现在.Anaconda已安装在我们的群集上,但是我们需要使用以下命令在节 ..
发布时间:2021-04-23 20:43:13 其他开发

Snakemake包装器中(bio)conda版本的最佳做法?

使用conda在Snakemake包装器中指定包装的最佳 environment.yml 最佳实践是什么?我了解这些渠道应该是: 渠道:-康达伪造-Bioconda- 根据 但是,指定软件包的最佳选择是什么?我没有指定版本吗?完整版本? 使用完整版本之前曾导致使用无限/超长conda环境的问题.但是,不固定版本会带来隐式升级到软件包不兼容版本的风险. 我仅指定直接依赖项,还是应该 ..
发布时间:2021-04-23 20:42:52 其他开发

snakemake中的未知输出

我正在用snakemake实现一个非常简单的管道,希望用一个有凝聚力的Snakefile代替一连串烦人的bash脚本. 我在编写将文件分割成较小的规则(使用GNU split),然后导致输出连接在一起的第二条规则时遇到了麻烦. 我不知道在concat步骤中为输入内容写什么,因为我不知道如何定义所有符合模式 bam_files/test * 的文件.我尝试使用glob,但是绝对不能正常工 ..
发布时间:2021-04-15 19:47:03 其他开发

awk命令在snakemake --use-singularity中失败

我正在尝试将Snakemake与奇点性结合使用,并且我注意到,使用奇点性时,简单的 awk 命令不再起作用.最后一行中的 $ 1 被bash代替,而不是被 awk 用作第一个字段. 这是一个最小的工作示例( Snakefile ): 奇点:"docker://debian:stretch"统治一切:输入:"test.txt"规则测试:输出:"test.txt"壳:"cat/etc/pass ..
发布时间:2021-04-14 19:59:10 其他开发

当集群(Slurm)取消作业时,Snakemake挂起

也许对于许多人来说答案是显而易见的,但是令我惊讶的是我找不到关于该主题的问题,这对我来说是一个重大问题. 我将不胜感激! 在由slurm管理的集群上提交作业时,如果队列管理器取消了该作业(例如,由于资源或时间不足),snakemake似乎没有收到任何信号,并且永远挂起.另一方面,当作业失败时,snakemake也将失败,正如预期的那样.这种行为正常/有害吗?取消工作时,如何使snakemak ..
发布时间:2021-02-12 19:27:12 其他开发

在Snakemake中使用多个文件名作为通配符

我正在尝试创建一个在snakemake中实现bedtools的规则,该规则将closest一个文件,其中一堆文件位于另一个目录中. 我所拥有的是/home/bedfiles目录下的20张病床文件: 1A.bed , 2B_83.bed , 3f_33.bed ... 我想要的是在/home/bedfiles目录下的20个修改过的床文件: 1A_modified, 2B_83 ..
发布时间:2020-11-28 23:18:05 其他开发

Snakemake-以特定于规则的方式覆盖LSF(bsub)群集配置

是否可以在集群配置文件中定义内存和资源的默认设置,然后在需要时以规则特定的方式覆盖?规则中的资源字段是否直接绑定到群集配置文件?还是出于可读性目的, params 字段的一种奇特方式? 在下面的示例中,我如何对规则a 使用默认群集配置,但使用自定义更改( memory = 40000 和 rusage = 15000 )在规则b 中? cluster.json: { “ __d ..
发布时间:2020-10-03 02:39:44 其他开发

Snakemake和Pandas语法:从样本表中获取样本特定参数

首先,这可能是 Snakemake和pandas语法的副本.但是,我仍然很困惑,所以我想再次解释. 在Snakemake中,我加载了带有几列的示例表.其中一列称为"Read1",其中包含特定于样本的读取长度.我想分别为每个样本获取此值,因为它可能有所不同. 我期望的是这样的: rule mismatch_profile: input: rseqc_inpu ..
发布时间:2020-09-21 03:26:10 其他开发