snakemake相关内容
我正在尝试使用snakemake索引管道上的参考基因组,并制定了以下规则: 规则reference_faidx_star:输入:"../resources/reference/Qrob_PM1N.fa"输出:"../resources/reference/ref/"线程数:1日志:"../results/logs/star/star_index.log"参数:gtf ="../resources
..
我正在使用 snakemake 构建管道,并使用 conda 和 singularity 环境来确保可重复性.我遇到了一个错误,我的绘图上的文本被矩形替换了
..
我正在创建一个Snakemake工作流程,该工作流程将包装 运行命令: snakemake -j 32 --use-conda 在 ../fastq/目录中存在四个样本/外显子组时出错: GPU-BWA memProgressMeter读取对齐的碱基对在ParaBricks/src/samGenerator.cu:782处cudaSafeCall()失败:内存不足在ParaBri
..
你好Snakemake社区, 在Snakemake中正确定义功能并在 params 部分中调用它时,我遇到了很多麻烦.该函数的输出是一个列表,我的目标是将列表的每一项用作shell命令的参数.换句话说,我想使用不同的参数并行运行同一外壳命令的多个作业. 这是功能: import os,globdef get_scontigs_names(通配符):scontigs = glob.g
..
即使已经有输出文件了,Snakemake也只想重新执行我的所有管道,因为我已经修改了第一个输出文件之一. 我通过使用"np --reason"运行Snakemake来弄清楚:原因:输入文件被另一个作业更新:Mapping/col.sorted.bam 如何强制Snakemake不重新运行此更新文件? 谢谢 解决方案 您可以使用选项-touch 将其标记为最新: -触
..
我在实施管道时遇到了一些麻烦,在该管道中,第一步是从某些服务器下载数据.据我了解,所有规则都必须具有作为文件的输入.但是,在我的情况下,“输入"是提供给脚本的ID字符串,该脚本访问服务器并下载数据. 我知道了snakemake中的远程文件选项,但是服务器我从( ENA )下载的文件不在该列表中.此外,我正在使用一个调用aspera的脚本来提高下载速度. 关于如何在snakemake中实现这种方
..
我以前已经从此 Dockerfile 构建了一个Docker容器,并且运行良好: FROM perl:5.32维护者Matthew Jordan Oldach,moldach686 @ gmail.comWORKDIR/usr/local/bin#安装cpan模块运行cpanm install --force Cwd Getopt :: Long POSIX File :: Basename
..
这个问题是我之前问过的问题它涉及了解如何使用Snakemake正确访问配置文件.我有一个特定的问题,我需要首先解决,而在理解索引工作原理时则要解决一个一般性的问题. 我正在使用snakemake并运行从Alignment/QC到模体分析的ATAC-seq管道. A:具体问题 我正在尝试添加一条称为 trim_galore_pe 的规则,以在对齐之前从我的fastq文件中修剪适配器
..
说我正在遵循针对文档): 规则名称:输入:"table.txt"输出:"plots/myplot.pdf"康达:"envs/ggplot.yaml"脚本:"scripts/plot-stuff.R"; 说 envs/ggplot.yaml 的内容如下: 渠道:-康达伪造依赖项:-r-ggplot2 完成后,ggplot环境将被保存为say(注意,snakemake自动分配的环境名称d2
..
我在这里扯头发,希望有人可以帮助我. 运行snakemake 4.8.0 我有一个snakemake管道,该管道与两个conda envs和--use-conda一起运行,并且在作为独立管道运行时可以正常工作. 但是,当我在集群上运行时,出现错误: “'conda'命令在$ PATH中不可用." 现在.Anaconda已安装在我们的群集上,但是我们需要使用以下命令在节
..
使用conda在Snakemake包装器中指定包装的最佳 environment.yml 最佳实践是什么?我了解这些渠道应该是: 渠道:-康达伪造-Bioconda- 根据 但是,指定软件包的最佳选择是什么?我没有指定版本吗?完整版本? 使用完整版本之前曾导致使用无限/超长conda环境的问题.但是,不固定版本会带来隐式升级到软件包不兼容版本的风险. 我仅指定直接依赖项,还是应该
..
我正在用snakemake实现一个非常简单的管道,希望用一个有凝聚力的Snakefile代替一连串烦人的bash脚本. 我在编写将文件分割成较小的规则(使用GNU split),然后导致输出连接在一起的第二条规则时遇到了麻烦. 我不知道在concat步骤中为输入内容写什么,因为我不知道如何定义所有符合模式 bam_files/test * 的文件.我尝试使用glob,但是绝对不能正常工
..
我的snakemake管道断言,只要我运行任何规则,我的代码都会引发非零的退出代码,即使如果我手动运行相同的确切代码,我的代码也会返回错误代码0,并且在运行时它可以正常正常运行蛇行. 按照
..
我正在尝试将Snakemake与奇点性结合使用,并且我注意到,使用奇点性时,简单的 awk 命令不再起作用.最后一行中的 $ 1 被bash代替,而不是被 awk 用作第一个字段. 这是一个最小的工作示例( Snakefile ): 奇点:"docker://debian:stretch"统治一切:输入:"test.txt"规则测试:输出:"test.txt"壳:"cat/etc/pass
..
是否可以将自定义命令行参数传递给 snakemake 脚本?我已经尝试过,但是用 argparse 执行Snakefile会导致错误 snakemake:错误:无法识别的参数:-zz .下面是一个示例脚本. import argparsedef get_args():parser = argparse.ArgumentParser(description ='使用RTG vcfeval比较Il
..
也许对于许多人来说答案是显而易见的,但是令我惊讶的是我找不到关于该主题的问题,这对我来说是一个重大问题. 我将不胜感激! 在由slurm管理的集群上提交作业时,如果队列管理器取消了该作业(例如,由于资源或时间不足),snakemake似乎没有收到任何信号,并且永远挂起.另一方面,当作业失败时,snakemake也将失败,正如预期的那样.这种行为正常/有害吗?取消工作时,如何使snakemak
..
我正在尝试创建一个在snakemake中实现bedtools的规则,该规则将closest一个文件,其中一堆文件位于另一个目录中. 我所拥有的是/home/bedfiles目录下的20张病床文件: 1A.bed , 2B_83.bed , 3f_33.bed ... 我想要的是在/home/bedfiles目录下的20个修改过的床文件: 1A_modified, 2B_83
..
假设我有以下文件,我想使用snakemake自动对其进行一些处理: test_input_C_1.txt test_input_B_2.txt test_input_A_2.txt test_input_A_1.txt 以下蛇文件使用expand确定所有可能的最终结果文件: rule all: input: expand("test_output_{text}_{num}.
..
是否可以在集群配置文件中定义内存和资源的默认设置,然后在需要时以规则特定的方式覆盖?规则中的资源字段是否直接绑定到群集配置文件?还是出于可读性目的, params 字段的一种奇特方式? 在下面的示例中,我如何对规则a 使用默认群集配置,但使用自定义更改( memory = 40000 和 rusage = 15000 )在规则b 中? cluster.json: { “ __d
..
首先,这可能是 Snakemake和pandas语法的副本.但是,我仍然很困惑,所以我想再次解释. 在Snakemake中,我加载了带有几列的示例表.其中一列称为"Read1",其中包含特定于样本的读取长度.我想分别为每个样本获取此值,因为它可能有所不同. 我期望的是这样的: rule mismatch_profile: input: rseqc_inpu
..