snakemake 第2页 - IT屋-程序员软件开发技术分享社区

STAR索引发布到步骤4

我正在尝试使用snakemake索引管道上的参考基因组，并制定了以下规则: 规则reference_faidx_star:输入:"../resources/reference/Qrob_PM1N.fa"输出:"../resources/reference/ref/"线程数:1日志:"../results/logs/star/star_index.log"参数:gtf ="../resources ..

R 用矩形而不是文本绘制图

我正在使用 snakemake 构建管道，并使用 conda 和 singularity 环境来确保可重复性.我遇到了一个错误，我的绘图上的文本被矩形替换了 ..

发布时间：2021-05-29 22:28:18 r linux pipeline snakemake singularity-container 服务器开发

一次运行Snakemake规则一个样本

我正在创建一个Snakemake工作流程，该工作流程将包装运行命令: snakemake -j 32 --use-conda 在 ../fastq/目录中存在四个样本/外显子组时出错: GPU-BWA memProgressMeter读取对齐的碱基对在ParaBricks/src/samGenerator.cu:782处cudaSafeCall()失败:内存不足在ParaBri ..

发布时间：2021-05-13 18:42:31 bash loops gpu snakemake genome 其他开发

Snakemake中输入函数的并行输出

你好Snakemake社区，在Snakemake中正确定义功能并在 params 部分中调用它时，我遇到了很多麻烦.该函数的输出是一个列表，我的目标是将列表的每一项用作shell命令的参数.换句话说，我想使用不同的参数并行运行同一外壳命令的多个作业. 这是功能: import os，globdef get_scontigs_names(通配符):scontigs = glob.g ..

发布时间：2021-05-09 20:13:16 python function lambda wildcard snakemake Python

如何不使用Snakemake撤销更新的文件

即使已经有输出文件了，Snakemake也只想重新执行我的所有管道，因为我已经修改了第一个输出文件之一. 我通过使用"np --reason"运行Snakemake来弄清楚:原因:输入文件被另一个作业更新:Mapping/col.sorted.bam 如何强制Snakemake不重新运行此更新文件? 谢谢解决方案您可以使用选项-touch 将其标记为最新: -触 ..

发布时间：2021-05-07 18:44:55 file output snakemake 其他开发

Snakemake-下载数据的规则

我在实施管道时遇到了一些麻烦，在该管道中，第一步是从某些服务器下载数据.据我了解，所有规则都必须具有作为文件的输入.但是，在我的情况下，“输入"是提供给脚本的ID字符串，该脚本访问服务器并下载数据. 我知道了snakemake中的远程文件选项，但是服务器我从( ENA )下载的文件不在该列表中.此外，我正在使用一个调用aspera的脚本来提高下载速度. 关于如何在snakemake中实现这种方 ..

发布时间：2021-05-02 20:32:04 download snakemake 其他开发

来自Snakemake的Docker容器的权限被拒绝的错误

我以前已经从此 Dockerfile 构建了一个Docker容器，并且运行良好: FROM perl:5.32维护者Matthew Jordan Oldach，moldach686 @ gmail.comWORKDIR/usr/local/bin#安装cpan模块运行cpanm install --force Cwd Getopt :: Long POSIX File :: Basename ..

发布时间：2021-05-02 19:42:09 docker permission-denied snakemake 其他开发

Snakemake:关于如何正确访问配置文件的困惑

这个问题是我之前问过的问题它涉及了解如何使用Snakemake正确访问配置文件.我有一个特定的问题，我需要首先解决，而在理解索引工作原理时则要解决一个一般性的问题. 我正在使用snakemake并运行从Alignment/QC到模体分析的ATAC-seq管道. A:具体问题我正在尝试添加一条称为 trim_galore_pe 的规则，以在对齐之前从我的fastq文件中修剪适配器 ..

发布时间：2021-04-24 18:30:26 indexing config wildcard curly-braces snakemake 其他开发

如何在snakemake工作流程中追溯用于生成结果文件的确切软件版本

说我正在遵循针对文档): 规则名称:输入:"table.txt"输出:"plots/myplot.pdf"康达:"envs/ggplot.yaml"脚本:"scripts/plot-stuff.R"；说 envs/ggplot.yaml 的内容如下: 渠道:-康达伪造依赖项:-r-ggplot2 完成后，ggplot环境将被保存为say(注意，snakemake自动分配的环境名称d2 ..

发布时间：2021-04-23 20:44:23 conda snakemake reproducible-research 其他开发

Snakemake:我一直在获取'conda'命令在$ PATH中不可用.在SGE群集上运行时

我在这里扯头发，希望有人可以帮助我. 运行snakemake 4.8.0 我有一个snakemake管道，该管道与两个conda envs和--use-conda一起运行，并且在作为独立管道运行时可以正常工作. 但是，当我在集群上运行时，出现错误: “'conda'命令在$ PATH中不可用." 现在.Anaconda已安装在我们的群集上，但是我们需要使用以下命令在节 ..

发布时间：2021-04-23 20:43:13 conda snakemake environment-modules 其他开发

Snakemake包装器中(bio)conda版本的最佳做法?

使用conda在Snakemake包装器中指定包装的最佳 environment.yml 最佳实践是什么?我了解这些渠道应该是: 渠道:-康达伪造-Bioconda- 根据但是，指定软件包的最佳选择是什么?我没有指定版本吗?完整版本? 使用完整版本之前曾导致使用无限/超长conda环境的问题.但是，不固定版本会带来隐式升级到软件包不兼容版本的风险. 我仅指定直接依赖项，还是应该 ..

发布时间：2021-04-23 20:42:52 conda snakemake 其他开发

snakemake中的未知输出

我正在用snakemake实现一个非常简单的管道，希望用一个有凝聚力的Snakefile代替一连串烦人的bash脚本. 我在编写将文件分割成较小的规则(使用GNU split)，然后导致输出连接在一起的第二条规则时遇到了麻烦. 我不知道在concat步骤中为输入内容写什么，因为我不知道如何定义所有符合模式 bam_files/test * 的文件.我尝试使用glob，但是绝对不能正常工 ..

发布时间：2021-04-15 19:47:03 bioinformatics snakemake 其他开发

Snakemake声称规则退出使用非零退出代码，即使使用"||"也是如此真的"?

我的snakemake管道断言，只要我运行任何规则，我的代码都会引发非零的退出代码，即使如果我手动运行相同的确切代码，我的代码也会返回错误代码0，并且在运行时它可以正常正常运行蛇行. 按照 ..

发布时间：2021-04-14 20:32:55 python bash snakemake Python

awk命令在snakemake --use-singularity中失败

我正在尝试将Snakemake与奇点性结合使用，并且我注意到，使用奇点性时，简单的 awk 命令不再起作用.最后一行中的 $ 1 被bash代替，而不是被 awk 用作第一个字段. 这是一个最小的工作示例( Snakefile ): 奇点:"docker://debian:stretch"统治一切:输入:"test.txt"规则测试:输出:"test.txt"壳:"cat/etc/pass ..

发布时间：2021-04-14 19:59:10 bash snakemake singularity-container 其他开发

在Snakemake脚本中使用argparse

是否可以将自定义命令行参数传递给 snakemake 脚本?我已经尝试过，但是用 argparse 执行Snakefile会导致错误 snakemake:错误:无法识别的参数:-zz .下面是一个示例脚本. import argparsedef get_args():parser = argparse.ArgumentParser(description ='使用RTG vcfeval比较Il ..

发布时间：2021-04-09 19:14:14 python python-3.x command-line-arguments argparse snakemake Python

当集群(Slurm)取消作业时，Snakemake挂起

也许对于许多人来说答案是显而易见的，但是令我惊讶的是我找不到关于该主题的问题，这对我来说是一个重大问题. 我将不胜感激！在由slurm管理的集群上提交作业时，如果队列管理器取消了该作业(例如，由于资源或时间不足)，snakemake似乎没有收到任何信号，并且永远挂起.另一方面，当作业失败时，snakemake也将失败，正如预期的那样.这种行为正常/有害吗?取消工作时，如何使snakemak ..

发布时间：2021-02-12 19:27:12 jobs slurm cancellation snakemake 其他开发

在Snakemake中使用多个文件名作为通配符

我正在尝试创建一个在snakemake中实现bedtools的规则，该规则将closest一个文件，其中一堆文件位于另一个目录中. 我所拥有的是/home/bedfiles目录下的20张病床文件: 1A.bed , 2B_83.bed , 3f_33.bed ... 我想要的是在/home/bedfiles目录下的20个修改过的床文件: 1A_modified, 2B_83 ..

发布时间：2020-11-28 23:18:05 input wildcard snakemake 其他开发

当不需要通配符的某些特定组合时，如何在snakemake中使用expand?

假设我有以下文件，我想使用snakemake自动对其进行一些处理: test_input_C_1.txt test_input_B_2.txt test_input_A_2.txt test_input_A_1.txt 以下蛇文件使用expand确定所有可能的最终结果文件: rule all: input: expand("test_output_{text}_{num}. ..

发布时间：2020-11-23 05:45:18 python wildcard itertools higher-order-functions snakemake Python

Snakemake-以特定于规则的方式覆盖LSF（bsub）群集配置

是否可以在集群配置文件中定义内存和资源的默认设置，然后在需要时以规则特定的方式覆盖？规则中的资源字段是否直接绑定到群集配置文件？还是出于可读性目的， params 字段的一种奇特方式？在下面的示例中，我如何对规则a 使用默认群集配置，但使用自定义更改（ memory = 40000 和 rusage = 15000 ）在规则b 中？ cluster.json： { “ __d ..

发布时间：2020-10-03 02:39:44 configuration cluster-computing snakemake 其他开发

Snakemake和Pandas语法:从样本表中获取样本特定参数

首先，这可能是 Snakemake和pandas语法的副本.但是，我仍然很困惑，所以我想再次解释. 在Snakemake中，我加载了带有几列的示例表.其中一列称为"Read1"，其中包含特定于样本的读取长度.我想分别为每个样本获取此值，因为它可能有所不同. 我期望的是这样的: rule mismatch_profile: input: rseqc_inpu ..

发布时间：2020-09-21 03:26:10 bioinformatics snakemake 其他开发

snakemake相关内容