bioinformatics相关内容

PHP-REACT验证加密签名

我在Reaction Native中使用此程序包进行生物识别身份验证:https://www.npmjs.com/package/react-native-biometrics 它将一个公钥发送到我们的PHP服务器,然后发送一个加密签名,我们在其中进行了验证。 有没有什么库可以用来根据PHP中的加密签名验证公钥? 推荐答案 我就是这么做的 将public key保存到 ..
发布时间:2022-08-13 15:07:56 PHP

导入HDF5和h5py模块时出错

我正在尝试使用predixcan软件。在其中一个脚本中,使用h5py模块。当我运行该脚本时,它给出以下错误: Could not import HDF5 expression INFO - Could not import h5py module 有人知道如何解决此错误吗? 推荐答案 如果您使用pip,请使用pip install h5py安装h5py;如果您使用蟒蛇,请使用 ..
发布时间:2022-08-13 14:59:17 Python

Html/css,更改每个文本字母?

是否可以更改文本的每个字母的颜色,例如,我在屏幕上的标记文本中打印,我想迭代到每个字母,检查其值并相应地更改其颜色,在使用html/css或javascript添加标记(或者如果js有一个已经执行此操作的库)时是否可以这样做,如下图所示,如您所见,每个字母都有自己的颜色 (来源:clcbio.com) 推荐答案 使用Java脚本创建跨度并使用css:http://codepen. ..
发布时间:2022-04-15 12:55:25 前端开发

计算直到给定长度的所有可能的序列

我的问题与生物信息学有关,特别是蛋白质序列。然而,实际上并不需要生物学知识。我正在努力寻找一种在Perl中解决此问题的有效方法: 蛋白质序列基本上是长度不等的序列或字符串,由20个氨基酸或字符的组合组成。 长度为1时,因此有20种可能性。问题是,每增加1个字符,可能性的数量就会大幅增加。 我想对每个长度的每个序列进行另一次计算。蛋白质序列可以是成百上千个氨基酸。我只需要获取所有可 ..
发布时间:2022-04-15 12:52:28 其他开发

Snakemake:在一个通配符上组合输入

我想知道您是否能够提供有关定义Snakemake规则以组合一个而不是所有通配符的建议?我的数据是有组织的,这样我就有了运行和样本;大多数(但不是全部)样本在每次运行中都进行了重新排序。因此,我有针对每个样本运行的预处理步骤。然后,我有一个步骤,为每个样本的每次运行组合BAM文件。然而,我遇到的问题是,我对如何定义规则感到有点困惑,这样我就可以列出与样本相对应的所有个人bam的输入(来自不同的运行) ..
发布时间:2022-04-15 12:50:08 其他开发

多序列的汉明距离矩阵

我有一个包含ID和相应DNA序列的FASTA文件,我已将其解析并存储到词典中。 我现在需要编写一个Python程序来计算所有序列的成对汉明距离矩阵。 到目前为止,我已经尝试对词典的所有值运行for循环并检查每个字符,但这不能正确实现汉明距离或返回矩阵。 推荐答案 尝试使用Skledge包,它有一个函数来计算指定距离度量的成对距离。您可以在此处找到该函数:https://sciki ..
发布时间:2022-04-15 12:47:21 Python

Snakemake Temp()

我已将Snakemake连接到S3帐户,并且我希望在处理我们的管道后删除某些temp()文件。 我有一条规则将某些文件指定为temp()。下面是一个示例: #Split rep element mapped bam file into subfiles rule split_rep_bam: input: 'rep_element_pipeline/{sample}.fa ..
发布时间:2022-04-15 12:44:50 其他开发

Snakemake让检查点和聚合函数工作

我在执行Snakemake Aggregate命令时遇到问题。我希望获得一个给定的GTF文件,在GTF中查找单独的区域,如果找到,则将这些区域写入一个单独的文件。因此,我不确定每个输入GTF文件将创建的输出GTF文件的数量。为了解决此问题,我正在尝试使用蛇造检查站。 为此,我编写了一个名为collapse_gtf_file.py的简短脚本,它只接受一个GTF文件,并根据找到的各个区域的数量生成N ..
发布时间:2022-04-15 12:42:32 其他开发

如何计算R中的重叠百分比

我正在尝试计算满足某些标准的两个具有基因组坐标的数据集之间的重叠百分比。 Seg2 ID chrom loc.start loc.end num.mark seg.mean AB 1 3010000 173490000 8430 0.0039 AB 1 173510000 173590000 5 -17.738 AB 1 173 ..
发布时间:2022-04-15 12:40:03 其他开发

使用Granges对象上的坐标从FASTA文件中提取序列片段

我需要提取枯草芽孢杆菌的基因间序列。 我有R中枯草杆菌的完整DNA序列,用seqinr导入。 我使用seqinr; 包的函数read.fast将DNA序列导入到R中 然后,我使用包“genbank”从枯草杆菌GenBank文件创建了一个Granges对象,以提取基因间坐标。 这是带有基因间坐标的我的Granges对象的格式: GRanges object with 3841 ..
发布时间:2022-04-15 12:37:12 其他开发

在tkinter图形用户界面中解决简单的ODE系统

我有一个用于SIR疾病模型的简单的ODE系统,它工作得很好,并产生了一个图形化的情节。但是,我正在尝试使用tkinter创建一个简单的弹出框,该框接受参数值,而不必通过脚本将参数值放入其中。 以下是原始代码。 import numpy as np from scipy.integrate import odeint import matplotlib.pyplot as plt #t ..
发布时间:2022-04-15 12:35:33 Python

如何在R中合并FASTA文件

我有四个单独的FASTA文件,我想将它们合并到一个大的FASTA文件中。到目前为止,我已经使用生物字符串包分别读取了每个文件 推荐答案 例如,如果FASTA文件是: folder = "http://hgdownload.soe.ucsc.edu/goldenPath/sacCer3/chromosomes/" files = paste0(folder,c("chrI","ch ..
发布时间:2022-04-15 12:30:16 其他开发

接受略有不同的Snakemaker规则输入(.fq与.fq.gz)

我是Snakemake的新手,我希望能够获取一对.fq文件或一对.fq.gz文件,并通过trim_galore运行它们来获得一对经过修剪的.fq.gz输出文件。在不给出我所有的Snakefile的情况下,我有了下面这个难看的解决方案,我只是复制了规则并更改了输入。什么是更好的解决方案? #Trim galore paired end trimming rule for unzipped fa ..
发布时间:2022-04-15 12:27:25 其他开发

垂直线散点图-棒棒糖曲线图

我想构建这样一个散点图:http://www.cbioportal.org/public-portal/images/previews/tp53_mutations.png,其中每个点都有一个圆+垂直线。 我在下面找到的最接近的东西是library(scatterplot3d)中的3D散点图,但我只有x,y。 您对库/函数/选项有什么建议吗? 推荐答案 在基本图形中也相当容 ..
发布时间:2022-04-15 12:24:27 其他开发

在Python/Biopython中生成所有可能的唯一肽(置换)

我有一个场景,其中我有一个具有9个氨基酸的肽框。我想通过替换此框架上最多3个氨基酸(即仅替换1个、2个或3个AA)来生成所有可能的肽。 框架为CKASGFTFS,我希望通过从20个AA池中最多替换3个AA来查看所有突变。 我们有20个不同AA(A、R、N、D、E、G、C、Q、H、I、L、K、M、F、P、S、T、W、Y、V)的池。 我刚开始编码,所以有人能帮我解决如何用Python ..
发布时间:2022-03-02 10:12:11 Python

基于范围重叠处理输入文件

我有一个巨大的输入文件(其代表性示例如下所示为 input): >输入CT1 CT2 CT31 chr1:200-400 chr1:250-450 chr1:400-8002 chr1:800-970 chr2:200-500 chr1:700-8703 chr2:300-700 chr2:600-1000 chr2:700-1400 我想通过遵循一些规则(如下所述)来处理它,以便我得到一个 ..
发布时间:2022-01-24 19:41:05 其他开发