machine-learning相关内容

如何检测(心电图)波的模式?

我正在试着从心电图上读取一幅图像,并检测其中的每一个主要波(P波、QRS波和T波)。我可以读取图像并获得向量(如(4.2; 4.4; 4.9; 4.7; ...))。我需要一个算法,它可以遍历这个矢量,并检测每个波的开始和结束时间。示例: 如果它们的大小总是相同的,或者如果我事先知道ECG有多少个波,那就很容易了。给定波形: 我提取向量: [0; 0; 20; 20; 20; 1 ..

TensorFlow多元线性回归结果在NAN中的应用

我正在使用sklearn的波士顿住房数据集(506x13矩阵)进行多元线性回归。我计划使用所有数据对其进行训练,然后“插入”一个随机数据(如boston_dataset.data[39]),然后查看损失情况。但当我打印结果时,得到的只有NaN。这是我的代码。 import tensorflow as tf import numpy as np import matplotlib.pyplot ..

在要素缩放、线性回归之后重新缩放

似乎是一个基本问题,但我需要在使用梯度下降的线性回归实现中使用特征缩放(取每个特征值,减去平均值,然后除以标准差)。在我完成之后,我想要将权重和回归线重新缩放到原始数据。我只用了一个功能,外加y-截取术语。使用缩放数据获取权重后,如何更改权重,使其应用于原始的未缩放数据? 推荐答案 假设您的回归是y = W*x + b与x缩放数据,与原始数据为 y = W/std * x0 + ..

如何只拟合数据集的线性部分?

p=(-50:50)^2 y=c(p, 2500+10*(1:99), p+1000) plot(seq_along(y), y+100*rnorm(length(y))) 假设我有一个类似上面的数据集,其中只有一部分数据是线性的。像R中的lm()这样的普通线性回归无法智能地找出适合线性拟合的区域(在本例中为100到200)。 如何找出数据的哪一部分是线性的,并仅在此数据集中执行拟合?欢迎使 ..

如何使用TensorFlow保存编码器-解码器模型?

我有一个编码器-解码器模型,可以做出很好的预测,但我正在努力保存层的隐藏状态,以便可以重用该模型。 下面的文本描述了我训练、测试、保存和加载模型所采取的每个步骤。 导入 import tensorflow as tf from tensorflow.keras.layers import LSTM, Input, TimeDistributed, Dense, Embedding ..
发布时间:2022-03-23 21:16:00 AI人工智能

火炬的LSTM、多变量、多特征

我在理解pytorch中LSTM的数据格式时遇到了问题。假设我有一个具有4个功能的CSV文件,一个接一个地以时间戳的形式排列(一个经典的时间序列) time1 feature1 feature2 feature3 feature4 time2 feature1 feature2 feature3 feature4 time3 feature1 feature2 feature3 featur ..
发布时间:2022-03-23 21:11:48 AI人工智能

在测试了训练好的LSTM模型后,如何预测实际的未来值?

我已经通过将数据集拆分为训练和测试来训练我的股价预测模型。 我还通过比较有效数据和预测数据对预测进行了测试,模型运行良好。 但我想预测实际未来值。 我需要在下面的代码中更改哪些内容? 如何预测到实际未来的特定日期? 代码(在Jupyter笔记本中): (要运行代码,请在您拥有的类似CSV文件中试用,或使用命令pip install nsepy安装nsepy python库) ..
发布时间:2022-03-23 21:10:30 AI人工智能

DBSCAN算法是否可以创建小于minPts的集群?

我刚刚编写了DBSCAN算法,我想知道DBSCAN算法是否允许群集中的点数少于使用的minPts参数。 我一直在使用http://people.cs.nctu.edu.tw/~rsliang/dbscan/testdatagen.html验证我的实现,它似乎工作正常,只是遇到了这个问题。 我正在对一个样本数据集运行一些模拟,我一直在使用minPts为3。DBSCAN算法通常会从数据集创 ..

间歇性&运行错误:Cuda内存不足&Google Colab微调Bert Base时出错,原因是Transformers和PyTorch

我正在运行以下代码来微调Google Colab中的Bert Base Case模型。有时代码第一次运行得很好,没有错误。其他时候,使用相同数据的相同代码会导致“CUDA内存不足”错误。以前,重新启动运行库或退出笔记本,返回笔记本,执行工厂运行时重新启动,然后重新运行代码即可成功运行,而不会出现错误。不过,刚才我尝试了5次重启和重试,每次都出现错误。 问题似乎不在于我正在使用的数据和代码的组 ..

词汇量和嵌入维度之间的首选比例是多少?

使用例如gensim、word2vec或类似方法训练嵌入向量时,我想知道什么是好的比率,或者嵌入维度与词汇表大小之间是否有更好的比率? 另外,随着更多数据的出现,这种情况会发生怎样的变化? 由于我仍在讨论如何在训练嵌入向量时选择合适的窗口大小? 我之所以问这个问题,是因为我没有用现实生活中的语言词典来训练我的网络,而是这些句子将描述进程和文件以及其他进程之间的关系,等等。 例如,我的文本语 ..

LDA生成的组件比Python中要求的少

我正在处理以下数据集: http://archive.ics.uci.edu/ml/datasets/Bank+Marketing 可以通过单击数据文件夹链接找到数据。存在两个数据集,一个训练集和一个测试集。我使用的文件包含两个集合中的组合数据。 我正在尝试应用线性判别分析(LDA)来获得两个组件,但是,当我的代码运行时,它只产生一个组件。如果设置“n_Components=3” ..

在卫星数据集上进行光谱聚类后使用Networkx绘制图形的步骤

我已经生成了包含20个点的卫星数据集,并对其进行了光谱聚类。我想在Networkx的帮助下使用最近邻居=3来形成一个图。其中数据点是节点,聚类后生成的亲和度矩阵是不同节点之间的边上的权重。我还需要帮助更改两个群集的节点的颜色和形状,以便将一个群集的节点与另一个群集的节点区分开来。代码如下所示。下面给出了输出图像。我只想使用近邻=3在输出图像的节点之间绘制一个图。 import numpy a ..

在k-均值聚类中,如何设置每个簇的最小观测数?

我正在尝试根据用户行为对一些产品进行集群。我最后看到的是具有非常不同观测数量的星团。 我已检查k-Means群集参数,但找不到控制每个群集的最小(或最大)观察数的参数。 例如,此处显示了观察值数量在不同群集之间的分布方式。 cluster_id num_observations 0 6 1 4 2 1 3 3 4 29 5 5 有关于如何处理此问题 ..