AI人工智能

间歇性&运行错误:Cuda内存不足&Google Colab微调Bert Base时出错,原因是Transformers和PyTorch

我正在运行以下代码来微调Google Colab中的Bert Base Case模型。有时代码第一次运行得很好,没有错误。其他时候,使用相同数据的相同代码会导致“CUDA内存不足”错误。以前,重新启动运行库或退出笔记本,返回笔记本,执行工厂运行时重新启动,然后重新运行代码即可成功运行,而不会出现错误。不过,刚才我尝试了5次重启和重试,每次都出现错误。 问题似乎不在于我正在使用的数据和代码的组 ..

词汇量和嵌入维度之间的首选比例是多少?

使用例如gensim、word2vec或类似方法训练嵌入向量时,我想知道什么是好的比率,或者嵌入维度与词汇表大小之间是否有更好的比率? 另外,随着更多数据的出现,这种情况会发生怎样的变化? 由于我仍在讨论如何在训练嵌入向量时选择合适的窗口大小? 我之所以问这个问题,是因为我没有用现实生活中的语言词典来训练我的网络,而是这些句子将描述进程和文件以及其他进程之间的关系,等等。 例如,我的文本语 ..

LDA生成的组件比Python中要求的少

我正在处理以下数据集: http://archive.ics.uci.edu/ml/datasets/Bank+Marketing 可以通过单击数据文件夹链接找到数据。存在两个数据集,一个训练集和一个测试集。我使用的文件包含两个集合中的组合数据。 我正在尝试应用线性判别分析(LDA)来获得两个组件,但是,当我的代码运行时,它只产生一个组件。如果设置“n_Components=3” ..

在卫星数据集上进行光谱聚类后使用Networkx绘制图形的步骤

我已经生成了包含20个点的卫星数据集,并对其进行了光谱聚类。我想在Networkx的帮助下使用最近邻居=3来形成一个图。其中数据点是节点,聚类后生成的亲和度矩阵是不同节点之间的边上的权重。我还需要帮助更改两个群集的节点的颜色和形状,以便将一个群集的节点与另一个群集的节点区分开来。代码如下所示。下面给出了输出图像。我只想使用近邻=3在输出图像的节点之间绘制一个图。 import numpy a ..

在k-均值聚类中,如何设置每个簇的最小观测数?

我正在尝试根据用户行为对一些产品进行集群。我最后看到的是具有非常不同观测数量的星团。 我已检查k-Means群集参数,但找不到控制每个群集的最小(或最大)观察数的参数。 例如,此处显示了观察值数量在不同群集之间的分布方式。 cluster_id num_observations 0 6 1 4 2 1 3 3 4 29 5 5 有关于如何处理此问题 ..

在KERAS中安装模型时,批量大小和纪元数应该有多大?

我正在对970个样本进行培训,并对243个样本进行验证。 在KERAS中拟合模型以优化val_acc时,批大小和纪元数应该有多大?是否有任何基于数据输入大小的经验法则可供使用? 推荐答案 因为您的数据集非常小(大约1,000个样本),所以使用批大小为32可能是安全的,这是非常标准的。它不会对你的问题产生巨大的影响,除非你在进行数十万或数百万次的观察训练。 回答您有关批次大小和纪 ..
发布时间:2022-03-02 09:51:39 AI人工智能

比较Pandas Dataframe的列名

如何比较2个不同 pandas 数据框的列名。我想比较测试数据帧中缺少某些列的列车数据帧和测试数据帧?? 推荐答案 pandas.Index对象(包括数据框列)具有有用的set类方法,如intersection和difference。 例如,给定数据帧train和test: train_cols = train.columns test_cols = test.column ..
发布时间:2022-03-02 09:30:13 AI人工智能

RESNET 50与yolo或rcnn有什么不同?

作为Deep Learning的新手,我正在努力理解不同技术状态的算法及其用途之间的差异。就像RESNET或VGG与yolo或rcnn系列有什么不同。它们是这些检测模型的子组件吗?固态硬盘是否也是像yolo或rcnn这样的另一个系列? 推荐答案 Resnet是一族神经网络(使用残差函数)。很多神经网络使用ResNet架构,例如: ResNet18、ResNet50 宽ResNe ..

如何仅在一个特定类上评估TensorFlow对象检测API?

我已经从TensorFlow Object Detection APIfaster_rcnn_inception_resnet_v2_atrous_coco训练了大约10个类的对象检测模型。当我运行model_main.py文件评估模型时,它似乎只给出了所有10个类的平均准确率(AP)和平均召回率(AR),如下所示: Average Precision (AP) @[ IoU=0.50:0 ..

在TensorFlow的输入中输入什么才能正常工作

您好,我正在尝试一个非常简单的项目来了解TensorFlow中的工作原理。我只给了3个简单的数组,它找不到给我一个错误之间的关系。为什么会这样,如何克服呢?以下是我的代码 import tensorflow as tf from tensorflow import keras x = [[1,2,5,6],[12,5,1,7],[1,5,7,9]] y = [[1],[4],[3]] m ..

PyTorch中多输出回归问题的均方根损失

我正在训练CNN架构,以使用PyTorch解决回归问题,其中我的输出是20个值的张量。我计划使用RMSE作为模型的损失函数,并尝试使用PyTorch的nn.MSELoss()并使用torch.sqrt()求它的平方根,但在获得结果后感到困惑,我将尽力解释原因。很明显,对于批大小bs,我的输出张量的维数将是[bs , 20]。我尝试实现我自己的AND RMSE函数: def loss_f ..

在TensorFlow中执行简单项目的最低系统要求是什么?

我一直想试用TensorFlow,但我不知道我的系统是否有足够的硬件要求。 我的系统规格是英特尔i3处理器 4 GB内存1TB硬盘 NVIDIA 210 GPU 此配置是否足以运行像图像识别这样的简单AI项目? 我已经搜索了网站和其他资源,但没有找到有关系统要求的详细信息。 GPU 更新2020-01-17:免费试用在线推荐答案实例。例如,colab.research. ..
发布时间:2022-03-01 23:33:29 AI人工智能

如何使用python拟合多指数曲线

对于这里的图像curve_fit for as single exponential curve所示的单个指数曲线,我可以使用scipy.Optimize.curveFit来拟合数据。然而,我不确定如何实现对这里所示的由多个指数曲线组成的相似数据集的拟合double exponential curves。 我使用以下方法实现了对单曲线的拟合: def exp_decay(x,a,r): ..

为什么允许对角线移动会使A*和曼哈顿距离不可接受?

我对使用A*和曼哈顿距离度量的网格中的对角移动有些困惑。有没有人能解释一下为什么使用对角线移动会使其不可接受?在对角运动中,到达目标状态所需的步骤比上下、左下、右少,难道不会找到更好的最优解吗?还是我错过了什么? 推荐答案 正如贝克的评论所表明的那样,曼哈顿距离将高估一个州与其对角可访问的州之间的距离。根据定义,超出估计距离的启发式是不允许的。 现在,到底为什么会这样? 假 ..

为什么需要目标网络?

我想了解为什么目标网络在DQN中是必需的?我正在读一篇关于“通过深度强化学习实现人的水平控制”的论文 我理解Q-Learning。Q-Learning是一种基于值的强化学习算法,它学习状态-动作之间的“最佳”概率分布,从而在一系列时间步长上最大化其长期贴现回报。 q学习使用Bellman方程进行更新,q学习更新的单个步骤由 给出 Q(S, A) = Q(S, A) + $alpha ..
发布时间:2022-03-01 23:24:44 AI人工智能