machine-learning相关内容

用PyTorch预测网格坐标序列

我有一个类似的开放问题here on Cross Validated(虽然不是以实现为重点的,我打算这个问题是这样的,所以我认为它们都是有效的)。 我正在进行一个项目,该项目使用传感器来监控人员的GPS位置。然后,坐标将被转换为简单的网格表示。我想尝试和做的是,在记录用户路线后,训练神经网络来预测下一个坐标,即以下面的例子为例,用户在一段时间内只重复两条路线,Home->A和Home->B。 ..

多标签分类KERAS度量

在KERAS中,哪些指标更适合多标签分类:accuracy或categorical_accuracy?显然,在这种情况下,最后一个激活函数是sigmoid,而AS损失函数是binary_crossentropy。 推荐答案 我不会对类别不平衡的分类任务使用准确性。 尤其是对于多标签任务,您可能会认为您的大多数标签都是假的。也就是说,与所有可能的标签的基数相比,每个数据点只能有一小部分标 ..

使用RANGER计算多分类混淆矩阵或对合表时出错

我正在调用Ranger来为一个大型混合数据帧(其中一些分类变量具有超过53个级别)的多分类问题建模。训练和测试运行没有任何问题。然而,解释混淆矩阵/合同表会出现问题。 我用虹膜数据来解释我面临的困难,把物种当作分类变量, library(ranger) library(caret) # Data idx = sample(nrow(iris),100) data = iris # ..

K=4时k近邻选择类标签

在k-NN分类中,输出是类成员。对象按其邻居的多数票进行分类,对象被分配到其k个最近邻居中最常见的类(k是正整数,通常较小)。 如果k=1,则仅将该对象分配给该单个最近邻居的类。 如果k=3,且类标签为Good=2 Bad=1,则预测的类标签为Good,包含多数票。 如果k=4,并且类标签是Good=2 Bad=2,则类标签是什么? 推荐答案 有不同的方法。例如,按照文档he ..

有没有关于Kera中默认的权重初始值设定项的解释?

我刚刚在here中读到了Kera权重初始值设定项。在文档中,只介绍了不同的初始值设定项。例如: model.add(Dense(64, kernel_initializer='random_normal')) 我想知道当我未指定kernel_initializer参数时,默认权重是多少。 有办法访问它吗? 推荐答案 每一层都有自己的初始化权重的默认值。对于大多数层,例如Den ..
发布时间:2022-06-22 20:51:32 AI人工智能

未将/IMPORT&;中的&;#39;识别为内部或外部命令、可操作程序或批处理文件

我在从SCRICKIT-LEARN导入机器学习算法时遇到了问题。 我已经安装了它,但每当我输入例如“from sklearn.naive_Bayes import GaussianNB”时,它就会显示“‘from’不被识别为内部或外部命令、可操作程序或批处理文件。 我在Windows 10上使用的是蟒蛇。是不是有兼容性问题?我是不是遗漏了什么?IDK我还是个新手,所以我觉得很迷茫。谢谢 推荐 ..

TypeError:编码器要求他们的输入是统一的字符串或数字。已获取[';int&39;,';str';]

我已经引用了帖子here、here和here。不要将其标记为重复。 我正在处理一个二进制分类问题,其中我的数据集具有类别列和数值列。 但是,有些分类列混合了数值和字符串值。然而,它们仅指示类别名称。 例如,我有一个名为biz_category的列,它的值类似于A,B,C,4,5等。 我猜下面的错误是由于类似4 and 5的值引发的。 因此,我尝试在下面将它们转换为catego ..
发布时间:2022-06-21 16:16:41 AI人工智能

如何提高cv2.dnn.readNetFromCaffe()的性能net.ward()需要更多时间(7到10秒/帧)才能给出结果

我已经使用net = cv2.dnn.readNetFromCaffe(protoFile, weightsFile),然后使用net.forward()遍历实时视频帧以获得每个帧的输出。 但net.forward()每帧需要7到10秒才能得出结果。请帮助我提高性能(减少net.forward()中的处理时间)。 表示:从第1步到第2步每帧需要7到10秒。 (下面的代码中提到了步 ..

在WEKA中,监督和非监督重采样有什么不同?

我想知道weka.filters.supervised.instance.Resample和weka.filters.unsupervised.instance.Resample有什么区别? 在哪些情况下,我们应该分别使用它们? 推荐答案 监督和非监督重采样的文档都相同,但 监督重采样的文档有以下附加语句: 可以使过滤器保持子样本中的类分布, 或使班级分布偏向均匀分布。 监 ..
发布时间:2022-05-27 12:05:10 Java开发

为什么F度量是调和平均值,而不是精确度和召回率度量的算术平均值?

当我们同时考虑精度和召回率时,我们取这两个度量的调和平均值,而不是简单的算术平均值。 取调和平均值而不是简单平均值背后的直观原因是什么? 推荐答案 这里我们已经有了一些详细的答案,但我认为更多关于它的信息会对一些想要深入研究(特别是为什么要研究F度量)的人有所帮助。 根据测量理论,综合测量应满足以下6个定义: 连通性(两对可排序)和传递性(如果e1>;=e2且e2 ..
发布时间:2022-05-23 15:03:20 AI人工智能

提高功能重要性

我正在处理一个分类问题。我有大约1000个功能和目标变量有2个类。所有1000个要素的值都为1或0。我正在尝试确定功能重要性,但我的功能重要性值从0.0%到0.003不等。我不确定这么低的值是否有意义。 是否有方法可以提高功能重要性。 # Variable importance rf = RandomForestClassifier(min_samples_split=10, rand ..