machine-learning相关内容

手套和word2vec的主要区别是什么?

word2vec和手套有什么区别? 训练单词的两种方法都是嵌入的吗?如果是,那么我们如何才能同时使用两者? 推荐答案 是,它们都是训练单词嵌入的方法。它们都提供相同的核心输出:每个单词一个向量,这些向量以有用的方式排列。也就是说,向量的相对距离/方向大致符合人类对整体词汇关联性的看法,甚至在某些显著的语义维度上也符合关联性。 word2vec通过在训练语料库上重复迭代,对神经网络 ..
发布时间:2022-04-22 22:55:59 AI人工智能

在随机林中使用Forecast()和Predict_Proba()进行计算时,ROC_AUC_Score不同

在随机林中预测()和预测_Proba()产生不同的ROC_AUC_Score。 我知道Forecast_Proba()给出了概率,比如在二进制分类的情况下,它会给出两个对应于两个类别的概率。 Forecate()给出它预测的类。 #Using predict_proba() rf = RandomForestClassifier(n_estimators=200, ra ..

什么时候微观和宏观平均值会有很大不同?

我正在学习机器学习理论。我有一个使用多类别Logistic回归的预测混淆矩阵。 现在我已经计算了微观和宏观平均值(精度和召回)。 值有很大不同。现在我想知道是什么因素影响了这一点。在什么情况下,微观和宏观会有很大的不同? 我注意到的是,对于不同的类别,预测的准确性是不同的。这就是原因吗?或者还有什么其他因素可以导致这种情况? 样本混淆矩阵: 和我计算的微观-宏观平均值 ..

有没有办法适当地调整这个逻辑回归函数,以说明多个自变量和固定效应?

我想对下面包含的LogitRegress函数进行修改,以包括其他自变量和固定效果。 以下代码改编自此处提供的答案:how to use sklearn when target variable is a proportion from sklearn.linear_model import LinearRegression from random import choices from ..

Logistic回归:成本函数没有减少

我目前正在上一门关于Coursera的Andrew Ng课程,我尝试在数据集上使用我所学到的关于Logistic回归的知识。但我不能使成本函数减小。 我尝试了不同的学习速率(0.0001、0.003、0.0001…)和迭代次数。可能是我写错了函数,但找不到错误 import numpy as np import scipy as sc import matplotlib.pyplot ..

在一个模型中,精确度和召回率是相同的

我正在进行一个多分类项目,我注意到无论我运行什么分类器,模型中的精度和召回率都是相同的。 分类问题有三个截然不同的类别。数据量偏小,13k实例分为测试(0.8)和训练(0.2)。 训练数据的形状为(10608,28),标签的形状为(10608,3)(二进制标签)。 分类不平衡: 标签0占所有标签的30% 标签1占所有标签的4% 标签2占所有标签的66%。 我正在比 ..

Sklearn带管道的自定义转换器:级联轴的所有输入数组维度必须完全匹配

我正在学习sklearn自定义转换器,并阅读有关创建自定义转换器的两种核心方法: 通过设置从BaseEstimator和TransformerMixin继承的自定义类,或 通过创建转换方法并将其传递给FunctionTransformer。 我想通过实现元矢量器和功能来比较这两种方法:支持CountVectorizer或TfidfVectorizer的矢量器,并根据指定的矢量器类型转 ..

将LinearSVC的决策函数转换为概率(Scikit学习Python)

我使用来自SCRKIT学习的线性支持向量机(LinearSVC)来解决二值分类问题。我知道LinearSVC可以给我预测的标签和决策得分,但我想要概率估计(对标签的信心)。由于速度的原因,我想继续使用LinearSVC(与使用线性内核的sklearn.svm.SVC相比)使用Logistic函数将决策分数转换为概率是否合理? import sklearn.svm as suppmach # ..
发布时间:2022-04-07 23:07:12 AI人工智能

在RStudio中使用keras时,如何使绘图显示在Rmarkdown文件中而不是查看器面板中?

我是R中的新手,正在尝试Rstudio中的keras。通过运行FIT()进行的所有accuracy、loss交互绘图都显示在Viewer窗格中,而不是Rmarkdown文件中。 所有其他绘图通常在Rmarkdown文件中打印,但不使用kera。 我还检查了RStudio中的Global settingsTools>Global Options>R Markdown>Show outpu ..
发布时间:2022-04-02 20:16:35 AI人工智能

参数必须是1个整数的元组。接收的OR TypeError:int()参数必须是字符串、类似字节的对象或数字,而不是列表

我尝试使用FIT_GENERATOR和TALOS(用于超参数调优)。早些时候,当我使用FIT方法时,我得到了内存错误,所以当我在这里搜索时,人们说我应该尝试使用FIT_GENERATOR。前面我给了太多的参数,所以即使使用FIT_GENERATOR,我也得到了内存错误,现在我减少了参数的数量,现在我得到了不同的错误。请查找下面的代码和错误。 代码: def yield_arrays_t ..

TensorFlow对象检测API:从导出的模型检查点训练

我以前有一个导出的RetinanNet模型(最初来自对象检测动物园),它已经使用TensorFlow对象检测API(TensorFlow 2.4.1版)在自定义数据集上进行了微调。下面是导出模型的文件夹的外观。 对模型运行评估时(如下所示),MAP@0.5IOU为0.5。 python model_main_tf2.py --model_dir=exported-models/reti ..