AI人工智能

Tensorflow 模型正确拟合格式数据——TypeError:无法将符号 Keras 输入/输出转换为 numpy 数组

对于 NLP 任务,我的输入数据集被转换为如下所示:整数列表.特征和标签是同一个数据集. >>>training_data = [[ 0 4 79 3179 11 44​​ 8 1 11245 173 152 101 1138 1079][ 0 0 4 79 3179 11 44​​ 8 11566 173 152 81 1138 1079][ 0 0 0 0 0 0 0 9 15 333 44 ..

要在神经网络模型中用于预测的数据的缺失值

我目前有大量数据将用于训练预测神经网络(美国主要机场的千兆字节天气数据).我几乎每天都有数据,但有些机场的数据中缺少值.例如,一个机场在 1995 年之前可能不存在,所以我没有在那之前那个特定位置的数据.此外,有些缺少整年(可能跨越 1990 年到 2011 年,缺少 2003 年). 如何在不误导神经网络的情况下使用这些缺失值进行训练?我想用 0 或 -1 填充空数据,但我觉得这会导致网络 ..

数据挖掘任务的数据集

我在数据挖掘领域相对较新.我目前正在做一些数据预处理算法,例如 PCA 和 min max Normalization.我们的教授说我们可以从网上下载可用的数据集.但在初始阶段,我想要一个简单的数据集,我的算法的属性数量相对较少,然后会切换到各种复杂的数据集. 谁能提供您在数据挖掘算法中必须使用的简单数据集的链接?例如与学生的分数、年龄、身高等或公司的员工数据有关的东西.任何帮助将不胜感激. ..
发布时间:2022-01-21 13:14:47 AI人工智能

用于测试非线性 SVM 的数据集

我正在实现一个非线性 SVM,我想在一个简单的非线性可分数据上测试我的实现.谷歌没有帮我找到我想要的.你能告诉我在哪里可以找到这样的数据吗?或者至少,我怎样才能手动生成这样的数据? 谢谢, 解决方案 嗯,SVM 是两类分类器 - 即,这些分类器将数据放置在单个决策边界的任一侧. 因此,我建议一个仅包含两个类的数据集(这不是绝对必要的,因为 SVM 可以通过多次(串行)传递分类器 ..

如何在 scikit-learn(用于计算机视觉)中使用我自己的数据集?

如何在 scikit-learn 中使用我自己的数据集?Scikit Tutorial总是以加载他的数据集(数字数据集,花卉数据集...)为例. http://scikit-learn.org/stable/datasets/index.html即:从 sklearn.datasets 导入 load_iris 我有我的图像,但我不知道如何创建新图像. 特别是,对于开始,我使用我 ..

Python - Pandas,重新采样数据集以具有平衡的类

使用以下数据框,只有 2 个可能的标签: 名称 f1 f2 标签0 一个 8 9 11 一个 5 3 12 乙 8 9 03 C 9 2 04 C 8 1 05 C 9 1 06 天 2 1 07 天 9 7 08 天 3 1 09 E 5 1 110 E 3 6 111 E 7 1 1 我编写了一个代码来按“名称"列对数据进行分组,并将结果转换为一个 numpy 数组,因此每一行都是特定组 ..
发布时间:2022-01-21 13:08:22 AI人工智能

多类分类中负例的经验法则

对于在多类分类任务中表示“其他所有内容"的标签的样本数量应该有多大,是否有经验法则? 示例:我想将我的输入分类为 X 类之一.X + 1 类在输入为“以上都不是"时激活.假设我的数据集包含来自 10 个“正"类中的每一个的 5,000 个样本.对于代表“未知"类的示例,我将使用多个可能在生产中找到的实际示例,但这些示例不是来自其他类. 这些负例的数量相对于其他分布应该有多大? 解 ..
发布时间:2022-01-21 13:01:49 AI人工智能

glmnet 的标准化参数如何处理虚拟变量?

在我的数据集中,我有许多连续变量和虚拟变量.对于 glmnet 的分析,我希望对连续变量进行标准化,而不是对虚拟变量进行标准化. 我目前手动执行此操作,首先定义一个只有 [0,1] 值的列的虚拟向量,然后在所有非虚拟列上使用 scale 命令.问题是,这不是很优雅. 但是 glmnet 有一个内置的 standardize 参数.默认情况下,这也会标准化假人吗?如果是这样,有没有一种优 ..
发布时间:2022-01-21 12:50:05 AI人工智能

如何更改 Pytorch 数据集的大小?

假设我正在从 torchvision.datasets.MNIST 加载 MNIST,但我只想加载总共 10000 张图像,我将如何对数据进行切片以将其限制为仅一些数据点?我知道 DataLoader 是一个生成器,可以生成指定批量大小的数据,但是如何对数据集进行切片呢? tr = datasets.MNIST('../data', train=True, download=True, tran ..
发布时间:2022-01-21 12:41:02 AI人工智能

如何使用 matplotlib (python) colah 的变形网格进行绘图?

我需要在 Python 中创建一个可视化,就像 colah 在他的网站上所做的那样.但是,我在 matplotlib 上找不到任何失真,以完全像他那样执行 这里.如果可以,请帮助我. 这是我需要执行的情节: 解决方案 我猜图像是通过在网格中添加一些高斯函数产生的. 将 numpy 导入为 np将 matplotlib.pyplot 导入为 plt从 matplotlib.colle ..
发布时间:2022-01-18 10:26:58 AI人工智能

是否有任何自我改进的编译器?

我不知道有任何自我改进的编译器,但我又不是一个编译器专家. 是否有任何自我改进的编译器? 请注意,我说的是自我改进的编译器,而不是改进它所编译的代码的编译器. 任何指针表示赞赏! 旁注:如果您想知道我为什么要问,请查看 这篇文章.即使我同意大多数论点,我也不太确定以下几点: 我们有可以改进的计划他们的代码现在没有人工输入——它们被称为编译器. ...所以我的问题 ..

Discord 接收音频

我想从 Discord 接收音频以进行语音识别.我还没有在 python Discord APi 中找到任何东西.语音识别没问题,但我不知道如何从 Discord 接收音频.也许有人可以帮助我. 解决方案 这个功能并不存在.有一个 VoiceClient.poll_voice_ws 协程,但是 只是直接从插座.您必须想出某种方法将其解码为音频并自行进一步处理. ..

使用交叉验证 (CV) 计算 scikit-learn 多类 ROC 曲线

我想用 ROC 曲线评估我的分类模型.我正在努力为交叉验证的数据集计算多类 ROC 曲线.由于交叉验证,训练集和测试集没有划分.在下面,您可以看到我已经尝试过的代码. scaler = StandardScaler(with_mean=False)编码 = 标签编码器()y = enc.fit_transform(标签)vec = DictVectorizer()feat_sel = Sele ..
发布时间:2022-01-13 18:32:01 AI人工智能

人工智能的 Lisp 和 Prolog?

自从我 3 年前在 A.I. 上过一堂课以来.我显然足够熟练地问这个问题......开玩笑吧开玩笑;) 但说真的,是什么让这些语言如此受人工智能欢迎.研究.尽管 A.I.研究是“陈旧的"......它可能是过去 5-10 年来最长的方式......是不是因为这些语言在某种程度上是围绕人工智能的概念“设计"的?,或者只是我们现在没有什么更好的东西可以使用? 我问这个是因为我一直觉得它很有 ..
发布时间:2022-01-12 10:57:28 AI人工智能

Prolog 上很好的初学者资料

我正在寻找关于 Prolog 的良好初学者材料,包括在线和印刷版.我不仅对“学习语言"感兴趣,还对背景和科学信息感兴趣. 解决方案 查看 立即学习 Prolog! 这本书写得很好,对于初学者来说应该很容易阅读.它以印刷形式提供,也可以作为免费的在线版本提供.它也相对较新(从 2003 年开始),许多 Prolog 书籍都不是这种情况. ..
发布时间:2022-01-12 09:58:01 AI人工智能