kaggle相关内容

如何从 Kaggle 将一个太大的 Kaggle 数据集的选定文件加载到 Colab 中

如果我想从 Kaggle 笔记本切换到 Colab 笔记本,我可以从 Kaggle 下载笔记本并在 Google Colab 中打开该笔记本.这样做的问题是,您通常还需要下载和上传 Kaggle 数据集,这相当费力. 如果您有一个小数据集,或者您只需要一个较小的数据集文件,您可以将数据集放入 Kaggle notebook 所期望的相同文件夹结构中.因此,您需要在 Google Colab ..
发布时间:2022-01-21 12:57:10 其他开发

在 Google Colab 中使用 Kaggle 数据集

是否可以通过 Google Colab 中的 kaggle API 使用任何可用的数据集?我看到 这个 Colab 笔记本 中使用了 Kaggle API,但我有点不清楚它提供访问哪些数据集. 解决方案 一步一步 -- 在 Kaggle 中创建 API 密钥. 为此,请访问 kaggle.com/并打开您的用户设置页面. 接下来,向下滚动到 API 访问部分并点击生成下载 ..
发布时间:2022-01-21 12:36:58 其他开发

Pandas 错误 - 遇到无效值

我是熊猫新手.我下载并安装了 Anaconda.然后我尝试通过 Spyder 应用程序运行以下代码: 将 pandas 导入为 pd将 numpy 导入为 nptrain = pd.read_csv('/Users/Ben/Documents/Kaggle/Titanic/train.csv')火车 虽然这会按我的预期打印数据帧,但它也会显示这些错误 //anaconda/lib/pytho ..
发布时间:2022-01-10 21:28:19 Python

将 PIL 图像转换为张量时,为什么像素会发生变化?

transform = transforms.Compose([transforms.ToPILImage(), transforms.ToTensor()]) 应用转换之前 应用转换后 Q.1 为什么要改变像素值? Q.2 如何更正? 解决方案 我能够通过在转换之前对输入数据进行规范化来解决这个问题. 问题是 ToPILImage() 丢弃了所有大于 1 的值,因此亮像 ..

使用 Python 下载 Kaggle 数据集

我尝试使用 python 下载 kaggle dataset.但是我在使用 request 方法时遇到了问题,下载的输出 .csv 文件是损坏的 html 文件. 导入请求# Kaggle 数据集的直接链接data_url = 'https://www.kaggle.com/crawford/gene-expression/downloads/actual.csv'# 保存数据集的本地路径.lo ..
发布时间:2022-01-05 15:56:36 Python

python中的KFold究竟是做什么的?

我正在看这个教程:https://www.dataquest.io/mission/74/getting-started-with-kaggle 我到了第 9 部分,进行预测.在一个名为 Titanic 的数据框中有一些数据,然后使用以下方法将其划分为折叠: # 为泰坦尼克号数据集生成交叉验证折叠.它返回对应于训练和测试的行索引.# 我们设置 random_state 以确保每次运行时都能 ..
发布时间:2021-12-25 14:40:18 Python

如何从 Kaggle 中将过大的 Kaggle 数据集的一个选定文件加载到 Colab 中

如果我想从 Kaggle notebook 切换到 Colab notebook,我可以从 Kaggle 下载 notebook,然后在 Google Colab 中打开 notebook.这样做的问题是您通常还需要下载和上传 Kaggle 数据集,这非常费力. 如果你有一个小数据集或者你只需​​要一个较小的数据集文件,你可以将数据集放入 Kaggle notebook 期望的相同文件夹结构 ..
发布时间:2021-11-15 01:29:00 其他开发

在 R 中下载 Kaggle zip 文件

我试图直接从我的 R 代码中的 Kaggle 空间下载 zip 文件.不幸的是,它并不正确.这是发生的事情: 对于位于 https://www.kaggle.com/的旧金山犯罪数据集c/sf-犯罪/数据 取第一个数据集:test.csv.zip:https://www.kaggle.com/c/sf-crime/download/test.csv.zip 我使用的是 R 代码: ..
发布时间:2021-10-05 19:09:17 其他开发

R 中的 XGBoost 预测器为所有行预测相同的值

我在 Python 中查看了关于同一件事的帖子,但我想要在 R 中的解决方案.我正在处理来自 Kaggle 的 Titanic 数据集,它看起来像这样: 'data.frame': 891 obs.共 13 个变量:$PassengerId: int 1 2 3 4 5 6 7 8 9 10 ...$ 幸存:num 0 1 1 1 0 0 0 0 1 1 ...$ Pclass : 因子 w/ ..
发布时间:2021-10-01 18:37:04 Python

验证和测试精度差异很大

我目前正在 kaggle 中处理数据集.在训练了训练数据的模型后,我在验证数据上对其进行了测试,得到了大约 0.49 的准确率. 但是,相同的模型在测试数据上的准确率为 0.05. 我使用神经网络作为我的模型 那么,发生这种情况的可能原因是什么?如何开始检查和纠正这些问题? 解决方案 泛化差距大的原因: 不同的分布:验证集和测试集可能来自不同的分布.尝试验证它们确实 ..

我的行在 Kaggle 的 SVM 脚本代码中不匹配

我正在检查用于 Kaggle Titanic 数据的 SVM 的 e1071 代码.最后我知道,这部分工作正常,但现在我遇到了一个相当奇怪的错误.当我尝试构建我的 data.frame 以便我可以提交给 kaggle 时,我的预测似乎是我的训练集而不是测试集的大小. 问题 数据框架中的错误(PassengerId = test$passengerid, Survived = Predi ..
发布时间:2021-09-01 19:27:27 其他开发

第一次在 R 中使用神经网络:获取“需要数字/复杂矩阵/向量参数";

我正在尝试学习在 R 中使用神经网络.作为一个学习问题,我一直在使用 以下问题在 Kaggle: 别担心,这个问题是专门为人们设计的,没有任何奖励. 我从一个简单的逻辑回归开始,这非常适合我的脚.现在我想学习使用神经网络.我的训练数据看起来像这样(列:行): - 幸存下来:1- pclass:3- 性别男- 年龄:22.0- 同胞:1- 干草:0- 门票:PC 17601- 票价:7 ..
发布时间:2021-07-07 18:47:18 其他开发

train.default(x, y, weights = w, ...) 错误:无法确定最终调整参数

我对机器学习非常陌生,正在尝试 森林覆盖预测竞赛Kaggle,但我很早就挂了.运行以下代码时出现以下错误. train.default(x, y, weights = w, ...) 中的错误:无法确定最终调整参数另外:有 50 个或更多警告(使用 warnings() 查看前 50 个) # 加载库图书馆(ggplot2);图书馆(插入符号);库(应用预测建模)图书馆(pROC)图书馆(阿米 ..
发布时间:2021-07-02 20:05:57 其他开发