kaggle - IT屋-程序员软件开发技术分享社区

如何从 Kaggle 将一个太大的 Kaggle 数据集的选定文件加载到 Colab 中

如果我想从 Kaggle 笔记本切换到 Colab 笔记本，我可以从 Kaggle 下载笔记本并在 Google Colab 中打开该笔记本.这样做的问题是，您通常还需要下载和上传 Kaggle 数据集，这相当费力. 如果您有一个小数据集，或者您只需要一个较小的数据集文件，您可以将数据集放入 Kaggle notebook 所期望的相同文件夹结构中.因此，您需要在 Google Colab ..

发布时间：2022-01-21 12:57:10 api download dataset google-colaboratory kaggle 其他开发

在 Google Colab 中使用 Kaggle 数据集

是否可以通过 Google Colab 中的 kaggle API 使用任何可用的数据集?我看到这个 Colab 笔记本中使用了 Kaggle API，但我有点不清楚它提供访问哪些数据集. 解决方案一步一步 -- 在 Kaggle 中创建 API 密钥. 为此，请访问 kaggle.com/并打开您的用户设置页面. 接下来，向下滚动到 API 访问部分并点击生成下载 ..

发布时间：2022-01-21 12:36:58 dataset kaggle google-colaboratory 其他开发

子进程 python filenotfounderror: [winerror 2]

我一直在使用 Jupyter Notebook 学习 kaggle 的主成分分析)，但是当我运行这段代码时 from subprocess import check_outputprint(check_output(["ls", "../input"]).decode("utf8")) 下面出现错误 FileNotFoundError Traceback(最近一次调用最后一次) ..

发布时间：2022-01-18 16:15:43 python python-3.x subprocess jupyter-notebook kaggle Python

Pandas 错误 - 遇到无效值

我是熊猫新手.我下载并安装了 Anaconda.然后我尝试通过 Spyder 应用程序运行以下代码: 将 pandas 导入为 pd将 numpy 导入为 nptrain = pd.read_csv('/Users/Ben/Documents/Kaggle/Titanic/train.csv')火车虽然这会按我的预期打印数据帧，但它也会显示这些错误 //anaconda/lib/pytho ..

发布时间：2022-01-10 21:28:19 python pandas anaconda python-3.4 kaggle Python

将 PIL 图像转换为张量时，为什么像素会发生变化?

transform = transforms.Compose([transforms.ToPILImage(), transforms.ToTensor()]) 应用转换之前应用转换后 Q.1 为什么要改变像素值? Q.2 如何更正? 解决方案我能够通过在转换之前对输入数据进行规范化来解决这个问题. 问题是 ToPILImage() 丢弃了所有大于 1 的值，因此亮像 ..

发布时间：2022-01-06 19:50:16 python machine-learning pytorch python-imaging-library kaggle AI人工智能

我尝试使用 python 下载 kaggle dataset.但是我在使用 request 方法时遇到了问题，下载的输出 .csv 文件是损坏的 html 文件. 导入请求# Kaggle 数据集的直接链接data_url = 'https://www.kaggle.com/crawford/gene-expression/downloads/actual.csv'# 保存数据集的本地路径.lo ..

发布时间：2022-01-05 15:56:36 python download request dataset kaggle Python

在kaggle笔记本中安装谷歌驱动器

在 google colab 中，我可以轻松地安装我的 google 驱动器: 来自 google.colab 导入驱动drive.mount('/content/gdrive') 然而，在kaggle的笔记本中，它给出了这个错误: KeyError Traceback(最近一次调用)在2 # !pip install g ..

发布时间：2021-12-31 23:44:59 python jupyter-notebook google-drive-api google-colaboratory kaggle Python

python中的KFold究竟是做什么的?

我正在看这个教程:https://www.dataquest.io/mission/74/getting-started-with-kaggle 我到了第 9 部分，进行预测.在一个名为 Titanic 的数据框中有一些数据，然后使用以下方法将其划分为折叠: # 为泰坦尼克号数据集生成交叉验证折叠.它返回对应于训练和测试的行索引.# 我们设置 random_state 以确保每次运行时都能 ..

发布时间：2021-12-25 14:40:18 python scikit-learn cross-validation kaggle Python

C5.0 决策树 - c50 代码名为 exit，值为 1

我收到以下错误 c50 代码名为 exit，值为 1 我是根据 Kaggle 提供的泰坦尼克号数据进行的 # 导入数据集train ..

发布时间：2021-12-14 09:35:54 r machine-learning decision-tree kaggle AI人工智能

如何从 Kaggle 中将过大的 Kaggle 数据集的一个选定文件加载到 Colab 中

如果我想从 Kaggle notebook 切换到 Colab notebook，我可以从 Kaggle 下载 notebook，然后在 Google Colab 中打开 notebook.这样做的问题是您通常还需要下载和上传 Kaggle 数据集，这非常费力. 如果你有一个小数据集或者你只需要一个较小的数据集文件，你可以将数据集放入 Kaggle notebook 期望的相同文件夹结构 ..

发布时间：2021-11-15 01:29:00 api download dataset google-colaboratory kaggle 其他开发

在 R 中下载 Kaggle zip 文件

我试图直接从我的 R 代码中的 Kaggle 空间下载 zip 文件.不幸的是，它并不正确.这是发生的事情: 对于位于 https://www.kaggle.com/的旧金山犯罪数据集c/sf-犯罪/数据取第一个数据集:test.csv.zip:https://www.kaggle.com/c/sf-crime/download/test.csv.zip 我使用的是 R 代码: ..

发布时间：2021-10-05 19:09:17 r zip kaggle 其他开发

R 中的 XGBoost 预测器为所有行预测相同的值

我在 Python 中查看了关于同一件事的帖子，但我想要在 R 中的解决方案.我正在处理来自 Kaggle 的 Titanic 数据集，它看起来像这样: 'data.frame': 891 obs.共 13 个变量:$PassengerId: int 1 2 3 4 5 6 7 8 9 10 ...$ 幸存:num 0 1 1 1 0 0 0 0 1 1 ...$ Pclass : 因子 w/ ..

发布时间：2021-10-01 18:37:04 python r xgboost kaggle Python

xgboost 中的 eval_metric 和 feval 有什么区别?

xgb.train 中 feval 和 eval_metric 的区别是什么，两个参数都只用于评估目的. 来自 Kaggle 的帖子提供了一些见解: https://www.kaggle.com/c/prudential-life-insurance-assessment/forums/t/18473/custom-objective-for-xgboost 解决方案 feva ..

发布时间：2021-10-01 18:36:04 r xgboost kaggle 其他开发

kaggle 内核:urllib.request.urlopen 不适用于任何 url

在 kaggle kernels 中处理获取 url 列表的最佳方法是什么? 我首先尝试使用 google.com 进行测试. 第一种方法:使用 urllib.request import urllib.request resp = urllib.request.urlopen('http://www.google.com') 这会导致 gai 和 urlopen 错误 [Er ..

发布时间：2021-09-15 18:40:05 python urllib2 kaggle Python

Kaggle API 问题“找不到 kaggle.json.确保它位于......"

我正在尝试使用 Kaggle API 从 Kaggle 网站提取数据.我正在使用 Ubuntu 18.04.当我输入以下命令时: kaggle 比赛下载 -c home-credit-default-risk 我收到以下错误: 回溯(最近一次调用最后一次):文件“/home/hduser/anaconda3/bin/kaggle"，第5行，在从 kaggle.cli 导入 m ..

发布时间：2021-09-12 19:09:40 linux api ubuntu kaggle 服务器开发

从 Kaggle 下载文件到 Google Colab

我想将 Kaggle 的手语数据集下载到我的 Colab. 到目前为止我一直使用 wget 和具体的 zip 文件链接，例如: !wget --no-check-certificate \https://storage.googleapis.com/laurencemoroney-blog.appspot.com/rps.zip \-O/tmp/rps.zip 但是，当我右键单击 Kag ..

发布时间：2021-09-12 18:57:29 ubuntu download wget google-colaboratory kaggle 其他开发

验证和测试精度差异很大

我目前正在 kaggle 中处理数据集.在训练了训练数据的模型后，我在验证数据上对其进行了测试，得到了大约 0.49 的准确率. 但是，相同的模型在测试数据上的准确率为 0.05. 我使用神经网络作为我的模型那么，发生这种情况的可能原因是什么?如何开始检查和纠正这些问题? 解决方案泛化差距大的原因: 不同的分布:验证集和测试集可能来自不同的分布.尝试验证它们确实 ..

发布时间：2021-09-09 19:02:57 machine-learning deep-learning cross-validation training-data kaggle AI人工智能

我的行在 Kaggle 的 SVM 脚本代码中不匹配

我正在检查用于 Kaggle Titanic 数据的 SVM 的 e1071 代码.最后我知道，这部分工作正常，但现在我遇到了一个相当奇怪的错误.当我尝试构建我的 data.frame 以便我可以提交给 kaggle 时，我的预测似乎是我的训练集而不是测试集的大小. 问题数据框架中的错误(PassengerId = test$passengerid, Survived = Predi ..

发布时间：2021-09-01 19:27:27 r svm kaggle 其他开发

第一次在 R 中使用神经网络:获取“需要数字/复杂矩阵/向量参数"；

我正在尝试学习在 R 中使用神经网络.作为一个学习问题，我一直在使用以下问题在 Kaggle: 别担心，这个问题是专门为人们设计的，没有任何奖励. 我从一个简单的逻辑回归开始，这非常适合我的脚.现在我想学习使用神经网络.我的训练数据看起来像这样(列:行): - 幸存下来:1- pclass:3- 性别男- 年龄:22.0- 同胞:1- 干草:0- 门票:PC 17601- 票价:7 ..

发布时间：2021-07-07 18:47:18 r regression prediction kaggle 其他开发

train.default(x, y, weights = w, ...) 错误:无法确定最终调整参数

我对机器学习非常陌生，正在尝试森林覆盖预测竞赛Kaggle，但我很早就挂了.运行以下代码时出现以下错误. train.default(x, y, weights = w, ...) 中的错误:无法确定最终调整参数另外:有 50 个或更多警告(使用 warnings() 查看前 50 个) # 加载库图书馆(ggplot2)；图书馆(插入符号)；库(应用预测建模)图书馆(pROC)图书馆(阿米 ..

发布时间：2021-07-02 20:05:57 r random-forest r-caret kaggle 其他开发

kaggle相关内容