gcp-ai-platform-training相关内容

无法使用自定义预测例程将经过训练的模型部署到 Google Cloud Ai-Platform:模型需要的内存超出允许范围

我正在尝试部署一个预训练的 pytorch 模型到具有自定义预测例程的 AI Platform.按照此处所述的说明进行操作后,部署失败并显示以下内容错误: ERROR: (gcloud.beta.ai-platform.versions.create) 创建版本失败.检测到错误模型错误:模型需要比允许的更多的内存.请尝试减小模型大小并重新部署.如果您仍然有错误,请联系 Cloud ML. 模型 ..

加载模型时出现意外错误:预测器中的问题 - ModuleNotFoundError:没有名为“torchvision"的模块

我一直在尝试通过我的 vm 实例上的控制台将我的模型部署到 AI 平台以进行预测,但我收到错误“(gcloud.beta.ai-platform.versions.create) Create Version failed. 检测到错误模型错误:“加载模型失败:加载模型时出现意外错误:预测器中的问题 - ModuleNotFoundError:没有名为‘torchvision’的模块(错误代码:0 ..

如何自动启动AI平台作业?

我创建了一个培训工作,从大查询中获取数据,执行培训并部署模型.我想在这两种情况下自动开始训练: 已向数据集中添加了1000多个新行 附有时间表(例如,每周一次) 我检查了GCP Cloud Scheduler,但似乎不适合我的情况. 解决方案 Cloud Scheduler是触发计划的正确工具.我不知道你的阻拦剂是什么! 第一点,你不能.您不能在X个新行之后放置触发器( ..
发布时间:2021-05-12 19:45:28 其他开发

加载模型时发生意外错误:预测变量中的问题-ModuleNotFoundError:没有名为"torchvision"的模块

我一直试图通过我的vm实例上的控制台将模型部署到用于预测的AI平台,但是我遇到了错误“((gcloud.beta.ai-platform.versions.create)创建版本失败.错误的模型,检测到错误:“无法加载模型:加载模型时发生意外错误:预测变量中的问题-ModuleNotFoundError:没有名为'torchvision'的模块(错误代码:0)" 我需要同时包含 torch ..

无法使用自定义的预测例程将经过训练的模型部署到Google Cloud Ai平台:模型所需的内存超出了允许的范围

我正在尝试部署预训练的pytorch 模型带有自定义预测例程的AI平台.按照此处所述的说明进行部署之后,部署失败并显示以下内容错误: ERROR: (gcloud.beta.ai-platform.versions.create) Create Version failed. Bad model detected with error: Model requires more memory ..