amazon-eks相关内容

用于连接 Amazone EKS 的 Jenkins 代理不起作用

我尝试在我的 Jenkins 中配置 Kubernetes 代理,以使用 Jenkins 管道部署微服务.我使用 eksctl commande 创建了 Amazone EKS 集群.创建集群后,创建 kubeconfig 文件,用于在 Jenkins 中配置机密文件凭据. 当我尝试将 kubernetes 代理连接到我的集群时出现错误: 错误测试连接 https://.sk1.eu-we ..
发布时间:2021-10-27 18:47:34 其他开发

在 EKS Fargate pod 上使用 emptyDir{} 类型挂载的公共目录中删除/未创建文件夹

我们正面临 EKS Fargate Pod 的奇怪问题.我们想使用 sidecar fluent-bit 容器将日志推送到 cloudwatch,为此我们在两个容器上安装了单独创建的 /logs/boot 和 /logs/access 文件夹使用 emptyDir: {} 类型.但是不知何故 access 文件夹被删除了.当我们在本地 docker 中测试此设置时,它产生了预期的结果并且一切正常, ..
发布时间:2021-10-27 18:47:31 其他开发

指定动态创建的 EBS 卷名称

在 EKS 上运行的 K8s 集群中动态创建 Persistent Volumes 时,使用 gp2 作为默认存储类,是否可以命名创建的 EBS 卷? 目前,它们的名称类似于 kubernetes-dynamic-pvc-d8896767-a1c9-11e9-bb21-0e3fcd7b2ecc,但卷管理最好让标签更清晰. 解决方案 动态配置由 admission controller ..
发布时间:2021-10-27 18:47:25 其他开发

aws eks 和 aws sso RBAC 身份验证问题

我创建了一个全新的 AWS SSO(使用内部 IDP 作为身份源,因此不使用 Active Directory). 我能够登录 AWS CLI、AWS GUI,但无法执行任何 kubectl 操作. 错误:您必须登录服务器(未授权) 我认为这与 RBAC 有关,因为我可以通过以下方式获取 EKS 令牌aws eks get-token. ➜ cat ~/.aws/config[个人资料 t ..
发布时间:2021-10-27 18:47:16 其他开发

指标服务器在部署期间没有已知的 pod 错误指标

我有一个新创建的 AWS EKS 1.18 集群,应用程序部署在上面,一切正常,测试和负载测试成功,即我的 HPA 和指标服务器工作正常. 但是当我对服务进行部署时,metrics-server 正在提供无法获取 pod xxx 的 pod 指标:对于新部署的 pod,没有已知的 pod 指标,然后问题正在解决,一切又正常了. 我的问题是,这是指标服务器的预期行为吗?还是我应该再次检查 ..
发布时间:2021-10-27 18:47:13 其他开发

AWS EKS - 只能启动 2 个 Pod - 太多 Pod 错误

根据这个文章 和命令 kubectl get nodes -o yaml |grep pods 输出. 但我有两个节点,我只能启动 2 个 Pod.3rd pod 卡住了以下错误消息. 会不会是应用程序使用了太多资源而导致无法启动更多 Pod?如果是这种情况,则可能表明CPU 或内存不足. 事件:键入来自消息的原因年龄---- ------ ---- ---- -------警告 F ..
发布时间:2021-10-27 18:47:10 其他开发

使用单个 HELM 模板的多个资源

默认情况下,我们一直为每个应用程序(公共)使用单个入口,但根据最近的要求,我们还需要为某些应用程序公开(私有)端点.这意味着我们有一个看起来像这样的模板: 模板/ingress.yaml {{- if .Values.ingress.enabled -}}{{- $fullName := 包括“app.fullname".-}}apiVersion: 扩展/v1beta1种类:入口元数据: ..
发布时间:2021-10-27 18:47:07 其他开发

AWS EKS - 节点组更新实例类型

我目前有一个使用 AWS EKS 的 Kubernetes 应用程序.我还创建了节点组;最初我在该 nodeGroup 上配置的低实例容量只能处理 4 个 pod.当我尝试在我的部署上推出更新时,发生了 Pod 不足的错误,这主要是由于我最初提供的容量不足的实例类型.我的问题是否可以更新实时 nodeGroup 实例类型? 我通过创建具有扩展实例类型的额外节点组解决了这个问题.我只是想知道是 ..
发布时间:2021-10-27 18:47:04 其他开发

如何停止 AWS EKS 工作线程实例

我想知道是否可以暂时停止工作虚拟机实例,以便在我不进行集群开发时它们不会在夜间运行.到目前为止,我所知道的“停止"实例运行的唯一方法是删除我不想做的集群本身.任何建议都非常感谢. 附注稍后编辑 按照this 指南. 解决方案 转到节点组的 EC2 实例仪表板,然后从底部的右侧面板中单击 Auto Scaling Groups> 然后通过单击复选框选择您的组,然后单击编辑按钮并更 ..

如何在 CI/CD 中包含 AWS EKS?

我正在研究 AWS (CodePipeline/CodeBuild/CodeDeploy) 上的 CI/CD,并发现它是一个非常好的工具,用于在云上管理管道并管理所有内容(甚至不需要在 EC2 上安装 Jenkins). 我现在正在阅读有关容器构建和部署的信息.对于构建阶段,CodeBuild 支持构建容器镜像.在部署阶段,虽然我可以找到 ECS 集群的 CodeDeploy 解决方案,但 ..

避免每个节点的 AWS EKS IP 限制

一家公司想要使用命名空间扩展他们的微服务应用程序,命名空间代表每个客户端一个单独的应用程序.该应用程序由 22 个微服务组成,公司有 80 个客户端,因此集群中将有 22 * 80 = 1760 个 pod.示意图如下. 最初的计算是,拥有 4 个 r4.xlarge 节点就足以保持适当的性能.但该公司遇到了另一种问题:每个实例的 IP 地址数量.例如,仅对于 r4.xlarge 类型的 4 ..
发布时间:2021-10-27 18:46:56 其他开发

Kubernetes Pod 终止 - 退出代码 137

我需要一些关于 k8s 1.14 和在其上运行 gitlab 管道的问题的建议.许多作业都抛出退出代码 137 错误,我发现这意味着容器突然终止. 集群信息: Kubernetes 版本:1.14正在使用的云:AWS EKS节点:C5.4xLarge 深入挖掘后,我发现了以下日志: **kubelet: I0114 03:37:08.639450** 4721 image_gc ..
发布时间:2021-10-27 18:46:50 服务器开发

使用 rbac & 错误地更新了 configmap aws-auth无法访问集群

试图通过 AWS EKS 集群的 rbac 限制 IAM 用户.错误地从 kube-system 命名空间更新了配置映射“aws-auth".这删除了对 EKS 集群的完全访问权限. 未能在用户的配置映射中添加组:. 尝试提供对 configmap 中最后提到的用户/角色的完全管理员访问权限,但没有运气. 任何恢复对集群的访问的想法都非常值得赞赏. config-map.y ..

EKS ALB 无法自动发现子网

背景: 我有一个 VPC 和 3 个公共子网(子网可以访问互联网网关) 我在这个 VPC 中有一个 EKS 集群,EKS 集群是从控制台创建的,而不是使用 eksctl 我使用了本教程来自aws 官方文档,我设法设置了我的 ALB 控制器并且控制器运行完美: 集群包含两个节点组: 第一个节点组有一个节点类型:t3a.micro 第二个节点组有一个节点类型:t3.sm ..

运行批处理作业时,EKS 节点移动到 NodeNotReady 状态

我正在我的 EKS 集群中运行一个批处理作业来训练 ML 模型,并且训练持续了 8-10 个小时.但是,似乎运行作业的节点被杀死,作业在新节点上重新启动.我正在 Prometheus 中监控节点,似乎没有 CPU 或 OOM 问题. 我的下一个赌注是查看 EKS cloudtrail 日志,当节点被删除时,我会看到以下事件 - kube-controller-manager 日志 ..
发布时间:2021-10-26 18:55:23 其他开发