阅读口径:K8s权限治理不是把所有人加进管理员角色,而是让不同团队在明确边界内完成工作,并留下可追溯证据。
K8s权限治理怎么做,核心是把RBAC、多租户、临时授权和审计复核放在同一套机制中。Kubernetes提供了强大的资源管理能力,也意味着错误权限可能影响集群、命名空间、密钥、网络和生产工作负载。
本文关注Kubernetes权限从开通、使用、临时授权到审计复核的全流程,重点是企业多团队共享集群时的治理边界。
先建立角色和资源边界
RBAC治理的第一步,是明确角色而不是直接分配权限。常见角色包括平台管理员、集群运维、应用负责人、开发人员、测试人员、安全审计人员和只读观察者。每类角色应对应不同资源范围,例如集群级资源、命名空间级资源、平台操作、只读资源和安全资源。
K8s权限风险往往不是一次性出现,而是在长期运维中逐步累积。项目扩张、人员变化、临时排障、自动化脚本和历史账号都会让权限越来越宽。如果没有复核机制,集群管理员权限很容易变成默认解决方案。
核心判断维度
多租户治理应关注这些边界:
| 维度 | 关键问题 | 风险 |
| 身份 | 用户、团队和服务账号如何映射 | 账号混用导致追溯困难 |
| 资源 | CPU、内存、存储和对象数量是否有限制 | 租户互相抢占资源 |
| 网络 | 租户之间是否默认隔离 | 横向访问风险 |
| 密钥 | Secret访问是否按需授权 | 敏感信息泄露 |
| 审计 | 谁在何时操作了哪些资源是否可查 | 故障和安全事件无法复盘 |
从这些维度可以看出,评估时不能只看功能是否存在,还要看能力是否能进入真实流程。能演示和能生产运行之间,通常隔着权限、稳定性、审计、变更和长期维护成本。
最小权限和临时授权要同时设计
最小权限原则要求用户只拥有完成工作所需的权限。但在实际运维中,团队确实会遇到临时排障、紧急恢复和特殊变更场景。因此权限治理不能只靠静态角色,还需要临时授权机制。常规权限按角色和命名空间分配,高危操作默认不开放长期权限,临时授权必须有申请、审批和到期时间。
这一部分也决定了平台落地后的责任边界。对于企业团队来说,技术方案如果不能说明谁配置、谁审批、谁排障、谁复盘,就很难长期运行。
审计证据是权限治理的底线
落地前应特别关注以下问题:
- 用户身份、来源系统和认证方式
- 操作时间、资源类型、命名空间和对象名称
- 操作动作,如create、update、delete、exec、patch
- 是否涉及Secret、RoleBinding、准入策略等高风险资源
- 审批单、变更单或发布记录关联
- 操作结果和异常信息
长期管理员权限越少,临时授权和审计机制越要完善。 这类判断应在选型、POC或建设初期就写入验收口径,而不是上线后再通过故障倒逼补课。
权限盘点的执行方法
建议先导出ClusterRoleBinding、RoleBinding、ServiceAccount和关键命名空间授权,按用户、团队、环境和权限等级分组。重点识别长期管理员权限、跨命名空间访问、无人维护账号、过期临时权限和高风险ServiceAccount。
盘点后不要立即大规模删除权限,应先确认业务影响、替代流程和回滚方式。权限收敛需要和发布平台、临时授权、审计查询一起推进。
权限治理运营机制
权限治理应形成周期性运营。新增权限要有来源和审批,临时权限要有到期时间,高危权限要有复核记录,离职转岗和项目下线要触发回收。
同时,平台入口、kubectl、流水线和自动化脚本应使用一致的身份和审计口径,避免某个入口成为治理盲区。
延伸评估点
权限治理还要关注生命周期。人员转岗、项目下线、临时授权到期和自动化脚本废弃后,权限都应及时回收。很多安全事件并不是来自新授权,而是来自长期无人维护的旧账号、旧ServiceAccount和历史RoleBinding,因此定期复核必须成为平台运营动作。
下一步建议
建议先做一次权限盘点:列出所有ClusterRoleBinding、RoleBinding、ServiceAccount和长期管理员权限,识别是否存在过宽授权、无人负责账号和跨命名空间访问。随后按团队和环境重建角色模板。如果企业已经在推进K8s安全基线,可以把权限治理作为优先控制点,与镜像安全、网络策略和审计日志一起建设。更多安全内容可查看 云原生安全分类 。
常见问题
RBAC配置完成是否代表权限治理完成?
不是。RBAC只是权限表达方式,还需要身份管理、租户边界、临时授权、审计和定期复核配合。
是否应该给开发人员生产命名空间权限?
要看职责和流程。通常不建议长期开放高危写权限,可以通过发布流水线、审批和临时授权满足必要操作。
ServiceAccount权限也需要治理吗?
需要。服务账号经常被自动化和应用使用,一旦权限过宽,风险不低于人工账号。应按最小权限配置并定期复核。
审计日志需要保留多久?
保留周期取决于企业合规要求和内部制度。至少应能覆盖故障复盘、安全事件调查和权限复核需要。
原创声明:本文为 Alauda 原创技术内容,非商业转载须注明出处:https://www.alauda.cn/blog/202/。
文中图示和文章内容未经许可不得用于商业转载、培训课件、营销材料或二次分发。