运维到底是干什么的
警告
本文最后更新于 2023-10-22,文中内容可能已过时。
运维到底是干什么的
作为一名运维工程师,主要负责以下几类工作:
-
对业务系统的维护,比如业务系统的的版本测试与上线发布,复杂一点的话,可能会采用持续集成,自动测试自动发布,还有可能会采用金丝雀发布等发布方式,还有集群搭建、容器编排等等,都是运维的工作
常见的技术就包括:Linux、Bash、Jenkins、Docker、K8S 等
-
对业务数据的备份和恢复,主要是对数据库数据的备份和恢复,一般都是主从备份,备份可能是一天一备份,也能是几个小时一备份,恢复可能是恢复到过去的任意一个时间点
常见的技术就包括:Zookeeper 等
-
对服务器的维护,比如磁盘空间,不够了可能要扩容,内存或者 CPU 占用高,就得排查是不是业务系统出现问题。还有服务器的网络安全问题,不能被人破解密码直接登陆了
-
构建监控报警体系,俗话说的好,无监控,不运维,搭建对服务器本身和业务系统的指标监控,及时报警。
常见的技术就包括:NetData、Prometheus、Grafana 等
到了云环境,运维的工作又有点不一样了。学无止尽啊,兄弟们。
为了保障系统的正常运行,作为一名全栈开发人员,我们需要以运维的视角,未雨绸缪地做好系统保障工作。而不要等到问题出现了直接跑路。