负载均衡设备维护标准文档
1、前言
为规范F5负载均衡设备维护工作,提供设备维护标准,提高维护技术水平,特编写了本文档,在文档中详细说明负载均衡设备日常网管监控办法,日志信息保存,日常统计报表输出,以及日常问题处理办法、标准故障诊断流程、故障现场环境信息保存和各种应急备份方案等内容。
2、日常物理检查
根据设备检查需要,可以进行设备物理检查,观察设备面板指示灯,分析设备运行状态。
2、1. F5 BigIP设备面板结构
10/100 interface:多个10/100 M自适应的网络接口
Gigabit fiber interface:多个1000M多模光纤接口
Serial console port:一个串口命令行管理端口
Failover port:一个串口冗余状态判断端口
Mgmt interface:一个10/100M管理端口
2、2. 状态灯判断
BigIP在正常工作时可以通过端口状态显示灯判断工作状态:
10/100 M端口连接状态灯:绿色为100M连接正常,橙色为10M连接正常
10/100 M端口数据通讯状态灯:停止为无流量,闪烁为正在进行数据通讯
1000 M端口连接状态灯:绿色为1000M连接正常
1000 M端口数据通讯状态灯:停止为无流量,闪烁为正在进行数据通讯
System系统状态灯:正常情况下为绿色,表示系统工作正常
Status状态灯:正常情况下的Active设备为绿色,Backup设备为橙色
Activity活动状态灯:在有数据流量通过时闪烁,无数据流量时定时闪烁
Alarm报警灯:健康检查报警,系统发现有服务节点处于“不健康”状态时提示报警
3、日常运行监控
3、1. 检测各台BIG-IP设备的主备工作状态
在命令行输入 b failover show,确认SLB51MO3-1工作在active状态,SLB51MO3-2工作在standby状态,这是系统默认状态,如果有变化且非人为设定,则代表系统切换过,需细查原因。
3、2. 检测F5设备负载状况
通常情况下,我们可以通过在命令行输入如下命令,分别获取相关的F5设备信息:
3、2.1. 检测BIG-IP的CPU和内存使用状况
使用命令行:top
如果需要将top执行的结果保存在文件里,可执行以下命令:
top –d 5 | tee /var/tmp/topresults.txt
其中的5表示连续输出5次结果。
3、2.2. 检测客户连接数量
检测当前BIG-IP上的连接数量,以及每个对外服务的虚拟服务器的用户连接数量,使用命令行:bigtop
平时应观察正常工作时,BIG-IP上的用户请求数量,并针对各个时间段作记录,以便于当遭受攻击时可以判定。
3、3. 查看服务器节点状态
通过进入F5管理界面,登录下面界面,我们可以清楚地看到所有服务器节点所处的状态:上半部分显示针对节点服务器的地址健康测试结果(ping),下半部分显示各服务器池(pool)中各节点的L4或者L7的健康检查结果。
上图中Node Address栏表示服务器是否能Ping通,如果服务器能Ping通,则箭头为向上的绿色;如果不能ping通,则箭头为向下的红色。
Virtual Servers and Nodes栏表示使用Monitor Service检测对服务器的检查结果,在本例中如果BIGIP对服务器的两个端口8210和8001进行TCP端口检查都通的时候,则箭头为向上的绿色,如果某台服务器只要有一个端口TCP检查不通则箭头为向下的红色。
补充说明:如果在上图健康状态监视中,只要有一项不能通过,在F5 BIG-IP的前面板的第四个指示灯Alarm会变黄。
3、4. 查看当前建立的所有连接
通过在Bigpipe菜单中输入命令“conn”,就可以显示当前所有的客户端与各服务器建立的所有连接。
3、5. 备份日志
每周应至少备份一次F5的BIG-IP上的日志,F5的所有日志保存在FLASH卡上的/var/log目录下,且每天保存为一个文件,最多保存7天(即7个文件),所以如果要备份所有的日志,必须每周至少备份一次/var/log目录,管理员可以通过FTP将日志备份到日志服务器上。
3、6. 查看LOG列表
在左侧点击Log Files菜单可查看BIGIP当天的LOG记录,下图是关于BIG-IP设备本身的LOG记录,下图是关于各服务器健康检查的LOG记录。
4、变更操作
4、1. F5 BIG-IP设备的变更操作
在进行参数变更、修改系统配置时,建议在ACTIVE设备上进行操作。
确认冗余系统的设备是否处于ACTIVE状态,方法为:看下图第二行中显示的本机的状态;或看BIG-IP的前面板的第二个指示灯Status,绿色代表ACTIVE,灰色代表Standby。
在ACTIVE设备上做完配置之后,如果确认无误,点击如下“SynchronizeConfiguration”按钮,即可把本机上的新配置文件同步到对端,如果对端设备故障,更换新设备之后,也可以通过这种方法自动地在对端新设备上生成全套配置。
如果想对BIG-IP ACTIVE设备做停机维护,可以首先点击如下“Force to Standby”按钮,手动把本机设置为Standby状态,然后再退出。
4、2. 服务器的变更维护管理
在进行服务器变更时,建议先将相关服务器从BIG-IP中删除,待变更完成后再添加回来,具体步骤如下:
1、删除相关服务器节点:进入F5管理界面,选择相应的Pool,然后删除对应的服务器节点。
2、进行服务器变更操作:完成所需的硬件或软件维护。
3、重新添加服务器节点:再次进入F5管理界面,选择相应的Pool,然后添加刚才删除的服务器节点。
4、验证服务器状态:确保新的服务器节点能够正常响应健康检查。
5、系统管理
5、1. 用户管理
为了确保系统安全,应对用户进行严格的权限管理,创建不同角色的用户,并根据需要分配不同的权限。
Administrator:拥有所有权限,包括配置更改、系统监控等。
Operator:只能查看系统状态,不能进行配置更改。
Auditor:只能查看日志和报告,不能进行任何操作。
5、2. SNMP管理
启用SNMP协议以便通过网络管理系统(NMS)进行监控和管理,配置SNMP社区字符串和访问控制列表(ACL),确保只有授权的设备和用户可以访问SNMP数据。
6、标准故障诊断流程
当出现故障时,按照以下步骤进行诊断和处理:
1、初步检查:检查电源、网络连接是否正常;查看设备面板指示灯状态。
2、日志分析:查看系统日志和应用程序日志,寻找错误信息或异常事件。
3、网络测试:使用ping命令测试网络连通性;使用traceroute命令跟踪路由路径。
4、硬件检查:检查是否有损坏的组件或松动的连接。
5、软件重启:尝试重启相关服务或整个系统。
6、技术支持:如果以上步骤无法解决问题,联系厂商技术支持寻求帮助。
7、系统配置备份及恢复
7、1. 系统配置的备份
定期备份系统配置文件是非常重要的,以防万一发生故障时能够快速恢复,备份方式有两种:命令行方式和图形界面方式。
7、1.1. 命令行方式(推荐)
使用以下命令备份配置文件:
tmsh save sys config file system:/config/backup/config.conf
此命令会将当前配置保存到指定位置。
7、1.2. 图形界面方式
通过F5管理界面进行备份:
1、登录F5管理界面。
2、选择“System” > “Configuration” > “Backup”。
3、选择备份文件的存储位置和文件名。
4、点击“Backup”按钮开始备份过程。
7、2. 系统配置的恢复
当需要恢复系统配置时,可以使用以下两种方法之一:
7、2.1. 命令行方式(推荐)
使用以下命令恢复配置文件:
tmsh load sys config file system:/config/backup/config.conf
此命令会从指定位置加载配置文件并应用到系统中。
7、2.2. 图形界面方式
通过F5管理界面进行恢复:
1、登录F5管理界面。
2、选择“System” > “Configuration” > “Restore”。
3、选择要恢复的备份文件。
4、点击“Restore”按钮开始恢复过程。
8、运维工作基本连接方式介绍
8、1. SSH连接
SSH是一种加密的网络协议,用于远程登录和管理设备,使用SSH连接可以确保数据传输的安全性,默认情况下,F5设备支持SSH连接。
ssh admin@<device_ip>
输入用户名和密码后即可登录。
8、2. Telnet连接
Telnet是一种未加密的网络协议,虽然不如SSH安全,但在某些情况下仍然可以使用,默认情况下,F5设备也支持Telnet连接。
telnet <device_ip>
输入用户名和密码后即可登录。
9、常用命令汇总
以下是一些常用的F5 BIG-IP设备命令:
tmsh show sys version
:显示系统版本信息。
tmsh show sys config
:显示当前系统配置。
tmsh save sys config
:保存当前系统配置。
tmsh load sys config
:加载指定的系统配置。
tmsh failover show
:显示主备状态。
tmsh sync config
:同步配置到对端设备。
tmsh force to standby
:手动设置为Standby状态。
tmsh bigtop
:显示当前连接数和虚拟服务器状态。
tmsh log list
:查看日志列表。
tmsh log view <log_file>
:查看指定日志文件的内容。
这些命令可以帮助管理员更好地管理和监控F5 BIG-IP设备。
小伙伴们,上文介绍了“负载均衡设备维护标准文档”的内容,你了解清楚吗?希望对你有所帮助,任何问题可以给我留言,让我们下期再见吧。
原创文章,作者:未希,如若转载,请注明出处:https://www.kdun.com/ask/1261419.html
本网站发布或转载的文章及图片均来自网络,其原创性以及文中表达的观点和判断不代表本网站。如有问题,请联系客服处理。
发表回复