如何制定有效的负载均衡设备维护标准?

负载均衡设备维护标准文档

如何制定有效的负载均衡设备维护标准?

1、前言

为规范F5负载均衡设备维护工作,提供设备维护标准,提高维护技术水平,特编写了本文档,在文档中详细说明负载均衡设备日常网管监控办法,日志信息保存,日常统计报表输出,以及日常问题处理办法、标准故障诊断流程、故障现场环境信息保存和各种应急备份方案等内容。

2、日常物理检查

根据设备检查需要,可以进行设备物理检查,观察设备面板指示灯,分析设备运行状态。

2、1. F5 BigIP设备面板结构

10/100 interface:多个10/100 M自适应的网络接口

Gigabit fiber interface:多个1000M多模光纤接口

Serial console port:一个串口命令行管理端口

Failover port:一个串口冗余状态判断端口

Mgmt interface:一个10/100M管理端口

2、2. 状态灯判断

BigIP在正常工作时可以通过端口状态显示灯判断工作状态:

10/100 M端口连接状态灯:绿色为100M连接正常,橙色为10M连接正常

10/100 M端口数据通讯状态灯:停止为无流量,闪烁为正在进行数据通讯

1000 M端口连接状态灯:绿色为1000M连接正常

1000 M端口数据通讯状态灯:停止为无流量,闪烁为正在进行数据通讯

System系统状态灯:正常情况下为绿色,表示系统工作正常

Status状态灯:正常情况下的Active设备为绿色,Backup设备为橙色

Activity活动状态灯:在有数据流量通过时闪烁,无数据流量时定时闪烁

Alarm报警灯:健康检查报警,系统发现有服务节点处于“不健康”状态时提示报警

3、日常运行监控

3、1. 检测各台BIG-IP设备的主备工作状态

在命令行输入 b failover show,确认SLB51MO3-1工作在active状态,SLB51MO3-2工作在standby状态,这是系统默认状态,如果有变化且非人为设定,则代表系统切换过,需细查原因。

3、2. 检测F5设备负载状况

通常情况下,我们可以通过在命令行输入如下命令,分别获取相关的F5设备信息:

3、2.1. 检测BIG-IP的CPU和内存使用状况

使用命令行:top

如果需要将top执行的结果保存在文件里,可执行以下命令:

top –d 5 | tee /var/tmp/topresults.txt

其中的5表示连续输出5次结果。

3、2.2. 检测客户连接数量

检测当前BIG-IP上的连接数量,以及每个对外服务的虚拟服务器的用户连接数量,使用命令行:bigtop

平时应观察正常工作时,BIG-IP上的用户请求数量,并针对各个时间段作记录,以便于当遭受攻击时可以判定。

3、3. 查看服务器节点状态

通过进入F5管理界面,登录下面界面,我们可以清楚地看到所有服务器节点所处的状态:上半部分显示针对节点服务器的地址健康测试结果(ping),下半部分显示各服务器池(pool)中各节点的L4或者L7的健康检查结果。

上图中Node Address栏表示服务器是否能Ping通,如果服务器能Ping通,则箭头为向上的绿色;如果不能ping通,则箭头为向下的红色。

Virtual Servers and Nodes栏表示使用Monitor Service检测对服务器的检查结果,在本例中如果BIGIP对服务器的两个端口8210和8001进行TCP端口检查都通的时候,则箭头为向上的绿色,如果某台服务器只要有一个端口TCP检查不通则箭头为向下的红色。

补充说明:如果在上图健康状态监视中,只要有一项不能通过,在F5 BIG-IP的前面板的第四个指示灯Alarm会变黄。

3、4. 查看当前建立的所有连接

通过在Bigpipe菜单中输入命令“conn”,就可以显示当前所有的客户端与各服务器建立的所有连接。

如何制定有效的负载均衡设备维护标准?

3、5. 备份日志

每周应至少备份一次F5的BIG-IP上的日志,F5的所有日志保存在FLASH卡上的/var/log目录下,且每天保存为一个文件,最多保存7天(即7个文件),所以如果要备份所有的日志,必须每周至少备份一次/var/log目录,管理员可以通过FTP将日志备份到日志服务器上。

3、6. 查看LOG列表

在左侧点击Log Files菜单可查看BIGIP当天的LOG记录,下图是关于BIG-IP设备本身的LOG记录,下图是关于各服务器健康检查的LOG记录。

4、变更操作

4、1. F5 BIG-IP设备的变更操作

在进行参数变更、修改系统配置时,建议在ACTIVE设备上进行操作。

确认冗余系统的设备是否处于ACTIVE状态,方法为:看下图第二行中显示的本机的状态;或看BIG-IP的前面板的第二个指示灯Status,绿色代表ACTIVE,灰色代表Standby。

在ACTIVE设备上做完配置之后,如果确认无误,点击如下“SynchronizeConfiguration”按钮,即可把本机上的新配置文件同步到对端,如果对端设备故障,更换新设备之后,也可以通过这种方法自动地在对端新设备上生成全套配置。

如果想对BIG-IP ACTIVE设备做停机维护,可以首先点击如下“Force to Standby”按钮,手动把本机设置为Standby状态,然后再退出。

4、2. 服务器的变更维护管理

在进行服务器变更时,建议先将相关服务器从BIG-IP中删除,待变更完成后再添加回来,具体步骤如下:

1、删除相关服务器节点:进入F5管理界面,选择相应的Pool,然后删除对应的服务器节点。

2、进行服务器变更操作:完成所需的硬件或软件维护。

3、重新添加服务器节点:再次进入F5管理界面,选择相应的Pool,然后添加刚才删除的服务器节点。

4、验证服务器状态:确保新的服务器节点能够正常响应健康检查。

5、系统管理

5、1. 用户管理

为了确保系统安全,应对用户进行严格的权限管理,创建不同角色的用户,并根据需要分配不同的权限。

Administrator:拥有所有权限,包括配置更改、系统监控等。

Operator:只能查看系统状态,不能进行配置更改。

Auditor:只能查看日志和报告,不能进行任何操作。

5、2. SNMP管理

启用SNMP协议以便通过网络管理系统(NMS)进行监控和管理,配置SNMP社区字符串和访问控制列表(ACL),确保只有授权的设备和用户可以访问SNMP数据。

6、标准故障诊断流程

当出现故障时,按照以下步骤进行诊断和处理:

1、初步检查:检查电源、网络连接是否正常;查看设备面板指示灯状态。

2、日志分析:查看系统日志和应用程序日志,寻找错误信息或异常事件。

3、网络测试:使用ping命令测试网络连通性;使用traceroute命令跟踪路由路径。

4、硬件检查:检查是否有损坏的组件或松动的连接。

5、软件重启:尝试重启相关服务或整个系统。

6、技术支持:如果以上步骤无法解决问题,联系厂商技术支持寻求帮助。

7、系统配置备份及恢复

7、1. 系统配置的备份

定期备份系统配置文件是非常重要的,以防万一发生故障时能够快速恢复,备份方式有两种:命令行方式和图形界面方式。

7、1.1. 命令行方式(推荐)

使用以下命令备份配置文件:

tmsh save sys config file system:/config/backup/config.conf

此命令会将当前配置保存到指定位置。

7、1.2. 图形界面方式

如何制定有效的负载均衡设备维护标准?

通过F5管理界面进行备份:

1、登录F5管理界面。

2、选择“System” > “Configuration” > “Backup”。

3、选择备份文件的存储位置和文件名。

4、点击“Backup”按钮开始备份过程。

7、2. 系统配置的恢复

当需要恢复系统配置时,可以使用以下两种方法之一:

7、2.1. 命令行方式(推荐)

使用以下命令恢复配置文件:

tmsh load sys config file system:/config/backup/config.conf

此命令会从指定位置加载配置文件并应用到系统中。

7、2.2. 图形界面方式

通过F5管理界面进行恢复:

1、登录F5管理界面。

2、选择“System” > “Configuration” > “Restore”。

3、选择要恢复的备份文件。

4、点击“Restore”按钮开始恢复过程。

8、运维工作基本连接方式介绍

8、1. SSH连接

SSH是一种加密的网络协议,用于远程登录和管理设备,使用SSH连接可以确保数据传输的安全性,默认情况下,F5设备支持SSH连接。

ssh admin@<device_ip>

输入用户名和密码后即可登录。

8、2. Telnet连接

Telnet是一种未加密的网络协议,虽然不如SSH安全,但在某些情况下仍然可以使用,默认情况下,F5设备也支持Telnet连接。

telnet <device_ip>

输入用户名和密码后即可登录。

9、常用命令汇总

以下是一些常用的F5 BIG-IP设备命令:

tmsh show sys version:显示系统版本信息。

tmsh show sys config:显示当前系统配置。

tmsh save sys config:保存当前系统配置。

tmsh load sys config:加载指定的系统配置。

tmsh failover show:显示主备状态。

tmsh sync config:同步配置到对端设备。

tmsh force to standby:手动设置为Standby状态。

tmsh bigtop:显示当前连接数和虚拟服务器状态。

tmsh log list:查看日志列表。

tmsh log view <log_file>:查看指定日志文件的内容。

这些命令可以帮助管理员更好地管理和监控F5 BIG-IP设备。

小伙伴们,上文介绍了“负载均衡设备维护标准文档”的内容,你了解清楚吗?希望对你有所帮助,任何问题可以给我留言,让我们下期再见吧。

原创文章,作者:未希,如若转载,请注明出处:https://www.kdun.com/ask/1261419.html

本网站发布或转载的文章及图片均来自网络,其原创性以及文中表达的观点和判断不代表本网站。如有问题,请联系客服处理。

(0)
未希新媒体运营
上一篇 2024-11-02 22:51
下一篇 2024-11-02 22:59

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

产品购买 QQ咨询 微信咨询 SEO优化
分享本页
返回顶部
云产品限时秒杀。精选云产品高防服务器,20M大带宽限量抢购 >>点击进入