1. 网络设备巡检的重要性与基本流程网络设备就像人体的神经系统需要定期体检才能保持健康运行。作为网络工程师我经常遇到因为忽视巡检而导致的小问题演变成大故障的情况。记得有一次某企业核心交换机突然宕机排查后发现只是因为风扇积灰导致过热保护——这本该在例行巡检中就发现的问题。设备巡检主要关注三个核心维度硬件状态温度、电源、风扇、软件运行CPU、内存、进程和网络功能接口、协议、路由。完整的巡检流程应该包含以下步骤基础信息采集先获取设备型号、版本等身份证信息硬件健康检查就像体检时的血常规检查电源、温度等基础指标性能瓶颈分析关注CPU、内存等关键资源使用率网络状态验证接口、协议、路由表等网络功能的运转情况配置与日志审查检查最近配置变更和系统告警信息不同厂商设备虽然命令语法不同但巡检逻辑是相通的。下面我就用实际案例带大家掌握四大厂商的巡检技巧。2. 华为设备巡检实战华为设备的命令体系以display为核心配合丰富的子命令可以获取各类信息。这里分享几个我常用的组合拳2.1 硬件健康检查套餐display device # 查看所有单板状态 display power # 电源状态重点关注PowerID为1的主电源 display fan # 风扇转速正常应在5000-15000转/分钟 display temperature all # 温度监测核心芯片通常不超过65℃上周帮客户排查一台S5700频繁重启的问题就是用display temperature发现主控板温度达到78℃清理风道后立即恢复正常。硬件检查一定要形成定期记录的习惯建议制作类似这样的对比表格检查项正常范围当前值历史趋势CPU温度40-65℃52℃平稳内存使用率70%58%每周2%主电源状态Power Supply 1正常-2.2 网络状态深度检查display interface brief # 接口状态速览重点关注CRC错误 display arp # ARP表检查异常ARP可能是病毒征兆 display ip routing-table # 路由表验证缺省路由必须存在 display bgp peer # BGP邻居状态Established才是正常特别提醒华为设备默认会分页显示建议先执行screen-length 0 temporary取消分页。曾经有工程师在巡检时漏看了关键告警信息就是因为没注意屏幕底部的--More--提示。3. 华三设备巡检精要华三H3C的命令体系与华为类似但有些独特参数。我最常用的是display配合count参数实现统计功能3.1 性能监控技巧display cpu-usage history # CPU利用率历史曲线 display memory-usage # 内存详细使用情况关注Free值 display logbuffer level 6 # 只显示严重等级日志华三的display device manuinfo命令特别实用能直接显示设备序列号和保修信息。有次客户需要报修设备就是靠这个命令快速获取了SN码。3.2 网络诊断实例display link-aggregation summary # 聚合链路状态 display ntp-service status # 时间同步状态 display lldp neighbor-list # 邻居设备拓扑发现建议把以下命令保存为脚本定期运行#!/bin/sh echo $(date) display clock display version display device display interface brief | include up display cpu-usage display memory-usage4. 锐捷设备巡检指南锐捷设备采用类思科的show命令体系但有些独特功能。这里分享几个实战技巧4.1 硬件状态检查show environment # 环境监测含温度/电压 show power detail # 电源详情输入输出电压 show fan # 风扇状态注意FAN1-FAN4状态锐捷的show interface transceiver命令特别强大能显示光模块的实时收发功率。曾经通过这个命令发现某光纤链路接收功率为-28dBm正常应大于-20dBm及时更换了劣质跳线。4.2 网络状态检查show ip route summary # 路由汇总统计 show lldp neighbors # 邻居设备发现 show running-config diff # 配置变更对比超实用锐捷设备支持terminal length 0命令取消分页和思科的操作习惯一致。建议巡检时先执行这个命令避免信息截断。5. 思科设备巡检大全思科作为网络设备鼻祖其show命令体系最为完善。这里分享几个高阶用法5.1 硬件健康检查show env all # 环境状态含温度阈值 show inventory # 硬件清单含序列号 show processes cpu # CPU进程排行关注%CPU高的进程思科的show tech-support命令堪称万能会自动收集所有关键信息。但输出内容可能多达数百页建议配合show tech-support | redirect tftp://server/file.txt导出分析。5.2 网络状态深度检查show interface stats # 接口流量统计 show cdp neighbors # 拓扑发现思科专有协议 show ip ospf neighbor # OSPF邻居状态Full才是正常特别实用的技巧show run | section interface可以只显示接口配置show run | include hostname快速定位关键配置。这些管道符用法能极大提升巡检效率。6. 巡检报告生成技巧完整的巡检不能只停留在命令行操作还需要生成规范报告。我的标准流程是使用script命令记录全部操作过程关键指标用| include过滤重点信息将输出重定向到文件show run config_backup_$(date %F).txt使用文本比对工具分析历史变化建议建立这样的巡检记录表检查时间设备型号异常项处理措施2023-08-01S5700-52XGE0/0/1有CRC错误更换网线2023-08-15CE6850-48S6Q-HI内存使用率75%优化ACL配置最后提醒所有巡检操作建议在非业务高峰时段进行部分show命令可能影响设备性能。对于核心设备可以考虑使用SNMP等自动化监控工具辅助巡检。
四大厂商网络设备巡检命令实战指南:华为、华三、锐捷、思科
1. 网络设备巡检的重要性与基本流程网络设备就像人体的神经系统需要定期体检才能保持健康运行。作为网络工程师我经常遇到因为忽视巡检而导致的小问题演变成大故障的情况。记得有一次某企业核心交换机突然宕机排查后发现只是因为风扇积灰导致过热保护——这本该在例行巡检中就发现的问题。设备巡检主要关注三个核心维度硬件状态温度、电源、风扇、软件运行CPU、内存、进程和网络功能接口、协议、路由。完整的巡检流程应该包含以下步骤基础信息采集先获取设备型号、版本等身份证信息硬件健康检查就像体检时的血常规检查电源、温度等基础指标性能瓶颈分析关注CPU、内存等关键资源使用率网络状态验证接口、协议、路由表等网络功能的运转情况配置与日志审查检查最近配置变更和系统告警信息不同厂商设备虽然命令语法不同但巡检逻辑是相通的。下面我就用实际案例带大家掌握四大厂商的巡检技巧。2. 华为设备巡检实战华为设备的命令体系以display为核心配合丰富的子命令可以获取各类信息。这里分享几个我常用的组合拳2.1 硬件健康检查套餐display device # 查看所有单板状态 display power # 电源状态重点关注PowerID为1的主电源 display fan # 风扇转速正常应在5000-15000转/分钟 display temperature all # 温度监测核心芯片通常不超过65℃上周帮客户排查一台S5700频繁重启的问题就是用display temperature发现主控板温度达到78℃清理风道后立即恢复正常。硬件检查一定要形成定期记录的习惯建议制作类似这样的对比表格检查项正常范围当前值历史趋势CPU温度40-65℃52℃平稳内存使用率70%58%每周2%主电源状态Power Supply 1正常-2.2 网络状态深度检查display interface brief # 接口状态速览重点关注CRC错误 display arp # ARP表检查异常ARP可能是病毒征兆 display ip routing-table # 路由表验证缺省路由必须存在 display bgp peer # BGP邻居状态Established才是正常特别提醒华为设备默认会分页显示建议先执行screen-length 0 temporary取消分页。曾经有工程师在巡检时漏看了关键告警信息就是因为没注意屏幕底部的--More--提示。3. 华三设备巡检精要华三H3C的命令体系与华为类似但有些独特参数。我最常用的是display配合count参数实现统计功能3.1 性能监控技巧display cpu-usage history # CPU利用率历史曲线 display memory-usage # 内存详细使用情况关注Free值 display logbuffer level 6 # 只显示严重等级日志华三的display device manuinfo命令特别实用能直接显示设备序列号和保修信息。有次客户需要报修设备就是靠这个命令快速获取了SN码。3.2 网络诊断实例display link-aggregation summary # 聚合链路状态 display ntp-service status # 时间同步状态 display lldp neighbor-list # 邻居设备拓扑发现建议把以下命令保存为脚本定期运行#!/bin/sh echo $(date) display clock display version display device display interface brief | include up display cpu-usage display memory-usage4. 锐捷设备巡检指南锐捷设备采用类思科的show命令体系但有些独特功能。这里分享几个实战技巧4.1 硬件状态检查show environment # 环境监测含温度/电压 show power detail # 电源详情输入输出电压 show fan # 风扇状态注意FAN1-FAN4状态锐捷的show interface transceiver命令特别强大能显示光模块的实时收发功率。曾经通过这个命令发现某光纤链路接收功率为-28dBm正常应大于-20dBm及时更换了劣质跳线。4.2 网络状态检查show ip route summary # 路由汇总统计 show lldp neighbors # 邻居设备发现 show running-config diff # 配置变更对比超实用锐捷设备支持terminal length 0命令取消分页和思科的操作习惯一致。建议巡检时先执行这个命令避免信息截断。5. 思科设备巡检大全思科作为网络设备鼻祖其show命令体系最为完善。这里分享几个高阶用法5.1 硬件健康检查show env all # 环境状态含温度阈值 show inventory # 硬件清单含序列号 show processes cpu # CPU进程排行关注%CPU高的进程思科的show tech-support命令堪称万能会自动收集所有关键信息。但输出内容可能多达数百页建议配合show tech-support | redirect tftp://server/file.txt导出分析。5.2 网络状态深度检查show interface stats # 接口流量统计 show cdp neighbors # 拓扑发现思科专有协议 show ip ospf neighbor # OSPF邻居状态Full才是正常特别实用的技巧show run | section interface可以只显示接口配置show run | include hostname快速定位关键配置。这些管道符用法能极大提升巡检效率。6. 巡检报告生成技巧完整的巡检不能只停留在命令行操作还需要生成规范报告。我的标准流程是使用script命令记录全部操作过程关键指标用| include过滤重点信息将输出重定向到文件show run config_backup_$(date %F).txt使用文本比对工具分析历史变化建议建立这样的巡检记录表检查时间设备型号异常项处理措施2023-08-01S5700-52XGE0/0/1有CRC错误更换网线2023-08-15CE6850-48S6Q-HI内存使用率75%优化ACL配置最后提醒所有巡检操作建议在非业务高峰时段进行部分show命令可能影响设备性能。对于核心设备可以考虑使用SNMP等自动化监控工具辅助巡检。