技术支持

如何利用网络拓扑高效排查故障

在国家大力发展“新基建”的浪潮下,数据中心规模不断扩大、业务量与日俱增,随之而来的是数据中心设备类型日渐丰富、数量成倍增长。

那么当我们面对众多机房、百台机柜、数以千计的设备时,出现网络故障,如何做到“高效”呢?高效地发现并定位故障、高效的配置、高效的记录管理……

传统使用的方式是:表格记录与网络拓扑相结合。我们面对的是成千上万的信息:机房的位置、机柜的位置、U位信息、设备信息、历史故障、记录详情、主要负责人等等,相对应的需要大量的时间查找出有用信息,这与我们所追求的“高效”大相径庭。

但如果我们把物理拓扑、设备信息、记录信息与逻辑拓扑结合起来呢?是否可以实现“高效”?

答案是肯定的,耐威迪的Nvisual可视化管理软件就是通过这样的方式来实现“让通信更高效”。

一、自动发现设备

首先我们可以通过SNMP协议自动发现设备及设备属性、接口属性和状态、ip地址、路由表、实时设备状态等信息,形成逻辑拓扑。

二、实现设备精准定位

当我们想定位设备时,可以由逻辑拓扑切换至物理拓扑,这时可以清晰地看到这个设备的上下级连接关系,通过层次化的结构,定位到该设备所在哪个机房、机柜及U位的精准路径。

三、实现端口级的管理

当我们由物理拓扑进入设备甚至可以直观看到该设备板卡、模块、接口及链路等精细到端口级的信息。

四、实现信息整合

在每个设备左侧面板都可以无限自定义设备信息,还可以通过上传附件的形式将本台设备的故障记录、质检报告等信息上传,供运维人员参考。避免出现故障后寻找、翻查大量资料。

五、实现故障终结

最后还可以与工单系统相结合,将有运维需求的设备下达工单给指定的工程师。当工程师接到工单、明确工单工作内容后,点击工单链接,将直接跳转到指定的那台运维设备的界面,省去查找的时间,最终快速完成故障的处理。

由此可见,逻辑与物理相结合的网络拓扑可以更直观明了的看清楚网络中各个节点、接口之间的连接,反应设备实体的结构关系,当发生故障时,便捷、高效为工程师争取宝贵排除故障时间,为企业避免不必要的损失。