网络故障(network failure)是指由于硬件的问题、软件的漏洞、病毒的侵入等引起网络无法提供正常服务或降低服务质量的状态。 路由器丢包的原因有很多。本文介绍如何判断是否是路由器丢包以及如何解决。 一、 内存碎片是指路由器内存被分成很多不连续的块。这将导致内存利用率下降,在严重的情况下,可能会发生内存错误,从而影响路由器的性能。也会造成路由器丢包的问题。其实不仅路由器内存有碎片问题,普通硬盘也有。 例如,Microsoft操作系统带有碎片整理工具,可以保证用户对硬盘进行碎片整理,从而提高硬盘的存储容量和存储性能。这里所说的内存碎片其实和硬盘碎片很相似。 二、 那么如何判断路由器的内存是否碎片化呢?这里主要使用的是灵客路由器自带的SHOW MEMORY命令。该命令将显示有关当前内存的信息。 执行该命令后,会显示当前可用内存(Free)和最大可用内存(Largest)。网络管理员可以比较这两个值来确定分片对路由器性能的影响。这主要是比较路由器的可用内存和最大可用块的大小。 如果路由器的可用内存接近最大可用块大小,则说明路由器虽然碎片化,但影响不大。但是如果最大可用块很小,比如只有最大可用内存的十分之几,那么路由器内存碎片问题就很严重了。 三、 如果路由器的可用内存为20M,最大可用块的大小为15M,则说明路由器内存中存在一定的碎片,但该碎片不影响路由器的正常运行路由器。如果可用内存为20M,最大可用块为0.8M,说明路由器内存中的碎片较多。 连续连续的内存中没有足够的可用内存,这可能会导致严重的内存分配问题,例如导致一个或多个接口间歇性丢包。 在路由器内存中,允许一定量的内存碎片。直到现在,还没有可以完全避免内存碎片的内存管理技术。只是这个片段必须保证一个合理的值。 四、 其实这个可用块和可用内存的关系可以用柜子里的抽屉来表示。例如,虽然一个机柜的可用容量比较大,但它被分成1000多个大小不一的网格。每个网格的空间容量是有限的。 当需要存储大数据时,整个容量就足够了,但是小网格是不够的。此时,将出现消息丢失的问题。 这时候好像内存够用了,但是此时内存中已经没有连续的空间来存储数据了。所以这些看似比较大的可用内存,其实可以存储的数据并不多。 五、 如果确定路由器内存中没有过多的碎片,网络管理员必须考虑是否由于CPU过载而丢失数据包。要查看CPU 使用率,可以使用SHOW PROCESS 命令查看路由器的CPU 使用率。通过该命令可以显示路由器最近5秒、1分钟、5分钟的CPU使用率。 因为 CPU 使用率一直在变化,所以网络管理员主要关心的是 5 分钟内的平均 CPU 使用率。此时可以解释路由器接口丢包很可能是CPU过载造成的。 六、如果确认路由器CPU过载,则网络管理员需要确认哪个进程占用了大量内存。只有找到罪魁祸首,网络管理员才能对症下药,解决问题。 如果网络管理员在查询后发现SRB Background进程占用了大量CPU,则意味着发生了网桥风暴。因此,为了解决CPU过载问题,为了达到这个目的,网络管理员可以通过SHOW PROCESS MEMORY命令查询路由器的内存分配信息。 通过执行该命令,系统会反馈当前路由器的可用内存量和使用情况等信息。它还反映了每个进程占用的内存空间。如果一个进程占用的内存和上面显示占用的CPU都很大,说明这个进程问题很大。网络管理员需要一一调查这些可能的过程。 七、 例如,有时网络管理员可以强制关闭某些消耗大量CPU资源的进程,然后测试丢包率是否有所改善。如果有显着改善,则说明问题的原因已经找到。 这时候网络管理员就可以对症下药,分析一下这个进程对应的是什么服务,为什么会占用这么多CPU和内存资源。 如果可能,您可以先关闭该服务,以减少丢包并保证其他服务的正常运行。等找到问题原因,修复后再重启。 看完以上内容,我明白丢包的原因了。只要有针对性地采取措施,问题是可以解决的。请注意,路由器中使用了许多交换技术,它们都依赖于消息。如果消息丢失,无论交换技术多么先进,都行不通。如何防止消息丢失非常重要。
当今,越来越多的业务应用运行于网络架构之上,保障网络的持续、高效、安全的运行,成为网络管理者面临的巨大挑战。 |
温馨提示:喜欢本站的话,请收藏一下本站!