正常运行时间监控

manageengine1 | 2023-11-22 10:25:16 阅读：170

正常运行时间是系统可靠性的度量，表示为机器工作和可用时间的百分比。

当提到IT网络时，正常运行时间是对网络设备、网站和其他服务可用性的度量。

网络正常运行时间通常用百分比来衡量，例如五个9秒，这意味着系统的运行时间达到99.999%。网络正常运行时间监控的目标是拥有99.999%的可用性，也就是每年少于5分钟的停机时间。停机时间是系统不能运行的一段时间，与正常运行时间相反。

为什么需要监控网络正常运行时间？

网络正常运行时间监控主动监控您的整个IT网络环境，以确保它可用并工作。可以把正常运行时间监控看作是你可以信赖的24/7的在线安全卫士。当监控系统注意到网络设备或服务宕机时，它会从一个仪表板立即通知您，以便您的网络管理员可以在问题变得太严重之前解决它。正常运行时间监控的目的是确保您的网络操作尽可能不间断。

术语网络正常运行时间和停机时间用于定义IT服务提供的成功级别。服务水平协议(SLA)通常包括正常运行时间和宕机时间比率，它们显示服务预计保持运行的时间。IT专业人员使用正常运行时间来表示连续运行的总时间。

如何进行网络正常运行时间监控工作？

网络正常运行时间监控为您提供了所需的可见性，以便提前一步发现潜在问题。通过在易于阅读的界面中显示实时网络性能数据，网络正常运行时间监控软件可以帮助您识别可能导致瓶颈的中断。能够实时检测威胁意味着您可以随时随地得到通知，并立即采取纠正或防御立场。您可以节省时间和金钱，并且不再需要物理系统管理员一直在现场执行手动检查。网络正常运行时间的监控：

跟踪网络设备的可用性和带宽使用情况，以检测任何潜在的瓶颈。
监控服务器的正常运行时间，包括DNS服务器、SQL服务器、邮件服务器、FTP服务器和虚拟服务器的正常运行时间。
监控你的网站的可用性和检查坏的链接。
确定停机和网络性能问题的根本原因。
关于SLA的报告：生成SLA报告来帮助您跟踪可用性和性能，以便您能够满足对客户的SLA承诺。

使用ManageEngine OpManager进行网络正常运行时间监控

ManageEngine OpManager帮助确保所有网络设备、服务和网站都是全天候运行的。OpManager的接口提供有关网络正常运行时间和单个服务可用性的实时统计数据。仪表板使用绿色、黄色和红色指示符等可视化提示显示关于网络设备、服务和网站的状态和运行状况的报告，帮助您锁定关键指标。

OpManager提供各种正常运行时间监控，包括：

设备正常运行时间的监控
界面运行监控
服务运行监控
Windows服务正常运行时间监控
网站正常运行时间监控
流程运行监控

设备正常运行时间监控：

持续监控整个网络的正常运行时间和网络可用性。OpManager每两分钟向被监控设备发送一个ping信号。如果连续两次ping之后没有响应，那么OpManager将认为该设备不可用。可以根据业务需要分配ping的数量及其时间间隔。

作为一个正常运行时间监控工具，OpManager使用ICMP Ping来轮询设备的可用性。ping是IT管理员检测设备可用性的有效工具。

对于非icmp环境，特别是监控边缘路由器或DMZ区域设备的正常运行时间，可以使用Telnet。默认的可用性轮询间隔为5分钟，您可以根据需要将其定制为特定的设备组或特定的设备。

接口正常运行时间监控：

为企业网络和IT基础设施中的每个元素提供基于snmp的接口运行时间和端口可用性监控。它提供每日、每周、每月或自定义期间显示接口可用性的正常运行时间报告，以度量网络级别的可用性并确保满足sla。这些接口或端口状态通过单个设备状态、第2层网络映射、业务视图或自定义设备组和网络天气图跨多个方面传播。

服务时间监控：

服务器是任何IT基础设施的核心元素。为了确保内部流程的平稳运行和服务的可用性，它们始终是可访问的，这一点至关重要。服务器正常运行时间，即服务器对用户可用的时间，是优化网络性能的最重要因素之一。

OpManager为您提供有关被监控的传输控制协议(TCP)服务的可用性和响应时间的详细图表和报告。OpManager中的服务监控功能是可定制的，您可以选择要监控的服务。

Windows服务正常运行时间监控：

除了监控系统级服务之外，OpManager还支持使用Windows管理工具(WMI)监控Windows服务。与系统级服务监控类似，您可以发现任何Windows服务并使用OpManager监控它们。此外，管理员可以配置OpManager，使其在发现Windows服务从操作控制台关闭时自动重启服务或服务器。了解更多 >>

Windows网络正常运行时间监控 - ManageEngine OpManager

网站正常运行时间监控：

ManageEngine OpManager执行的关键任务是监控您的网站的可用性，每年365天24小时。它监控HTTP/ HTTPS url、内部网站点、web服务器场、带有登录的web应用程序、Windows NT LAN Manager (NTLM)认证的网站等等。除了URL正常运行时间监控之外，你还可以检查网站中的特定内容。网站可用性监控确保网站不受黑客攻击。

流程运行监控：

OpManager的进程正常运行时间监控使管理员能够远程监控和管理在服务器上运行的进程。OpManager使用各种协议，如SNMP、WMI和CLI，来监控运行在Windows、Linux、Solaris、UNIX、HP UX、IBM AIX、ESX和VMware服务器和虚拟机等上的进程。

更多地了解OpManager的流程可用性监控。

如何计算设备的正常运行时间？

在一个特定的时间范围内，我们取设备停机的秒数，然后用这个数除以该时间范围内设备被监控的总秒数。因此，我们得到了停机百分比，然后将其从100%减去以确定正常运行时间百分比。

例子

假设我们监控了一个网络设备24小时(即86,400秒)，在这段时间内，设备宕机了5分钟(300秒)。为了定义正常运行时间和宕机百分比，我们执行以下计算：

设备停机的总时间：300秒。

设备被监控的总秒数：86,400秒

300除以86,400，等于0.0035。

用百分比表示，这是0.35%这是停机时间百分比。

设备的正常运行时间百分比将是:100%减去0.35%等于99.65%。

注意：暂停、维护、依赖不可用、宕机、未被监控是按设备宕机时间计算的。

运行时间监控：如何影响您的业务以及您如何确保业务关键型网络设备的运行时间？

在当今的数字时代，人们期望企业始终保持其网络运行时间。网络运行时间是指网络处于活动状态并有效运行的时间跨度。

对于任何企业来说，拥有一个功能强大的IT网络是至关重要的，它可以确保IT基础设施组件不断高效地启动和运行。这可以通过利用各种协议（如SNMP、WMI、TCP和ICMP）跨网络基础设施（如路由器、服务器和防火墙）监控关键组件的运行时间和可用性来确保。

为什么运行时间监控至关重要？

没有多少情况比经历网络宕机更糟糕。在过去5到7年中，每小时停机的成本持续增加，企业每小时停机的损失可能高达500万美元。

虽然不可能经历100%的运行时间，但即使是0.1%的停机时间，即99.999%的运行时间，也会导致一些损失。例如，一个大型网络将包含各种设备和接口，因此不可能手动监视所有网络组件的可用性和性能。只有当监测设备分布在全球多个远程站点时，挑战才会增加。

监控网络运行时间的挑战

在规划早期，考虑到需要监控运行时间的设备数量，管理和监控网络的运行时间是一项重大挑战，通常会部署一个训练有素的技术团队来维护整个网络。

让我们看看监控网络基础设施运行时间方面的挑战：

处理网络可扩展性因素
确定关键问题的优先级
平衡服务级别协议（SLA）和减少平均修复时间（MTTR）
卓越的网络可视性
处理网络可扩展性因素

当一个企业业务增长时，其IT基础设施会呈指数级增长。一般来说，企业网络包括来自不同供应商的多种类型的设备。监控网络中所有可用设备的运行时间需要大量工作，但这项任务至关重要。企业网络中关键设备的数量表明维护其运行时间有多复杂。

确定关键问题的优先级

基于阈值的告警对于监控和避免网络停机至关重要。但是，如果父设备出现故障或服务器停机，您将深陷告警循环之中。告警信息库不仅会阻碍您识别问题的能力，还会延迟恢复正常。

然而，对于此类情况，有一些解决方案，包括广泛、主动的监测、识别关键告警，以及通过适当的渠道将告警传递给正确的利益相关者，以便立即采取行动。

平衡SLA并降低MTTR

必须对关键设备进行监控，以应对性能差和网络中断。MTTR是一个监测系统可用性的参数。企业可以使用MTTR来支持SLA。SLA可用于测量网络设备的可用性。为了提高网络的可用性，您应该监视网络设备的可用性。一旦检测到故障，主动告警。您可以使用诸如ServceNow和ServiceDesk Plus之类的IT服务管理工具来记录有关可用性问题的记录，并在网络停机之前快速解决这些问题。

卓越的网络可视性

您应该了解网络中工作的所有网络组件。在整个网络中的可见性有助于您在问题的早期阶段识别问题，并在其影响最终用户之前将其消除，从而建立一个稳定的网络。

使用OpManager监控运行时间

OpManager是一款动态网络监控软件，提供实时网络监控，帮助您了解网络设备的可用性和性能。在识别网络漏洞方面的任何延迟或失败都可能导致灾难性的停机，并花费数千美元。OpMangaer的运行时间监控功能有助于消除这一IT痛点。

OpManager提供：

使用定期预防性维护措施主动监控网络的内部健康状况，以帮助您减少设备故障。
计划运行状况报表，帮助您随时了解网络中各种基础设施组件的运行状况。
带颜色代码的运行时间图可以帮助您及时了解网络中所有设备的可用性。

更多内容：打印机监控 UPS监控 CPU温度监控硬件监控网络映射

*博客内容为网友个人发布，仅代表博主个人观点，如有侵权请联系工作人员删除。