数据中心监控并不仅仅局限于观察服务器的运行状态。即使是观察服务器的状态,实际操作要复杂得多。比如,Microsoft's System Center Operations Manager在Windows Servers的监控方面做得不错,还可以部署到小型规划中。但尽管如此,如果服务器运行的是非Windows操作系统,它也是无法发挥作用的。
除了服务器操作系统和应用服务之外,还有很多其它的因素需要我们进行监控。比如,对数据中心温度的观察也很重要。大多数服务器都配有内置安全机制,当服务器的温度超出某个特定值并且可能损坏服务器时,它就会让服务器停机。
一个好的监控解决方案必须能够及时报告数据中心环境的温度,同时还应该能够在任何一台服务器的温度开始接近临界水平时向我们发出警报。
电源管理方面的情况也是类似的。当发生电源中断时,通常来讲备用电源会保持服务器在预先设定的时间范围内正常运行。更加复杂的数据中心也可能会依赖备用发电机。在任何情况下,我们都必须关注电源中断现象,也必须知道在任意给定时间中需要多少备用电源。
总而言之,好的监控解决方案必须能够提醒网络管理员关注服务器硬件问题、操作系统故障、应用故障、网络硬件故障和环境问题。这可以说是一个苛刻的要求,同时这也是为什么说适当的规划至关重要的原因之一。目前还没有一个监控解决方案可以同时执行所有这些功能。一般来讲,网络架构师需要同时购置几种监控解决方案,并且将它们都安装在系统上以发挥警报作用。这个警报可以以文本信息的形式发送到管理员的手机上,或者以邮件的形式发送到服务台,或是以其它警报形式提醒管理员。重要的一点是所有的警报最终都必须被汇集到一个地方。

文章如转载,请注明转载自:http://www.5iadmin.com/post/544.html