机房里几十台服务器,时间各走各的是常态。这台快了半分钟,那台慢了一分钟,查日志的时候根本对不上号。防火墙记录的攻击时间是10:03:12,服务器上的日志显示同一事件发生在10:02:58,差了十几秒,到底谁先谁后?核心交换机响应延迟了几秒?这些问题都说不清楚。其实解决起来也不难,在网络里部署一台NTP网络时钟服务器就行了。NTP是网络时间协议的缩写,这套协议专门用来让网络里的设备相互对时,而NTP网络时钟服务器就是这套协议里的时间源头。
NTP网络时钟服务器的工作流程分三步。第一步是自己先拿到准确时间。常见的方式是在楼顶装一根小天线,接收GPS或北斗卫星发下来的时间信号,卫星上带的原子钟时间精度很高,误差在纳秒级别。另一种方式是从运营商的光纤网络里提取标准时间,这种方式不需要天线,适合天线不好安装的场所。第二步是守时。服务器内部配有高稳晶振,即使短时间收不到外部时间信号,也能维持高精度走时。第三步是分发时间。服务器通过网口运行NTP服务,局域网里的每一台设备——服务器、工作站、交换机、打印机、摄像头——只要在网络设置里填上这台服务器的IP地址,就会定时主动来问“现在几点了”,然后自动校准自己的时间。
NTP网络时钟服务器的外形通常是1U高度的金属机箱,可以跟交换机、路由器一起装在标准机柜里,不占额外空间。前面板有一块小液晶屏,显示当前时间、卫星收星颗数、网络连接状态。背面有天线接口、网口、电源口、管理串口。一些型号配备了两个独立网口,可以同时给多个隔离网段提供校时服务。部分型号还支持双电源冗余,两个电源模块同时工作,坏了一个另一个还能继续供电。安装调试完成后,设备自动运行,断电重启后也会自动恢复工作。
NTP网络时钟服务器给运维带来的好处比较实在。首先是省事。以前每个月要抽时间手动核对各台服务器的时间,发现跑偏的要手动调整,费时费力。有了NTP服务器之后,所有设备自动同步,不用管了。其次是日志分析方便了。所有设备的时间戳来自同一个源头,查故障的时候谁先谁后一目了然,不用来回换算时差。比如分析一次网络攻击事件的完整链条,从防火墙告警到服务器入侵检测再到数据库异常,时间线一拉就清楚。第三是业务交易不出错。尤其是那些跨系统、跨流程的业务,比如OA系统的审批流程、ERP系统的订单流转,时间顺序正确了,流程就不会乱。
部署NTP网络时钟服务器还有一个额外的好处,就是可以断开对外网公共时间服务器的访问。很多单位的机房出于安全考虑,不允许服务器直接访问互联网。这时候如果内网没有时间源,设备的时间会慢慢漂移。NTP网络时钟服务器靠卫星或者专线工作,不占用互联网出口,也不引入外部访问,符合安全要求。而且内网自建的时间源,精度比互联网上的公共NTP服务器更高,因为互联网校时会受到网络延迟和抖动的影响,而卫星校时是稳定在微秒级别的。
选型时需要注意几个参数。带载能力指的是服务器能够同时响应多少台设备的时间请求,入门级可以处理每秒几百次请求,高性能型号可以处理每秒上万次。NTP请求的处理能力取决于服务器的CPU性能和网络接口的带宽。对于一般的企业机房,几百台设备的情况下,入门级就够用了。守时精度也是一个考虑因素,普通温补晶振可以满足大多数场景,如果对时间连续性要求特别高,比如金融交易系统,可以选择恒温晶振的型号。
如果你平时要管理十几台以上的网络设备,而且经常因为时间不一致而浪费大量时间排查日志,可以考虑在机柜里添一台NTP网络时钟服务器。设备不大,投入不高,但能把时间这个基础问题从根上解决掉,后期省下的麻烦不少。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.