第3回:運用中の困ったな…… ~タイムサーバーの運用管理~
本コラムでは、弊社の技術サポート担当者より、NTPによる時刻同期について様々な視点でご紹介しています。
前回は導入時のあるあるネタを書かせていただきました。
今回は、タイムサーバーを運用中のお客様からいただくお問い合わせについて少し書きたいと思います。
ほとんどのお客様のタイムサーバーは一度時刻ソースと同期できるとトラブルもなく安定して稼働しますが、稀に発生する障害への対処や正常性の確認など、運用担当者には様々な心配事があるようです。
時間がズレて見える?!
~まずはどこでズレが発生しているか探すのが大事です~
お客様から「時刻ズレが発生したので、調査してほしい」と障害のご連絡をいただくことがあります。その場合、まずサポート担当が確認することは「実際にどこで、どの程度の時刻差が発生しているか?」です。もしGNSSやFMなどの時刻ソース側に問題が発生している場合には、他のお客様からもお問い合わせが入るでしょうし、弊社の検証機器でも同様の事象が発生するはずです。これまで時刻ソース側のトラブルはほとんど起こった事はありません。ほとんどのケースはお問い合わせいただいたお客様の環境でのみ時刻差が生じています。
この場合、タイムサーバーが時刻ソースと同期できてないことなどが原因としてあげられます。
このようなトラブルは、お客様の全ての機器が時刻ソースと異なる時刻で動作していることになり、一刻も早い時刻修正が必要となります。まずはタイムサーバーが時刻ソースと正しく同期できているか否かを確認することが大事です。タイムサーバーの時刻同期の状態やエラーメッセージなどはブラウザでタイムサーバーにログインすれば簡単に確認することができます。ですが、お客様によっては現地に行かなければ装置の情報が収集できない場合や、入館手続きや機器アクセスの申請が必要ですぐに確認や処置が行えないなど、修正までさらに時間を要する事もあり、一刻も早くお客様の環境を正常に復帰させたいサポート担当としてはもどかしさを感じることもあります。
どのようなシステムでも障害は起こりえます。重要なのは障害が発生したことを早急に検知できるしくみづくりです。タイムサーバーの障害はSNMPサーバーなどで検知します。以下にタイムサーバーの監視ポイントとクライアント装置での同期状態の確認についてまとめます。
- タイムサーバーの障害検知
SNMPサーバーを利用すれば、タイムサーバーの障害発生をSNMPトラップで検知できます。タイムサーバーは装置の障害やNTPサービスの状態変化、時刻ソースの状態変化(同期/ホールドオーバー/非同期など)を通知するSNMPトラップをサポートしています。対応しているSNMPトラップの一覧は「導入・運用の手引(付録A:SNMP)」をご参照ください。 - タイムサーバーの同期状態の確認
タイムサーバーの同期状態はブラウザを利用して簡単に確認出来ます。また、LinuxなどからsnmpwalkやsnmpgetコマンドなどでMIBアクセスすれば、タイムサーバーの同期外れを定期監視することもできます。例えば、時刻ソースがGNSSの場合、具体的にはSNMP拡張MIBのGnssSyncStateを参照すれば同期状態の確認が可能です。同期できていない場合、GnssSyncStateはsync(2)ではなく、unsync(4)などの状態に遷移します。
さらにNtpSyncStateも監視すれば、時刻ソースの状態だけではなくNTPサービスの稼働状態を監視することも可能です。 - クライアント装置の同期状態の確認
クライアント装置の同期状態はLinuxならchronycコマンドで確認可能です。下図のS項目やreach項目、Last sample項目で同期選択先
や同期状況が見られます。同期出来ていない場合は「S」項目が同期先を示す*以外となり時刻ソースとの関係の変化が確認出来ます。時刻ズレ発生時は
「Last sample」に大きな数値が入り時刻ソースとの時間差を確認出来ます。Windowsであれば、w32tm /query /statusコマンドで同期状態を確認できますが、Active Directory経由で同期していることも多く、Windowsでの確認はADサーバー上で実施することになると思われます。
その他の情報として、お客様からよくあるタイムサーバーの運用管理に関するお問い合わせとその回答についてキーワード毎に以下にまとめてみました。
運用対応の参考になれば幸いです。
キーワード | 回答 |
脆弱性 | 主にntpdの脆弱性について公表後に早期確認を実施し、必要に応じて対応ファームウェアをご提供します。 |
うるう秒 | セイコーソリューションズのタイムサーバーはうるう秒の対処調整方法として即時調整だけでなく、うるう秒の影響を受けない弊社独自の調整機能「漸次調整」もサポートしています。詳細は「https://www.seiko-sol.co.jp/leap-second/」をご確認ください。 |
設定バックアップ | 運用中に機器障害が発生したが設定バックアップがない?とならないよう、いざという時の障害に備えて設定のバックアップを推奨します。TS-2560/2220では下記で取得可能です。 ★webアクセスで「システム」→「エクスポート」から「設定情報(config.txt)」を選択し名前をつけて保存 |
ログ収集方法 | 障害時にタイムサーバーから取得して欲しい情報ファイルです。お問い合わせ時に取得をお願いする事が多く、TS-2560/2220では下記で取得可能です。 ★webアクセスで「システム」→「エクスポート」から「問い合わせ情報(tech-support)」を選択し名前をつけて保存 |
タイムサーバーを自社で運用する際は障害発生時の対応で悩まれることがあるかと思いますが、新サービスの『セイコークローズドモバイルNTP』では運用を弊社にお任せいただくことでそれらの悩みを解消することができます。下記をご覧いただければ幸いです♪
<新しい時刻ソースのお話>
運用監視は標準装備! 監視から障害時のログ確認、機器交換の提案まですべてプロにお任せ。
|
さて、今回のコラムは如何でしたでしょうか?
今後も定期的に掲載していきますので、楽しみにお待ちください。
気軽にお読みいただき、少しでもお役に立てば幸いです。
―「次回の掲載予定」―――――――――――――――――――
第4回 セカンダリタイムサーバーって何? ~アプライアンスサーバで安心♪~
―――――――――――――――――――――――――――――
(お問合せ先情報)
セイコーソリューションズ株式会社 タイムマネージドサービス担当
メールでのお問い合わせはこちら/TEL:043-273-3184
著者プロフィール
北島 康行
セイコーソリューションズ株式会社
STN営業技術部でタイムサーバー全般を担当
■経歴
2014年 入社
2015年11月~ タイムサーバー全般を担当
数々のタイムサーバー導入事例を経験し、現在に至る