BlueCat Adonis: Primary DNS Server kann nicht erreicht werden, Transfer schlägt fehl -> Wie überwacht man dies mit Splunk?

Durch eine Routingänderung ist es dazugekommen, dass der primäre DNS Server nicht erreicht werden konnte, die fand man im Logfile:

Aug 24 11:47:33 b0a881465n named[17221]: transfer of 'zone.loc/IN/View_GT1'
 from 1.2.1.2#53: failed to connect: timed out

Aug 24 10:47:50 b0a881465n named[17221]: transfer of 'zone.loc/IN/View_GT1'
 from 1.2.1.2#53: Transfer completed: 
0 messages, 0 records, 0 bytes, 63.128 secs (0 bytes/sec)

Das Irre ist, dass hier die Rede von „Transfer completed“ ist, obwohl kein Transfer stattgefunden hatte.

Wenn man bedenkt, dass dies zum Diensteausfall der Sekundären Zone führen kann, wenn dies unbemerkt bleibt, sollte man regelmäßig den erfolgreichen Transfer überwachen. Da alle Daten bei Splunk landen, sollte man einen Report bauen, der es checkt:

Wie sollte man es angehen?

  • Warten auf etwas, was gar nicht „kommt“?
  • Warten auf etwas, was kommt und falsch ist?

So sieht es aus, wenn es klappt:
b0a881465n named[9848]: zone zone.loc/IN/View_GT1: Transfer started.
b0a881465n named[9848]: transfer of ‚zone.loc/IN/View_ZGT1‘ from
10.2.1.1#53: Transfer completed: 0 messages, 36 records, 0 bytes, 0.256 secs (0 bytes/sec)

und so sieht es, wenn der Server nicht erreicht werden kann, s.o.

Aug 24 10:20:02 b0a881465n named[17221]: transfer of ‚zone.loc/IN/View_ZGT1‘ from 10.2.1.2#53: Transfer completed: 0 messages, 0 records, 0 bytes, 63.128 secs (0 bytes/sec)
Aug 24 10:47:33 b0a881465n named[17221]: transfer of ‚zone.loc/IN/View_ZGT1‘ from 10.2.1.2#53: failed to connect: timed out