Monitoring is van cruciaal belang om een IT landschap beheersbaar en onder controle te houden.  Accuraat en real-time inzicht in de infrastructuur zorgt voor grip op de beschikbaarheid, performance en capaciteit van de omgeving. Voorkom onnodige technische problemen, cyberaanvallen en uitval van jouw omgeving en investeer in proactieve monitoring. Hoe? Alexander neemt ons mee.

Door Alexander Klomp

1. IT monitoring: Van reactief naar proactief

Van oudsher ligt de focus in IT-monitoring (logischerwijs) vaak op de technische componenten binnen de IT-infrastructuur, zoals servers en netwerkswitches. Hierbij worden centraal in een monitorapplicatie de bekende KPI’s  verzameld en gevisualiseerd. Overschrijft een KPI een vooraf vastgestelde grenswaarde? Dan kan de applicatie een waarschuwing uitsturen voor verdere acties. Echter. het complexe samenspel van componenten die we vandaag de dag tegenkomen, maakt het nodig om juist de samenhang tussen al deze componenten in beeld te krijgen.

Traditionele monitoring heeft zich bewezen in het verzamelen van metrische data, maar kan vrijwel niets met log-data (tekst) en is beperkt in de analysemogelijkheden. Eventlogging Windows/Linux en syslogging zijn binnen de omgevingen beschikbaar. Ze bevatten waardevolle informatie om de data in de juiste context te kunnen zien.

Even in het kort… Hoe pak je dit  aan zonder opnieuw het wiel te moeten uitvinden? Een goede start is om jezelf én je organisatie de onderstaande vier vragen te stellen. Om zo inzicht te krijgen in wat er aan data-intake nodig is. Is deze beschikbaar (lees: of de analyse überhaupt uitgevoerd kan worden)? En wat zijn de te verwachten hoeveelheden (kosten)? Houd hierbij altijd in het achterhoofd dat de te maken investering op moet wegen tegen de opbrengsten die de nieuwe inzichten opleveren;

  1. Ga uit van de functionele eigenschappen van een applicatie; wat is het te verwachten gedrag, doorloop etc.?
  2. Welke componenten komen we tegen in de volledige keten van de applicatie, vanaf gebruiker tot aan de losse componenten?
  3. Hoe beïnvloeden deze elkaar (een hoge load hoeft bijvoorbeeld niet per definitie een probleem te zijn)?
  4. Welke patronen zijn er zichtbaar op de langere termijn?

2. Big data als redder in nood

Big data maakt het mogelijk om gegevens uit diverse bronnen te combineren en te analyseren (lees: alles wat leesbare tekst oplevert met metrische data). Een voorbeeld hiervan is dat een transactie in een applicatie meerdere componenten in de keten raakt en in een data-flow te volgen is.

Logica in op het eerste gezicht onsamenhangende data, kan worden verkregen met moderne analysetechnieken. Zoals het welbekende Machine Learning. Hierbij worden uitgebreide statistische analyses uitgevoerd op de complete dataset, waaruit patronen zichtbaar worden. Door deze patronen over een langere tijd te wegen, opnieuw aangeleverde data, zal het model steeds nauwkeuriger worden. Zo kunnen verstoringen – die normaal niet zichtbaar zijn – worden opgemerkt. Ook als deze uit meerdere losstaande kenmerken bestaat. Hierdoor kan in een vroeg stadium actie worden ondernomen voordat de verstoring schadelijk kan worden.

Het model kan naast puur IT-gerelateerde data ook omgaan met typische business data, zoals omzetcijfers. De verzameling aan zinvolle patronen en modellen is samen te vatten onder de noemer (business) analytics. Een soort basishandleiding hoe de systemen zich in de organisatie gedragen.

3. IT Business Intelligence (BI) versus Analytics?

In veel ondernemingen heeft PowerBI een prominente positie als het gaat over het analyseren van (business) data. Wat maakt het verschil met analytics en BI? Beiden leveren op basis van data ondersteuning in de besluitvorming voor de business op verschillende niveaus. BI vooral op basis van historische gegevens met bekende samenhang. En Analytics gaat hier verder door om te kunnen gaan met onsamenhangende datasets en meer te kijken naar continu veranderende datastromen. En vooral om daarop ‘what if’-inschattingen te maken. Met als uiteindelijk doel om hiermee risico’s en trends te voorspellen.

4. Big data; wat is er beschikbaar in de markt?

De markt voor big data is de laatste jaren big business geworden en kent tegenwoordig een aantal grote spelers met betaalde of opensource oplossingen. De verschillende oplossingen onderscheiden zich op:

  • Full stack monitoring: In hoeverre is de oplossing in staat om de volledige keten te monitoren in het gewenste detailniveau? Dit omvat alle databronnen vanaf de interne virtuele machine, netwerkcomponenten (syslogging), applicatielogging, IaaS- (Infra as a Service) en PaaS- (Platform as a Service) diensten uit een van de grote Cloudproviders.
  • Implementatie/onderhoud complexiteit: Wat is de doorlooptijd van implementatie van de oplossing tot het resultaat? Dit gaat om de beschikbaarheid van de standaardoplossing voor de gebruikelijk databronnen. Wanneer dit niet van toepassing is, moet de oplossing geschreven worden. De grote spelers werken samen met leveranciers van IT-oplossingen. Zij bieden hiervoor via een eigen app-store de noodzakelijke componenten aan. Zoals invoer, verwerking en visualisatie. En niet onbelangrijk; de leercurve. Hoe eenvoudig is het om er zelf in te werken?
  • Kosten: De meeste leveranciers gebruiken een licentiemodel op basis van dagelijks aangeleverde data. Is de data eenmaal in het systeem aanwezig, dan kan deze meestal onbeperkt worden ingezet. Om de kosten te beperken, is het zaak per user-case een goede calculatie te maken van de te verwachten datastroom. Daarop worden de oplossing en licentie op de juiste manier geschaald. Vaak zijn er ook oplossingen om aan de bron de data te filteren en zo alleen te indexeren wat noodzakelijk is.

5. IT monitoring: Wie zijn de grote spelers?

Azure Monitoring/AWS

De grote Cloudproviders als AWS en Microsoft Azure bieden ieder hun eigen interne oplossing aan, die gericht zijn op hun eigen platform. Deze zijn niet in staat de volledige keten te monitoren en hebben de focus op de interne Cloud zelf. Azure Monitoring is een relatief jonge speler en kan op hoog niveau de meest belangrijke KPI’s in kaart brengen. Azure Monitoring (of Datalake) vraagt naast de dagelijkse data-intake ook een bedrag voor de dataverwerking en uitgestuurde hoeveelheid alerts. Standaard biedt de oplossing eenvoudige dashboards.

Splunk> Enterprise

Splunk> heeft een lang trackrecord en biedt een oplossing die vrijwel overal inzetbaar is, met ondersteuning van grote leveranciers voor de data-intake. Daarnaast levert het fullstack eindoplossingen zoals Enterprise Security (SIEM), IT-Service Intelligence (ITSI) en UBA (User Behaviour Analytics). Hierbij integreert Splunk zich naadloos met alle IT-leveranciers en Cloudleveranciers. De oplossing kan onpremise, in de Cloud of als dienst worden afgenomen. En kent een licentiemodel op basis van data-intake.

Opensource alternatieven

Elastic stack en Sumo Logic bieden in de basis goede oplossingen, maar zijn in het onderhoud en werken complexer. Full stack monitoring is mogelijk waarbij rekening gehouden moet worden dat niet alle leveranciers ondersteuning bieden. Voor opensource is het kostenmodel gratis. Echter worden er extra kosten gemaakt door de complexiteit en extra resources die andere producten niet kennen.

Wanneer gebruik ik wat?

Wanneer welke oplossing in wordt gezet, hangt erg af van het budget en toekomstige behoeften op het inzien van de volledige stack. Onze consultants denken natuurlijk heel graag mee over de juiste oplossing voor jouw organisatie.

Conclusie

Voor ons geldt dat Splunk haar waarde m̩̩r dan bewezen heeft, met name in het zorgeloos ondersteunen. Potentiele verstoringen worden proactief opgemerkt en zonder dat de klant het merkt (!) op de achtergrond opgelost. De interne servicedesk heeft hiervoor de beschikbaarheid over een dashboard waar de klantstatus realtime beschikbaar is. Daar zijn problemen direct zichtbaar en kan Рvia een deepdive Рin de data de oorzaak verder onderzocht kan worden. De oplossing is generiek en inzetbaar voor een praktisch onbeperkt aantal klanten die gelijktijdig bediend kunnen worden. En ̩̩n ding is zeker: onnodig IT-uitval vegen we van tafel en daarvoor is monitoring pure noodzaak: meten is weten.

Over de auteur:

Alexander gaat nooit een uitdaging uit de weg en als we zeggen dat dat zo is, is dat ook ̩cht zo. Hij combineert rollen van engineer met servicemanager. En maakte tijd om uit te zoeken Рen op papier te zetten Рhoe je met monitoring-skills onnodig IT-uitval voorkomt.

 

Gerelateerd

Meer innformatie?

Wil je meer weten over IT monitoring als redder in nood; van onnodig IT-uitval naar monitoring-master, neem dan contact met ons op.