Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Navitabs
rootMinLog2 - Leverancebeskrivelse
firsttabMinLog2
includeroottrue



Indhold

Table of Contents


Indledning

Dette dokument beskiver indeholder analyse af log data fra den første performance test, som er kørt for Minlog2.   

Læsevejledning

Læseren forventes at have kendskab til National Sundheds-IT's platform NSP, samt generelt kendskab til WildFly applikation server, MariaDB, Kafka og java.

Dokumenthistorik

...

Version

...

Dato

...

Ansvarlig

...

Beskrivelse

...

1.0

...

14-12-2020

...

KvalitetsIT

...

Dokument oprettet som en kopi af test rapport

Tekst, som ikke har med performance test er fjernet

Test vejledning er fjernet, da dette findes andetsteds

Testene er kørt forår 2020. Analysen dækker

  • MinLog2 - Performancetest rapport borger lookup
  • MinLog2 - Performancetest rapport medhjælper lookup
  • MinLog2 - Performancetest rapport minlog1 lookup
  • MinLog 2 - Performancetest rapport registration


Detaljer omkring performance test vejledningen findes  her. Her kan læses omkring de log filer, som ligger til grund for analysen, hvilket scope testen er kørt i, hvordan test er kørt og hvilke krav, der er til komponenten under test.

Se iøvrigt krav til performance test og rapport på siden https://www.nspop.dk/display/public/web/Performancekrav

Læsevejledning

Læseren forventes at have kendskab til National Sundheds-IT's platform NSP, samt generelt kendskab til WildFly applikation server, MariaDB, Kafka og java.

Dokumenthistorik

Version

Dato

Ansvarlig

Beskrivelse

1.0

14-12-2020

KvalitetsIT

Dokument oprettet som en kopi af test rapport

Tekst, som ikke har med performance test er fjernet

Test vejledning er fjernet, da dette findes andetsteds










Definitioner og forkortelser

Definition

Beskrivelse

NSP

Den nationale service platform (inden for sundheds-IT)

Definitioner og forkortelser

...

Definition

...

Beskrivelse

...

NSP

...

Den nationale service platform (inden for sundheds-IT)

Performance

Det følgende beskriver performance test og analyse for

  • MinLog2 - Performancetest rapport borger lookup
  • MinLog2 - Performancetest rapport medhjælper lookup
  • MinLog2 - Performancetest rapport minlog1 lookup
  • MinLog 2 - Performancetest rapport registration

Først beskrives de forskellige typer test data output, og hvordan de anvendes i analysen. Herefter skitseres scope og afvikling af testene samt performance kravene. Og endelig analyseres data for hver enkelt test.

Se iøvrigt krav til performance test og rapport på siden https://www.nspop.dk/display/public/web/Performancekrav

Performance analyse

For alle test gælder følgende:

Udover de fremsatte performance krav på svartid, er der en række andre punkter, som bør analyseres for at vurdere servicens sundhed.

Følgende punkter bliver derfor undersøgt:

  • Svartid per kald
  • Antal kald per sekund
  • Cpu status
  • io på netværk
  • Hukommelses forbrug
  • Garbage collection
  • Kafka Consumer Lag

Undersøgelserne foregår vha. de forskellige log filer, som er genereret under performance testen. De følgende afsnit gennemgår de vigtigste tal fra disse filer:

  • JMeter log data belyser
    • Faktisk antal test iteration kørt
    • Throughput
    • (Ex: docker01.bo.stage.nsp.netic.dk-perflogs/minlog_listlogstatements_borger_stress01.nsp-test.netic.dk_master_20200309_110341.tar.gz.log)
  • Access log (applikations server information) belyser
    • Antal kald per sekund
    • Svartid
    • For rapporten vedr. forespørgsler gælder
      • De nedenstående grafer som er dannet fra denne log er lavet i splunk af Arosii.
      • (Denne log er ikke inkluderet da den indeholder personfølsomme data) 
  • vmstat log (system information) belyser
    • cpu status
    • skrivning til disk
    • Logning sker hver 10. sekund
    • (Ex: docker01.bo.stage.nsp.netic.dk/docker01.bo.stage.nsp.netic.dk-vmstat-20200309101455.log)
  • jstat log (JVM information) belyser
    • Hukommelse (heap) forbrug 
    • Garbage collection
    • Der er tidsstempel per log linie
    • (Ex: docker01.bo.stage.nsp.netic.dk/docker01.bo.stage.nsp.netic.dk-docker-jstat-gc-stage_bo_comp_minlog_backend_lookup.log)
  • docker stats log (container information) belyser
    • Hukommelse
    • io på netværk
    • Der er ikke noget fast logningsinterval
    • (Ex: docker01.bo.stage.nsp.netic.dk/docker01.bo.stage.nsp.netic.dk-docker-jstat-gc-stage_bo_comp_minlog_backend_lookup.log)
  • Kafka Consumer lag
    • Relevant ved registrering af data
    • Offsets og lag fordelt per topic og partition
    • Der er tidsstempel per log linie
    • (Ex kafka01.stage.nsp.netic.dk-kafka-consumer-group/minlog-kafka-backend.log)

Hver kørsel/iteration (øgning af belastning) har en start og slut tid. Filerne access.log og jstat.log indeholder tidstempler. Dette muliggør at de kan mappes til en given iteration. Filen vmstat har ikke tidstempel. Men da den er startet samtidig med jstat loggen og logintervallet er kendt på 10 sekunder, kan iterationernes placering i data beregnes. Docker stats loggen har hverken tidsstempel eller fast logninginterval, hvorfor tallene/graferne kun kan bruges som en generel betragtning over hele test perioden.

I det nedenstående kan man klikke på de enkelte grafer for større billede. De enkelte iterationer er tegnet ind som lodrette mørke streger; 2 streger per iteration (start og slut tidspunkt).

Scope og afvikling

Scope

Testene involverer følgende komponenter

  • MinLog 2 service
  • NSP kafka
  • Galera MariaDB cluster
  • NSP standard performance test framework

Versionen af MinLog2 og test frameworket varierer for hver test og fremgår nedenfor.

MinLog 2's overordnede arkitektur ses af følgende figur (kilde: arkitektur dokumentet)

Image Removed

Lookup/forespørgsler test vedrører kun "lookup" komponenten, da der ingen opdateringer (registration ) foregår imens, og der dermed heller ingen aktivitet er på "consumer" komponenten.  Dette betyder konkret, at de tilsendte log filer, som vedrører "consumer" komponenten ikke analyseres for lookup rapporterne.

Registration består af 2 komponenter: registration komponenten, som modtager input og gemmer data ned i sin "lokale" kafka. Data herfra flyttes af mirrorMaker over på den centrale kafka i backoffice. Og den anden komponent kafka-consumer, der tager fra den centrale kafka og flytter data i databasen.

Der er ikke målinger på database serveren (MariaDB).

Afvikling

Performance testen er afviklet på følgende måde

  • Testen er kørt på et test system opsat at Netic
  • Testen er lavet i standard NSP performance frameworket, udviklet af Arosii i JMeter.
  • Der er kørt en testplan med stadig øget belastning ved at øge antallet af tråde og noder indtil det målte throughput ikke længere vokser med tilsvarende mængde.
  • Testplanerne kører 15 minutter per iteration og for læsning hentes 30 entries per side.
  • System under test er kørt på 2 docker containere for lookup, og 4 containere for registration (docker01 og docker02 henholdsvis docker01, docker02, docker03 og docker04 i nedenstående)

Se iøvrigt MinLog 2 test performancetestvejledning for detaljer.

Performance krav

Performance krav til MinLog 2 Performance test er som følger:

98 % af tilfældene ≤ 5,5 sek
ServiceServicemål
Svartider opdatering95 % af tilfældene ≤ 6,5 sek
98 % af tilfældene ≤ 15,5 sek

Svartider forespørgsler

95 % af tilfældene ≤ 2,5 sek


MinLog2 - Performancetest rapport borger lookup

Performance testen består af en række kald til opslag efter logninger på forskellige cpr numre. Et sådant enkelt opslag vil svare til, hvad en borger vil udføre, skulle han ville se, hvad der er registreret om ham.

...

De følgende 2 grafer viser 95 % hendholdsvis 98 % percentil for kaldende. Grupperingen er 10 minutter:

Image ModifiedImage Modified

Det ses af graferne, at jo flere nodes/tråde jo højere bliver svar tiden overordnet set.

Den næste graf viser antal kald per sekund:

Image Modified

Af grafen fremgår det, at jo flere nodes og tråde (disse øges over tid, per iteration) jo flere kald kommer der igennem per sekund overordnet set. 

...

Udtræk omkring cpu fra denne log vises i de følgende grafer:

Image ModifiedImage Modified 

Data serier i grafen er:

...

Udtræk omkring io læs og skriv fra vmstat vises i de følgende grafer:

Image ModifiedImage Modified

Data serier i grafen er:

...

Udtræk omkring hukommelse og garbage collection fra denne log vises i de følgende grafer:

Image ModifiedImage Modified

Data serier i grafen er:

...

Udtræk omkring hukommelse, cpu og netværkstrafik vises i følgende grafer.

Hukommelse:

Image ModifiedImage Modified

Data serier i grafen er:

...

Cpu og hukommelse procent:

Image ModifiedImage Modified

Data serier i grafen er:

...

Servicen viser et stabilt forbrug af hukommelse. Den envendte cpu er svagt stigende som servicen bliver presset.

Netværk:

Image ModifiedImage Modified

Data serier i grafen er:

...

Analysen af performance test data  har ikke givet anledning til bekymring eller identificering af flaskehalse.

MinLog2 - Performancetest rapport medhjælper lookup

Performance testen består af en række kald til opslag efter logninger på forskellige cpr numre i medhjælper loggen. Et sådant enkelt opslag vil svare til en læge, der vil verificere, hvilke logninger en given medhjælper har givet anledning til.

...

De følgende 2 grafer viser 95 % hendholdsvis 98 % percentil for kaldende. Grupperingen er 10 minutter:

Image ModifiedImage Modified

Det ses af graferne, at svartiden ikke ændrer sig med flere nodes/tråde. Først til sidst i testen går den op.

Den næste graf viser antal kald per sekund:

Image Modified

Af grafen fremgår det, at jo flere nodes og tråde (disse øges over tid, per iteration) jo flere kald kommer der igennem per sekund overordnet set.

...

Udtræk omkring cpu fra denne log vises i de følgende grafer:

Image ModifiedImage Modified

Data serier i grafen er:

...

Udtræk omkring io læs og skriv fra vmstat vises i de følgende grafer:

Image ModifiedImage Modified

Data serier i grafen er:

...

Udtræk omkring hukommelse og garbage collection fra denne log vises i de følgende grafer:

Image ModifiedImage Modified

Data serier i grafen er:

...

Udtræk omkring hukommelse, cpu og netværkstrafik vises i følgende grafer.

Hukommelse:

Image ModifiedImage Modified

Data serier i grafen er:

...

Cpu og hukommelse procent:

Image ModifiedImage Modified

Data serier i grafen er:

...

Den envendte cpu er svagt stigende som servicen bliver presset. Og fra 10. iteration laver både docker1 og docker2 nogle høje spring i cpu forbruget.

Netværk:

Image ModifiedImage Modified

Data serier i grafen er:

...

De mange fejl, der ses i jmeter loggen kan skyldes at servicen på docker1 stopper med at svare og dermed melder "Internal Server Error" tilbage.

MinLog2 - Performancetest rapport minlog1 lookup

Performance testen består af en række kald til opslag efter logninger på forskellige cpr numre. Denne test er samme type som borger lookup. Den anvender dog istedet minlog1 formatet.

...

De følgende 2 grafer viser 95 % hendholdsvis 98 % percentil for kaldende. Grupperingen er 10 minutter:

Image ModifiedImage Modified

Det ses af graferne, at jo flere nodes/tråde jo højere bliver svar tiden overordnet set.

Den næste graf viser antal kald per sekund:

Image Modified

Af grafen fremgår det, at jo flere nodes og tråde (disse øges over tid, per iteration) jo flere kald kommer der igennem per sekund overordnet set. 

...

Udtræk omkring cpu fra denne log vises i de følgende grafer:

Image ModifiedImage Modified

Data serier i grafen er:

...

Udtræk omkring io læs og skriv fra vmstat vises i de følgende grafer:

Image ModifiedImage Modified

Data serier i grafen er:

...

Udtræk omkring hukommelse og garbage collection fra denne log vises i de følgende grafer:

Image ModifiedImage Modified

Data serier i grafen er:

...

Udtræk omkring hukommelse, cpu og netværkstrafik vises i følgende grafer.

Hukommelse:

Image ModifiedImage Modified

Data serier i grafen er:

...

Cpu og hukommelse procent:

Image ModifiedImage Modified

Data serier i grafen er:

...

Servicen viser et stabilt forbrug af hukommelse. Den envendte cpu er svagt stigende som servicen bliver presset.

Netværk:

Image ModifiedImage Modified

Data serier i grafen er:

...

Analysen af performance test data  har ikke givet anledning til bekymring eller identificering af flaskehalse.

MinLog2 - Performancetest rapport registration

Performance testen består af en række kald til registrering af minlog2 data med forskellige cpr numre. 

...

Udtræk af svartid og antal kald fordelt over testens løbetid vises i følgende grafer:

Image ModifiedImage Modified

Data serier i grafen er:

...

Udtræk omkring cpu fra denne log vises i de følgende grafer.

Image ModifiedImage Modified

Image ModifiedImage Modified

Data serier i grafen er:

...

Udtræk omkring io læs og skriv fra vmstat vises i de følgende grafer:

Image ModifiedImage Modified


Image ModifiedImage Modified

Data serier i grafen er:

...

Udtræk omkring hukommelse og garbage collection fra denne log vises i de følgende grafer.

Image ModifiedImage Modified


Image ModifiedImage Modified

Data serier i grafen er:

...

Udtræk omkring hukommelse, cpu netværkstrafik vises i følgende grafer.

Hukommelse:

Image ModifiedImage Modified


Image ModifiedImage Modified

Data serier i grafen er:

...

Cpu og hukommelse procent:

Image ModifiedImage Modified


Image ModifiedImage Modified

Data serier i grafen er:

...

  • Både forbruget af hukommelse og cpu er stabilt igennem testen.


Netværk:

Image ModifiedImage Modified


Image ModifiedImage Modified

Data serier i grafen er:

...

Udtræk omkring registerings komponentens kafka og lag i løbet af testen:

Image ModifiedImage Modified

Data serier i grafen er:

...

Udtræk omkring den centrale kafka og lag i løbet af testen:

Image Modified

Data serier i grafen er:

...