6. Folderstructuur server
6.1 Introductie
Net zoals het bij het datamodel is het belangrijk dat er een eenduidige folderstructuur aangehouden wordt op de geïnstalleerde server voor de werking van het model. In de configuratie wordt per ziekenhuis aangegeven waar het model naar de data moet zoeken. De data folder zelf hoeft dus niet op een bepaalde standaard plek op de server klaargezet te worden. Echter, binnen de data folder houden wij een standaard structuur aan. De folderstructuur die binnen de datafolder wordt verwacht wordt hieronder beschreven en getoond.
6.2 AIOC bestandsstructuur
Hier kan je informatie vinden over welke folder structuur het model verwacht en waar je de resultaten op kunt halen.
Lokale data management overzicht
De bestanden aangeleverd door het ziekenhuis komen binnen in een map aanleveringen
per aanlevering. De resultaten van het model kunnen vanuit de map epd_output
opgehaald worden en ingelezen worden in het EPD.
6.3 Folders
AIOC_DATA
De hoofdmap voor alle data m.b.t. het project AI ondersteund coderen. Hierin zal een submap komen voor dagopnames en klinische opnamen.
dagopnames
De hoofdmap voor alle dagopnames data. Hierin worden de aanleveringen, coderingen en epd_output mappen aangemaakt.
aanleveringen
In deze map (/.../AIOC_data/dagopnames/aanleveringen/
) levert het ziekenhuis de aanleverfolders aan. Elke folder dient behouden te blijven om aanleveringen te kunnen vergelijken en als back-up te fungeren.
Belangrijk! De naamgeving van de aanleverfolders moet volgens deze naamconventie: exportdatum_startjaarmaand_eindjaarmaand.
Hierbij is de exportdatum de datum dat de export is gemaakt of klaargezet, bijvoorbeeld 20240402.
Met startjaarmaand en eindjaarmaand bedoelen we de periode van de opnames die gecodeerd dienen te worden, bijvoorbeeld voor kwartaal 2 is dat: 202404_202406
Deze naamconventie geeft inzicht in het moment van klaarzetten van het exportbestand en de periode van de aangeleverde dagopnames. Hierdoor houden we een goed onderscheid en overzicht van de verschillende aanleveringen. Indien slechts een deel van een maand wordt aangeleverd, dan moet de gehele maand toch in de naamgeving worden opgenomen. Bijvoorbeeld, voor een gedeeltelijke aanlevering binnen de maand januari t/m maart 2024, klaargezet op 2 april, dan wordt de naamgeving van de aanleverfolder 20240402_202401_202403. In deze folder verwachten we de verschillende csv’s, zie punt 5.5 hieronder.
coderingen
In deze map maakt de AIOC applicatie een werkmap aan waar onder andere een kopie van de aangeleverde data, checkpoint bestanden en resultaten komen te staan. Dit is vooral een werkmap voor de data scientisten.
epd_output
In deze map worden de uiteindelijke resultaten/output bestanden klaargezet. Deze bestanden kunnen direct in het EPD geïmporteerd worden.
latest
In deze map wordt het laatste outputbestand van de AIOC applicatie geplaatst. Het bestand in deze map kan gebruikt worden om de resultaten te importeren in het EPD.
TRAIN_DATA (alleen voor trainingsziekenhuizen)
In deze map worden de trainingsdata opgeslagen. Deze map is alleen voor trainingsziekenhuizen en bevat data van meerdere jaren met ICD-10 codering om het model te trainen.
6.4 Aanleverbestanden vereisten
In de aanleverfolder zitten 3 verschillende bestanden:
opnames
verrichtingen
brieven (kan samengevoegd of los per document type aangeleverd worden)
Belangrijk! Voor het goed inlezen van de bestanden zijn de volgende zaken van belang:
De namen van deze bestanden zijn als volgt: opnames.csv, verrichtingen.csv en brieven.csv/documenten.csv/verslagen.csv (of als ze los worden aangeleverd: poli.csv, pa.csv, ontslag.csv, ok.csv en scopie.csv)
De bestanden dienen als csv aangeboden te worden met een UTF-8 encoding
Als delimiter moet ofwel een komma (
,
) of een semikomma (;
) worden gebruikt
epd_output
In deze map worden de uiteindelijke resultaten/output bestanden klaargezet. Deze bestanden kunnen direct in het EPD geïmporteerd worden.
latest
In deze map wordt het laatste outputbestand van de AIOC applicatie geplaatst. Het bestand in deze map kan gebruikt worden om de resultaten te importeren in het EPD.
TRAIN_DATA (alleen voor trainingsziekenhuizen)
In deze map worden de trainingsdata opgeslagen. Deze map is alleen voor trainingsziekenhuizen en bevat data van meerdere jaren met ICD-10 codering om het model te trainen.
6.4 Aanleverbestanden vereisten
In de aanleverfolder zitten 3 verschillende bestanden:
opnames
verrichtingen
brieven (kan samengevoegd of los per document type aangeleverd worden)
Belangrijk! Voor het goed inlezen van de bestanden zijn de volgende zaken van belang:
De namen van deze bestanden zijn als volgt: opnames.csv, verrichtingen.csv en brieven.csv/documenten.csv/verslagen.csv (of als ze los worden aangeleverd: poli.csv, pa.csv, ontslag.csv, ok.csv en scopie.csv)
De bestanden dienen als csv aangeboden te worden met een UTF-8 encoding
Als delimiter moet ofwel een komma (
,
) of een semikomma (;
) worden gebruikt