Onkologisk dataprecision: licensiering, avidentifiering och anteckning för NLP-modellinnovation
Revolutionerar cancervård med banbrytande NLP-teknik.
Projektöversikt
Kunden, en stor aktör inom hälso- och sjukvårdsindustrin, krävde en avancerad NLP-lösning för att behandla en betydande volym onkologiska journaler. Som en del av ett centralt initiativ för att förfina onkologisk forskning är behovet av att balansera detaljerad dataanalys med stränga integritetsstandarder av största vikt. Den här fallstudien beskriver våra bidrag till att förbättra kundens forskningsansträngningar genom högtrogna datakommentarer, rigorösa metoder för avidentifiering och tillämpning av Natural Language Processing (NLP)-tekniker, allt inom det regelverk som tillhandahålls av HIPAA.

Nyckelstatistik
Datalicensiering
+ Data De-id
10,000 sidor
Icke onkologi
Domän
10,000 sidor
Onkologi
Domän
10,000 sidor
Onkologi
Förhållanden
4500 sidor
negation
9000 sidor
NER + Förhållande
Kartläggning
1223 sidor
Utmaningar
Projektet krävde en nyanserad förståelse av klinisk dokumentation, exakt identifiering av medicinska enheter och förmågan att applicera negationsetiketter korrekt, allt inom ett säkert ramverk som skyddar patientens integritet enligt HIPAA-reglerna. Strävan krävde inte bara teknisk expertis för att hantera stora mängder komplexa data utan också ett strategiskt tillvägagångssätt för att införliva feedback och upprätthålla kvalitet i alla stadier av annoteringsprocessen.
Detaljerad beskrivning av tjänster:
- Omfattande klinisk datatäckning: Spänner över olika typer av anteckningar, vårdinställningar och onkologiska subspecialiteter, vilket säkerställer en robust datauppsättning som återspeglar olika kliniska scenarier.
- Rigorös avidentifikation: Se till att alla märkta poster avidentifieras i enlighet med HIPAA:s Safe Harbor-metod, vilket säkerställer kundens förtroende för datasekretess och säkerhet.
- Riktlinjer för anteckningar: Skapande och implementering av standardriktlinjer för datakommentarer för att förbereda etiketterade poster i linje med HIPAA-standarder.
- Avancerade anteckningstekniker: Tillämpning av NLP på 10,000 XNUMX sidor med onkologirelaterade journaler, som involverar intrikat märkning av negationsstatus och andra relevanta detaljer enligt tidigare fastställda riktlinjer.
- Rigorös kvalitetssäkring: Uppnå den specificerade kvalitetsstandard som beskrivs i riktlinjen.
Lösning
Vårt tillvägagångssätt involverade följande nyckelstrategier:
Omfattande klinisk datatäckning
För att skräddarsy datasetet efter kundens specifika behov extraherades ett målinriktat urval av data noggrant från Shaips omfattande arkiv med över 5 miljoner elektroniska hälsojournaler. Denna kurerade datauppsättning omfattade en mängd olika typer av anteckningar och vårdinställningar, vilket gav en rik och mångsidig
spektrum av kliniska scenarier. Detta säkerställer en datauppsättning som inte bara är heltäckande utan också mycket representativ för medicinska data från verkliga världen.
Rigorös avidentifikation
Processen följde strikt HIPAAs Safe Harbor-metod för avidentifiering, vilket garanterar kundens förtroende för datasekretess och säkerhet. Detta innebär att man tar bort all skyddad hälsoinformation (PHI) och ersätter den med märkta platshållare, för att därigenom bibehålla användbarheten av data samtidigt som patientens konfidentialitet skyddas.
Avidentifieringsvariabler
Kategori | underkategori |
---|---|
Namn | Patientnamn, Läkarens namn, Sjuksköterskans namn, Familjemedlemsnamn, vårdcentralens namn, Klinikens namn, vårdhemmets namn, Företagsnamn, Universitetets namn |
Ålder | |
Datum | Datummönster, Månad Årsmönster, Dag Månadsmönster, Dag Årsmönster, Dag, Månad, År, Säsong |
Plats | Land, stat, stad, gata, postnummer, rumsnummer, svitnummer, våningsnummer |
ID | Personnummer, journalnummer, förmånstagarenummer för hälsoplanen, kontonummer, certifikat-/licensnummer, biometriskt id, journal-id, anslutningsnummer, fordonets identifieringsnummer, registreringsskyltnummer Enhetsidentifierare och serienummer |
Kontakta oss | Telefonnummer, faxnummer, e-postadress, webbadress, IP-adress |
Exempelvis:
Den 25 september 2106, kl. 11:00, lades Harry Pace, 90 år gammal, in på Forrest General Hospital för en planerad höftoperation, tidigare konsulterad av sin primärvårdsläkare Dr. Jose Martin, och deltog av Kendra Reith, MD. Under sin vistelse var han under vård av Mary Hu, NP, och Suzan Ray, RN, med R. Charles Melancon, PA, som också konsulterades. Hans operation, som genomfördes samma dag som inläggningen, var framgångsrik utan rapporterade komplikationer. Efter operationen överfördes Mr. Pace till rum 202, våning 2, för återhämtning. Hans fru, Emma Pace, var närvarande hela tiden och fick alla nödvändiga uppdateringar. Under hans korta vistelse hanterades hans journaler, inklusive MRN MR99062619 och konto KV000014764, enligt standardprotokollen från Gracewood Nursing Home, hans tidigare bostad. Han skrevs ut senare samma dag till vård av Oakland poliklinik för ytterligare återhämtning. Under hela processen dokumenterades och säkrades alla procedurer med iakttagande av konfidentialitetsstandarder.
Exempel: Avidentifierad
On [Datummönster], klockan 11:00, Mr. [Patientnamn], åldrad [Ålder], blev antagen till [Namn på vårdcentralen] för en planerad höftoperation, tidigare konsulterad av sin primärvårdsläkare Dr. [Läkarens namn], och deltog av [Läkarens namn] MD. Under sin vistelse var han under vård av [Sjuksköterska]NP, och [Sjuksköterska], RN, med [Läkarens namn], PA, som också rådfrågas. Hans operation, som genomfördes samma dag som inläggningen, var framgångsrik utan rapporterade komplikationer. Efter operationen, Mr. [Patientnamn] överfördes till rum nr. [Rumsnummer], Våning nr. [Våningsnummer], för återhämtning. Hans fru, [Familjemedlemsnamn], var närvarande hela tiden och fick alla nödvändiga uppdateringar. Under hans korta vistelse, hans journaler, inklusive MRN [Medicinnummer] och konto [Kontonummer], hanterades enligt standardprotokollen för [Namn på vårdhem], hans tidigare bostad. Han skrevs ut senare samma dag till vård av [Kliniknamn] för ytterligare återhämtning. Under hela processen dokumenterades och säkrades alla procedurer med iakttagande av konfidentialitetsstandarder.
Riktlinjer för anteckningar och avancerade anteckningstekniker
Shaip var avgörande för att upprätta och implementera standardriktlinjer för datakommentarer och säkerställde att alla etiketterade poster förbereddes konsekvent och i enlighet med HIPAA-standarder. Dessutom var 10,000 XNUMX sidor från olika journaler minutiöst kommenterade, med
ett fokus på den detaljerade märkningen av negationsstatus och andra kliniskt relevanta enheter inklusive olika onkologiska subspecialiteter. Anteckningen utfördes av ett team av expertannotatorer med specialiserad kunskap inom onkologi och dataskyddsbestämmelser.
Komplex anteckning
Kategori | underkategori |
---|---|
Datum anteckning (Onkologi) | Diagnosdatum, stadiumdatum, startdatum, procedurdatum, med. startdatum, medeldatum slut, Strålningsdatum började, strålningsdatum slutade |
Sjukdom (Onkologi) | Cancerproblem, histologi, klinisk status, kroppsplats, beteende, grad, cancerstadium, TNM-stadium, tumörmarkörtest, dimensioner, kod |
Behandlning (Onkologi) | Cancermedicin, Läkemedelsdosering, Frekvens, Cancerkirurgi, Operationsresultat, Strålningsmodalitet, Stråldosering |
Genomics | Variationskod, genstuderad, metod, prov |
negation | Negativ, möjlig negativ, osäker, möjlig positiv |
Klinisk NER Förhållanden | Cancerproblem – Kroppsplats, Histologi – Kroppsplats, Beteende – Kroppsplats, Cancerkirurgi – Kroppsplats, Strålningsmodalitet – Kroppsplats, Histologi – Grad, Cancerproblem – Dimension |
Exempelvis:
Uttalande om onkologi klinisk anmärkning
"Patienten Jane Doe diagnostiserades med steg IIIB icke-småcellig lungcancer (NSCLC), specifikt adenokarcinom, den 03/05/2023. Cancern ligger i den högra nedre lungloben. Den klassificeras som T3N2M0 enligt TNM-stadiesystemet, med en tumörstorlek på 5 cm x 3 cm. En EGFR-exon 19-deletion identifierades genom PCR-analys av tumörbiopsiprovet. Kemoterapi med Carboplatin AUC 5 och Pemetrexed 500 mg/m² inleddes 03-20-2023 och ska administreras var tredje vecka. Extern strålbehandling (EBRT) med en dos på 3 Gy i 60 fraktioner påbörjades 30-04-01. Patientens behandling pågår och det finns inga tecken på hjärnmetastaser på den senaste MRT. Möjligheten för lymfvaskulär invasion är ännu inte fastställd, och patientens tolerans för hela kemoterapiregimen är fortfarande osäker.
Uttalande om onkologi klinisk notering:
Rigorös kvalitetssäkring
Implementerade ett flexibelt ramverk för projektledning som underlättade effektiv integration av kundfeedback samtidigt som stränga kvalitetsstandarder upprätthölls. Ett omfattande kvalitetssäkringsprotokoll tillämpades, i linje med riktlinjerna för att nå de erforderliga kvalitetsriktmärkena. Detta protokoll innehöll successiva omgångar av granskning och verifiering, vilket säkerställde precisionen och tillförlitligheten hos de kommenterade data. En sådan noggrann kvalitetskontroll är avgörande för att skapa en pålitlig NLP-lösning, avgörande för välgrundat kliniskt beslutsfattande och forskningsexpertis.
Den Utfall
Levererade framgångsrikt 10,000 XNUMX högkvalitativa, avidentifierade etiketterade poster, vilket ger en säker och värdefull datauppsättning för kundens NLP-modellutveckling. Den noggranna tillämpningen av NLP och efterlevnaden av HIPAA-avidentifieringsstandarder resulterade i en mycket förfinad datauppsättning som kommer att stödja klientens pågående och framtida onkologiska forskningsinsatser, i slutändan som syftar till att förbättra onkologiska patientresultat och vårdleveranseffektivitet.
Framgången med projektet illustrerar vår förmåga att hantera komplexa medicinska data med precision, vilket bidrar till kundens mål att förbättra patientvårdens resultat och påskynda takten i vårdens innovationer.
Vårt partnerskap med Shaip har varit avgörande för att utveckla våra NLP-förmågor inom onkologidomänen. Den professionella hanteringen av 10,000 XNUMX medicinska journaler, kommenterade med detaljerad negation och andra kliniska enheter, visade deras engagemang för excellens och efterlevnad. Dessutom har deras engagemang för integritetsstandarder som HIPAA gett oss ovärderliga resurser för att driva våra AI-initiativ för att utveckla banbrytande onkologiska behandlingar och diagnostik framåt.