Förbättring av onkologisk NLP-forskning

Onkologisk dataprecision: licensiering, avidentifiering och anteckning för NLP-modellinnovation

Onkologi nlp

Revolutionerar cancervård med banbrytande NLP-teknik

Kunden, en stor aktör inom hälso- och sjukvårdsindustrin, krävde en avancerad NLP-lösning för att behandla en betydande volym onkologiska journaler. Som en del av ett centralt initiativ för att förfina onkologisk forskning är behovet av att balansera detaljerad dataanalys med stränga integritetsstandarder av största vikt. Den här fallstudien beskriver våra bidrag till att förbättra kundens forskningsansträngningar genom högtrogna datakommentarer, rigorösa metoder för avidentifiering och tillämpning av Natural Language Processing (NLP)-tekniker, allt inom det regelverk som tillhandahålls av HIPAA.

Volym

Datalicensiering + Data De-id
10 sidor
Onkologiska relationer
10 sidor
Icke onkologisk domän
10 sidor
negation
10 sidor
Onkologisk domän
10 sidor
NER + Relationskartläggning
10 sidor

Utmaningar

Projektet krävde en nyanserad förståelse av klinisk dokumentation, exakt identifiering av medicinska enheter och förmågan att applicera negationsetiketter korrekt, allt inom ett säkert ramverk som skyddar patientens integritet enligt HIPAA-reglerna. Strävan krävde inte bara teknisk expertis för att hantera stora mängder komplexa data utan också ett strategiskt tillvägagångssätt för att införliva feedback och upprätthålla kvalitet i alla stadier av annoteringsprocessen.

Mål

Detaljerad beskrivning av tjänster

KategoriBeskrivning
Omfattande klinisk datatäckningSpänner över olika anteckningstyper, vårdinställningar och onkologiska subspecialiteter, vilket säkerställer en robust datauppsättning som återspeglar olika kliniska scenarier.
Rigorös avidentifikationSe till att alla märkta poster avidentifieras i enlighet med HIPAA:s Safe Harbor-metod, vilket säkerställer kundens förtroende för datasekretess och säkerhet.
Riktlinjer för anteckningarSkapande och implementering av standardriktlinjer för datakommentarer för att förbereda etiketterade poster i linje med HIPAA-standarder.
Avancerade anteckningsstrategierManuell annotering av 10,000 XNUMX sidor med onkologirelaterade journaler utfördes med ett detaljerat fokus på att identifiera negationsstatus och annan relevant information i enlighet med fastställda riktlinjer.
Rigorös kvalitetssäkringUppnå den specificerade kvalitetsstandard som beskrivs i riktlinjen

Lösning

Vårt tillvägagångssätt involverade följande nyckelstrategier:

Anpassad sammanställning av onkologisk datauppsättning

Från ett stort arkiv med över 5 MN EHR extraherades en noggrant utvald delmängd av data, som syftade till att tillgodose klientens specialiserade krav på onkologisk data med fokus på genomiska enheter. Insamlingsprocessen innebar att skapa en uttömmande lista över tumörmarkörer, gener, varianter och TNM-stadier, genom att använda nyckelordssökningar för att lokalisera dokument som finns i överflöd av dessa data. Reguljära uttryck användes för att identifiera en rad genetiska variationer och cancerstadier. Detta tillvägagångssätt, i kombination med en bred datatäckning som omfattar olika dokumenttyper, specialiteter, vårdinställningar och data från flera läkare, säkerställde en omfattande och relevant onkologisk datauppsättning.

Sammanställning av onkologisk datauppsättning

Rigorös avidentifikation

Processen följde strikt HIPAAs Safe Harbor-metod för avidentifiering, vilket garanterar kundens förtroende för datasekretess och säkerhet. Detta innebär att man tar bort all skyddad hälsoinformation (PHI) och ersätter den med märkta platshållare, för att därigenom bibehålla användbarheten av data samtidigt som patientens konfidentialitet skyddas.

Avidentifieringsvariabler

Kategoriunderkategori
Namn Patientnamn, Läkarens namn, Sjuksköterskans namn, Familjemedlemsnamn, vårdcentralens namn, Klinikens namn, vårdhemmets namn, Företagsnamn, Universitetets namn
Ålder 
DatumDatummönster, Månad Årsmönster, Dag Månadsmönster, Dag Årsmönster, Dag, Månad, År, Säsong
PlatsLand, stat, stad, gata, postnummer, rumsnummer, svitnummer, våningsnummer
IDPersonnummer, journalnummer, förmånstagarenummer för hälsoplanen, kontonummer, certifikat/licensnummer, biometriskt id, journal-id, anslutningsnummer, fordonets identifieringsnummer, registreringsskyltnummer Enhetsidentifierare och serienummer
Kontakta ossTelefonnummer, faxnummer, e-postadress, webbadress, IP-adress

Exempelvis:

Den 25 september 2106, kl. 11:00, lades Harry Pace, 90 år gammal, in på Forrest General Hospital för en planerad höftoperation, tidigare konsulterad av sin primärvårdsläkare Dr. Jose Martin, och deltog av Kendra Reith, MD. Under sin vistelse var han under vård av Mary Hu, NP, och Suzan Ray, RN, med R. Charles Melancon, PA, som också konsulterades. Hans operation, som genomfördes samma dag som inläggningen, var framgångsrik utan rapporterade komplikationer. Efter operationen överfördes Mr. Pace till rum 202, våning 2, för återhämtning. Hans fru, Emma Pace, var närvarande hela tiden och fick alla nödvändiga uppdateringar. Under hans korta vistelse hanterades hans journaler, inklusive MRN MR99062619 och konto KV000014764, enligt standardprotokollen från Gracewood Nursing Home, hans tidigare bostad. Han skrevs ut senare samma dag till vård av Oakland poliklinik för ytterligare återhämtning. Under hela processen dokumenterades och säkrades alla procedurer med iakttagande av konfidentialitetsstandarder.

Exempel: Avidentifierad

On [Datummönster], klockan 11:00, Mr. [Patientnamn], åldrades [Ålder], blev antagen till [Namn på vårdcentralen] för en planerad höftoperation, tidigare konsulterad av sin primärvårdsläkare Dr. [Läkarens namn], och deltog av [Läkarens namn] MD. Under sin vistelse var han under vård av [Sjuksköterska], NP, och [Sjuksköterska], RN, med [Läkarens namn], PA, som också rådfrågas. Hans operation, som genomfördes samma dag som inläggningen, var framgångsrik utan rapporterade komplikationer. Efter operationen, Mr. [Patientnamn] överfördes till rum nr. [Rumsnummer], Våning nr. [Våningsnummer], för återhämtning. Hans fru, [familjemedlemsnamn], var närvarande hela tiden och fick alla nödvändiga uppdateringar. Under hans korta vistelse, hans journaler, inklusive MRN [Medicinnummer] och konto [Kontonummer], hanterades enligt standardprotokollen för [Namn på vårdhem], hans tidigare bostad. Han skrevs ut senare samma dag till vård av [Kliniknamn] för ytterligare återhämtning. Under hela processen dokumenterades och säkrades alla procedurer med iakttagande av konfidentialitetsstandarder.

Riktlinjer för anteckningar och avancerade anteckningstekniker

Shaip var avgörande för att upprätta och implementera standardriktlinjer för datakommentarer och säkerställde att alla etiketterade poster förbereddes konsekvent och i enlighet med HIPAA-standarder. Dessutom kommenterades 10,000 XNUMX sidor från olika medicinska journaler noggrant, med fokus på detaljerad märkning av negationsstatus och andra kliniskt relevanta enheter inklusive olika onkologiska subspecialiteter. Anteckningen utfördes av ett team av expertannotatorer med specialiserad kunskap inom onkologi och dataskyddsbestämmelser.

Komplexa anteckningskriterier

Kategoriunderkategori
Datumanteckning (onkologi)Diagnosdatum, stadiumdatum, startdatum, procedurdatum, medeldatum för start, medeldatum slut, startdatum för strålning, slutdatum för strålning
Sjukdom (onkologi)Cancerproblem, histologi, klinisk status, kroppsplats, beteende, grad, cancerstadium, TNM-stadium, tumörmarkörtest, dimensioner, kod
Behandling (onkologi)Cancermedicin, Läkemedelsdosering, Frekvens, Cancerkirurgi, Operationsresultat, Strålningsmodalitet, Stråldosering
GenomicsVariationskod, genstuderad, metod, prov
negationNegativ, möjlig negativ, osäker, möjlig positiv
Klinisk NERCancerproblem – Kroppsplats, Histologi – Kroppsplats, Beteende – Kroppsplats, Cancerkirurgi – Relationer Kroppsplats, Strålningsmodalitet – Kroppsplats, Histologi – Grad, Cancerproblem – Dimension

Exempelvis:

Utlåtande om onkologisk klinisk not

Uttalande om onkologi klinisk anmärkning

"Patienten Jane Doe diagnostiserades med steg IIIB icke-småcellig lungcancer (NSCLC), specifikt adenokarcinom, den 03/05/2023. Cancern ligger i den högra nedre lungloben. Den klassificeras som T3N2M0 enligt TNM-stadiesystemet, med en tumörstorlek på 5 cm x 3 cm. En EGFR-exon 19-deletion identifierades genom PCR-analys av tumörbiopsiprovet. Kemoterapi med Carboplatin AUC 5 och Pemetrexed 500 mg/m² inleddes 03-20-2023 och ska administreras var tredje vecka. Extern strålbehandling (EBRT) med en dos på 3 Gy i 60 fraktioner påbörjades 30-04-01. Patientens behandling pågår och det finns inga tecken på hjärnmetastaser på den senaste MRT. Möjligheten för lymfvaskulär invasion är ännu inte fastställd, och patientens tolerans för hela kemoterapiregimen är fortfarande osäker.

Uttalande om onkologi klinisk anmärkning

Utlåtande om onkologisk klinisk not

Rigorös kvalitetssäkring

Implementerade ett flexibelt ramverk för projektledning som underlättade effektiv integrering av kundfeedback samtidigt som stränga kvalitetsstandarder upprätthölls. Ett omfattande kvalitetssäkringsprotokoll tillämpades, i linje med riktlinjerna för att nå de erforderliga kvalitetsriktmärkena. Detta protokoll innehöll successiva omgångar av granskning och verifiering, vilket säkerställde precisionen och tillförlitligheten hos de kommenterade data. En sådan noggrann kvalitetskontroll är avgörande för att skapa en pålitlig NLP-lösning, avgörande för välgrundat kliniskt beslutsfattande och forskningsexpertis.

Resultat

Levererade framgångsrikt 10,000 XNUMX högkvalitativa, avidentifierade etiketterade poster, vilket ger en säker och värdefull datauppsättning för kundens NLP-modellutveckling. Den noggranna tillämpningen av NLP och efterlevnaden av HIPAA-avidentifieringsstandarder resulterade i en mycket förfinad datauppsättning som kommer att stödja klientens pågående och framtida onkologiska forskningsinsatser, i slutändan som syftar till att förbättra onkologiska patientresultat och vårdleveranseffektivitet.

Framgången med projektet illustrerar vår förmåga att hantera komplexa medicinska data med precision, vilket bidrar till kundens mål att förbättra patientvårdens resultat och påskynda takten i vårdens innovationer.

Vårt partnerskap med Shaip har varit avgörande för att utveckla våra NLP-förmågor inom onkologidomänen. Den professionella hanteringen av 10,000 XNUMX medicinska journaler, kommenterade med detaljerad negation och andra kliniska enheter, visade deras engagemang för excellens och efterlevnad. Dessutom har deras engagemang för integritetsstandarder som HIPAA gett oss ovärderliga resurser för att driva våra AI-initiativ för att utveckla banbrytande onkologiska behandlingar och diagnostik framåt.

Gyllene-5-stjärniga

Accelerera din Healthcare AI
applikationsutveckling med 100%