Förbättring av onkologisk NLP-forskning
Onkologisk dataprecision: licensiering, avidentifiering och anteckning för NLP-modellinnovation
Revolutionerar cancervård med banbrytande NLP-teknik
Kunden, en stor aktör inom hälso- och sjukvårdsindustrin, krävde en avancerad NLP-lösning för att behandla en betydande volym onkologiska journaler. Som en del av ett centralt initiativ för att förfina onkologisk forskning är behovet av att balansera detaljerad dataanalys med stränga integritetsstandarder av största vikt. Den här fallstudien beskriver våra bidrag till att förbättra kundens forskningsansträngningar genom högtrogna datakommentarer, rigorösa metoder för avidentifiering och tillämpning av Natural Language Processing (NLP)-tekniker, allt inom det regelverk som tillhandahålls av HIPAA.
Volym
Utmaningar
Projektet krävde en nyanserad förståelse av klinisk dokumentation, exakt identifiering av medicinska enheter och förmågan att applicera negationsetiketter korrekt, allt inom ett säkert ramverk som skyddar patientens integritet enligt HIPAA-reglerna. Strävan krävde inte bara teknisk expertis för att hantera stora mängder komplexa data utan också ett strategiskt tillvägagångssätt för att införliva feedback och upprätthålla kvalitet i alla stadier av annoteringsprocessen.
Detaljerad beskrivning av tjänster
Kategori | Beskrivning |
Omfattande klinisk datatäckning | Spänner över olika anteckningstyper, vårdinställningar och onkologiska subspecialiteter, vilket säkerställer en robust datauppsättning som återspeglar olika kliniska scenarier. |
Rigorös avidentifikation | Se till att alla märkta poster avidentifieras i enlighet med HIPAA:s Safe Harbor-metod, vilket säkerställer kundens förtroende för datasekretess och säkerhet. |
Riktlinjer för anteckningar | Skapande och implementering av standardriktlinjer för datakommentarer för att förbereda etiketterade poster i linje med HIPAA-standarder. |
Avancerade anteckningsstrategier | Manuell annotering av 10,000 XNUMX sidor med onkologirelaterade journaler utfördes med ett detaljerat fokus på att identifiera negationsstatus och annan relevant information i enlighet med fastställda riktlinjer. |
Rigorös kvalitetssäkring | Uppnå den specificerade kvalitetsstandard som beskrivs i riktlinjen |
Lösning
Vårt tillvägagångssätt involverade följande nyckelstrategier:
Anpassad sammanställning av onkologisk datauppsättning
Från ett stort arkiv med över 5 MN EHR extraherades en noggrant utvald delmängd av data, som syftade till att tillgodose klientens specialiserade krav på onkologisk data med fokus på genomiska enheter. Insamlingsprocessen innebar att skapa en uttömmande lista över tumörmarkörer, gener, varianter och TNM-stadier, genom att använda nyckelordssökningar för att lokalisera dokument som finns i överflöd av dessa data. Reguljära uttryck användes för att identifiera en rad genetiska variationer och cancerstadier. Detta tillvägagångssätt, i kombination med en bred datatäckning som omfattar olika dokumenttyper, specialiteter, vårdinställningar och data från flera läkare, säkerställde en omfattande och relevant onkologisk datauppsättning.
Rigorös avidentifikation
Processen följde strikt HIPAAs Safe Harbor-metod för avidentifiering, vilket garanterar kundens förtroende för datasekretess och säkerhet. Detta innebär att man tar bort all skyddad hälsoinformation (PHI) och ersätter den med märkta platshållare, för att därigenom bibehålla användbarheten av data samtidigt som patientens konfidentialitet skyddas.
Avidentifieringsvariabler
Kategori | underkategori |
Namn | Patientnamn, Läkarens namn, Sjuksköterskans namn, Familjemedlemsnamn, vårdcentralens namn, Klinikens namn, vårdhemmets namn, Företagsnamn, Universitetets namn |
Ålder | |
Datum | Datummönster, Månad Årsmönster, Dag Månadsmönster, Dag Årsmönster, Dag, Månad, År, Säsong |
Plats | Land, stat, stad, gata, postnummer, rumsnummer, svitnummer, våningsnummer |
ID | Personnummer, journalnummer, förmånstagarenummer för hälsoplanen, kontonummer, certifikat/licensnummer, biometriskt id, journal-id, anslutningsnummer, fordonets identifieringsnummer, registreringsskyltnummer Enhetsidentifierare och serienummer |
Kontakta oss | Telefonnummer, faxnummer, e-postadress, webbadress, IP-adress |
Exempelvis:
Den 25 september 2106, kl. 11:00, lades Harry Pace, 90 år gammal, in på Forrest General Hospital för en planerad höftoperation, tidigare konsulterad av sin primärvårdsläkare Dr. Jose Martin, och deltog av Kendra Reith, MD. Under sin vistelse var han under vård av Mary Hu, NP, och Suzan Ray, RN, med R. Charles Melancon, PA, som också konsulterades. Hans operation, som genomfördes samma dag som inläggningen, var framgångsrik utan rapporterade komplikationer. Efter operationen överfördes Mr. Pace till rum 202, våning 2, för återhämtning. Hans fru, Emma Pace, var närvarande hela tiden och fick alla nödvändiga uppdateringar. Under hans korta vistelse hanterades hans journaler, inklusive MRN MR99062619 och konto KV000014764, enligt standardprotokollen från Gracewood Nursing Home, hans tidigare bostad. Han skrevs ut senare samma dag till vård av Oakland poliklinik för ytterligare återhämtning. Under hela processen dokumenterades och säkrades alla procedurer med iakttagande av konfidentialitetsstandarder.
Exempel: Avidentifierad
On [Datummönster], klockan 11:00, Mr. [Patientnamn], åldrades [Ålder], blev antagen till [Namn på vårdcentralen] för en planerad höftoperation, tidigare konsulterad av sin primärvårdsläkare Dr. [Läkarens namn], och deltog av [Läkarens namn] MD. Under sin vistelse var han under vård av [Sjuksköterska], NP, och [Sjuksköterska], RN, med [Läkarens namn], PA, som också rådfrågas. Hans operation, som genomfördes samma dag som inläggningen, var framgångsrik utan rapporterade komplikationer. Efter operationen, Mr. [Patientnamn] överfördes till rum nr. [Rumsnummer], Våning nr. [Våningsnummer], för återhämtning. Hans fru, [familjemedlemsnamn], var närvarande hela tiden och fick alla nödvändiga uppdateringar. Under hans korta vistelse, hans journaler, inklusive MRN [Medicinnummer] och konto [Kontonummer], hanterades enligt standardprotokollen för [Namn på vårdhem], hans tidigare bostad. Han skrevs ut senare samma dag till vård av [Kliniknamn] för ytterligare återhämtning. Under hela processen dokumenterades och säkrades alla procedurer med iakttagande av konfidentialitetsstandarder.
Riktlinjer för anteckningar och avancerade anteckningstekniker
Shaip var avgörande för att upprätta och implementera standardriktlinjer för datakommentarer och säkerställde att alla etiketterade poster förbereddes konsekvent och i enlighet med HIPAA-standarder. Dessutom kommenterades 10,000 XNUMX sidor från olika medicinska journaler noggrant, med fokus på detaljerad märkning av negationsstatus och andra kliniskt relevanta enheter inklusive olika onkologiska subspecialiteter. Anteckningen utfördes av ett team av expertannotatorer med specialiserad kunskap inom onkologi och dataskyddsbestämmelser.
Komplexa anteckningskriterier
Kategori | underkategori |
Datumanteckning (onkologi) | Diagnosdatum, stadiumdatum, startdatum, procedurdatum, medeldatum för start, medeldatum slut, startdatum för strålning, slutdatum för strålning |
Sjukdom (onkologi) | Cancerproblem, histologi, klinisk status, kroppsplats, beteende, grad, cancerstadium, TNM-stadium, tumörmarkörtest, dimensioner, kod |
Behandling (onkologi) | Cancermedicin, Läkemedelsdosering, Frekvens, Cancerkirurgi, Operationsresultat, Strålningsmodalitet, Stråldosering |
Genomics | Variationskod, genstuderad, metod, prov |
negation | Negativ, möjlig negativ, osäker, möjlig positiv |
Klinisk NER | Cancerproblem – Kroppsplats, Histologi – Kroppsplats, Beteende – Kroppsplats, Cancerkirurgi – Relationer Kroppsplats, Strålningsmodalitet – Kroppsplats, Histologi – Grad, Cancerproblem – Dimension |
Exempelvis:
Uttalande om onkologi klinisk anmärkning
"Patienten Jane Doe diagnostiserades med steg IIIB icke-småcellig lungcancer (NSCLC), specifikt adenokarcinom, den 03/05/2023. Cancern ligger i den högra nedre lungloben. Den klassificeras som T3N2M0 enligt TNM-stadiesystemet, med en tumörstorlek på 5 cm x 3 cm. En EGFR-exon 19-deletion identifierades genom PCR-analys av tumörbiopsiprovet. Kemoterapi med Carboplatin AUC 5 och Pemetrexed 500 mg/m² inleddes 03-20-2023 och ska administreras var tredje vecka. Extern strålbehandling (EBRT) med en dos på 3 Gy i 60 fraktioner påbörjades 30-04-01. Patientens behandling pågår och det finns inga tecken på hjärnmetastaser på den senaste MRT. Möjligheten för lymfvaskulär invasion är ännu inte fastställd, och patientens tolerans för hela kemoterapiregimen är fortfarande osäker.
Uttalande om onkologi klinisk anmärkning
Rigorös kvalitetssäkring
Implementerade ett flexibelt ramverk för projektledning som underlättade effektiv integrering av kundfeedback samtidigt som stränga kvalitetsstandarder upprätthölls. Ett omfattande kvalitetssäkringsprotokoll tillämpades, i linje med riktlinjerna för att nå de erforderliga kvalitetsriktmärkena. Detta protokoll innehöll successiva omgångar av granskning och verifiering, vilket säkerställde precisionen och tillförlitligheten hos de kommenterade data. En sådan noggrann kvalitetskontroll är avgörande för att skapa en pålitlig NLP-lösning, avgörande för välgrundat kliniskt beslutsfattande och forskningsexpertis.
Resultat
Levererade framgångsrikt 10,000 XNUMX högkvalitativa, avidentifierade etiketterade poster, vilket ger en säker och värdefull datauppsättning för kundens NLP-modellutveckling. Den noggranna tillämpningen av NLP och efterlevnaden av HIPAA-avidentifieringsstandarder resulterade i en mycket förfinad datauppsättning som kommer att stödja klientens pågående och framtida onkologiska forskningsinsatser, i slutändan som syftar till att förbättra onkologiska patientresultat och vårdleveranseffektivitet.
Framgången med projektet illustrerar vår förmåga att hantera komplexa medicinska data med precision, vilket bidrar till kundens mål att förbättra patientvårdens resultat och påskynda takten i vårdens innovationer.
Vårt partnerskap med Shaip har varit avgörande för att utveckla våra NLP-förmågor inom onkologidomänen. Den professionella hanteringen av 10,000 XNUMX medicinska journaler, kommenterade med detaljerad negation och andra kliniska enheter, visade deras engagemang för excellens och efterlevnad. Dessutom har deras engagemang för integritetsstandarder som HIPAA gett oss ovärderliga resurser för att driva våra AI-initiativ för att utveckla banbrytande onkologiska behandlingar och diagnostik framåt.