Licens av högkvalitativ hälsovård/medicinsk data för AI- och ML-modeller
Off-the-shelf Healthcare/Medical Dataset för att kickstarta ditt Healthcare AI-projekt
Plugga in de medicinska data du har saknat idag
Medicinska och hälsovårdande datamängder för maskininlärning
Läkarens diktering ljuddata
Vår avidentifierade datamängd för hälso- och sjukvård inkluderar 31 olika ljudfiler för specialiteter som dikterats av läkare som beskriver patienternas kliniska tillstånd och vårdplan baserat på läkarmottagning på sjukhus / klinisk miljö.
Off-the-shelf Physician Dikteringsljudfiler:
- 257,977 31 timmar av verkliga läkardikteringstaldataset från XNUMX specialiteter för att träna sjukvårdens talmodeller
- Dikteringsljud inspelat från olika enheter som telefondiktering (54.3 %), digital inspelare (24.9 %), talmikrofon (5.4 %), smarttelefon (2.7 %) och okänt (12.7 %)
- PII-redigerat ljud och transkript som följer Safe Harbor-riktlinjerna i enlighet med HIPAA
Transkriberade journaler
Med transkriberad journal avses utskrift av läkar- och patientsamtal, utskrift av läkarutlåtanden och medicinsk bedömning. Det hjälper till att kartlägga patientens sjukdomshistoria för framtida besök och fungerar också som en referenspunkt för läkarna. Det hjälper läkaren att utvärdera patientens nuvarande tillstånd och föreslå en lämplig behandling.
Off-the-shelf transkriberade journaler:
- Transkription av 257,977 31 timmar av verklig läkarediktering från XNUMX specialiteter för att träna hälsovårdens talmodeller
- Transkriberade journaler från olika arbetstyper som operationsrapport, utskrivningssammanfattning, konsultationsanteckning, erkännande, ED-anteckning, kliniknotis, röntgenrapport, etc.
- PII-redigerat ljud och transkript som följer Safe Harbor-riktlinjerna i enlighet med HIPAA
Electronic Health Records (EHR)
Electronic Health Records eller EHR är journaler som innehåller patientens medicinska historia, diagnoser, recept, behandlingsplaner, vaccinations- eller immuniseringsdatum, allergier, röntgenbilder (CT-skanning, MRI, röntgen) och laboratorietester med mera.
Off-the-shelf Electronic Health Records (EHR):
- 5.1M + registrerar och läkarens ljudfiler i 31 specialiteter
- Verkliga journaler med guldstandard för att träna Clinical NLP och andra Document AI-modeller
- Metadatainformation som MRN (Anonymiserad), Antagningsdatum, Utskrivningsdatum, Vistelsedagars längd, Kön, Patientklass, Betalare, Finansiell Klass, Stat, Utskrivningsdisposition, Ålder, DRG, DRG Beskrivning, $-ersättning, AMLOS, GMLOS, Risk för dödlighet, sjukdomens svårighetsgrad, Grouper, sjukhusets postnummer, etc.
- Medicinska journaler från olika delstater och regioner i USA - North East (46%), South (9%), Mellanvästern (3%), West (28%), Övriga (14%)
- Medicinska journaler som tillhör alla patientklasser som omfattas - slutenvård, öppenvård (klinisk, rehab, återkommande, kirurgisk dagvård), akut.
- Medicinska journaler tillhörande alla patientåldersgrupper <10 år (7.9%), 11-20 år (5.7%), 21-30 år (10.9%), 31-40 år (11.7%), 41-50 år (10.4% ), 51-60 år (13.8%), 61-70 år (16.1%), 71-80 år (13.3%), 81-90 år (7.8%), 90+ år (2.4%)
- Patienternas könsförhållande på 46 % (man) och 54 % (kvinna)
- PII-redigerade dokument som följer Safe Harbor-riktlinjerna i enlighet med HIPAA
- Medicinska journaler tillhörande alla patientåldersgrupper <10 år (7.9%), 11-20 år (5.7%), 21-30 år (10.9%), 31-40 år (11.7%), 41-50 år (10.4% ), 51-60 år (13.8%), 61-70 år (16.1%), 71-80 år (13.3%), 81-90 år (7.8%), 90+ år (2.4%)
- Patienternas könsförhållande på 46 % (man) och 54 % (kvinna)
- PII-redigerade dokument som följer Safe Harbor-riktlinjerna i enlighet med HIPAA
CT Scan Image Dataset
Läkare använder CT-bilden för att diagnostisera och upptäcka onormala eller normala tillstånd i en patients kropp (dvs. för att identifiera sjukdom eller skada i olika kroppsdelar). I den datoriserade bildbehandlingsdiagnosen går en CT-skanningsbild genom sofistikerade faser, nämligen förvärv, bildförbättring, extrahering av viktiga funktioner, identifiering av intresseområde (ROI), resultattolkning, etc.
Shaip tillhandahåller högkvalitativa datauppsättningar med CT-skanningar som är viktiga för forskning och medicinsk diagnos. Våra datauppsättningar inkluderar tusentals högupplösta bilder som samlats in från riktiga patienter och bearbetats med den senaste tekniken. Dessa datauppsättningar är utformade för att hjälpa medicinsk personal och forskare att förbättra sin kunskap och förståelse för olika medicinska tillstånd, inklusive cancer, neurologiska störningar och hjärt-kärlsjukdomar. Med Shaip kan du få tillgång till tillförlitlig och korrekt medicinsk data för att förbättra din forskning och förbättra patientresultaten.
MRI-bilddataset
Datorseendemodeller är designade för att härleda meningsfull information från digitala bilder och videor, enligt IBM. Det tillåter omfattande användning av sjukvårdsbilddata för att ge bättre diagnos, behandling och förutsägelse av sjukdomar. Den kan använda sammanhang från bildsekvensen, textur, form och konturinformation, såväl som tidigare kunskap, för att producera 3D- och 4D-information som hjälper till att förbättra mänsklig förståelse. Liksom CT-skanningar används MRI för att diagnostisera och upptäcka onormala eller normala tillstånd i en patients kropp (dvs. för att identifiera sjukdom eller skada i olika kroppsdelar).
Shaip tillhandahåller högkvalitativa MRI-bilddatauppsättningar som är viktiga för forskning och medicinsk diagnos. Våra datauppsättningar inkluderar tusentals högupplösta bilder som samlats in från riktiga patienter och bearbetats med den senaste tekniken.
Dataset för röntgenbild
Röntgentestning används för att verifiera objektets inre struktur och integritet. Röntgenbilder av ett testobjekt kan genereras vid olika positioner och olika energinivåer för att diagnostisera och upptäcka onormala tillstånd i en patients kropp.
Shaip tillhandahåller högkvalitativa röntgenbilduppsättningar som är viktiga för forskning och medicinsk diagnos. Våra datauppsättningar inkluderar tusentals högupplösta bilder som samlats in från riktiga patienter och bearbetats med den senaste tekniken. Med Shaip kan du få tillgång till tillförlitlig och korrekt medicinsk data för att förbättra din forskning och förbättra patientresultaten.
Hittar du inte det du letar efter?
Nya medicinska datauppsättningar från hyllan samlas in för alla datatyper
Kontakta oss nu för att släppa dina bekymmer för insamling av data för hälsoträning
Vanliga frågor (FAQ)
En hälsodatauppsättning är en samling hälsorelaterad data, ofta strukturerad och samlad för analys, forskning och beslutsfattande inom medicinska och hälsovårdsområden.
Exempel inkluderar elektroniska hälsojournaler (EHR), medicinska bilddatabaser, genomiska sekvenser, patientdemografi och datauppsättningar från bärbara hälsoapparater.
Datauppsättningar inom hälsovården stödjer medicinsk forskning genom att ge insikter i sjukdomsmönster, behandlingsresultat, patientbeteende, läkemedelseffekt med mera, och därigenom hjälpa till med medicinska framsteg och policybildning.
Vanliga format inkluderar CSV, Excel, DICOM (för medicinsk bildbehandling) och HL7 (för hälsojournaler).
Integritetsproblem uppstår från potentiellt missbruk av känslig patientinformation, vilket leder till identitetsstöld, diskriminering eller oönskad exponering för personlig hälsoinformation.
Patientinformation skyddas med avidentifiering (ta bort personlig identifierbar information), kryptering, strikta åtkomstkontroller och efterlevnad av regler som HIPAA (i USA).
För att säkerställa kvalitet, validera och rengör datasetet regelbundet, använd standardiserade datainsamlingsmetoder, korsreferens med tillförlitliga källor och involvera domänexperter för verifiering.