Licens av högkvalitativ hälsovård/medicinsk data för AI- och ML-modeller

Off-the-shelf Healthcare/Medical Dataset för att kickstarta ditt Healthcare AI-projekt

Medicinsk datakatalog

Medicinska och hälsovårdande datamängder för maskininlärning

Läkarens diktering ljuddata

Vårt avidentifierade dataset för hälso- och sjukvård innehåller ljudfiler från 31 specialiteter, dikterade av läkare som beskriver patienters kliniska tillstånd och vårdplan baserat på läkar-patientmöten i klinisk miljö.

Off-the-shelf Physician Dikteringsljudfiler:

  • 257,977 31 timmar datauppsättning om verklig läkares dikteringstal från XNUMX specialiteter för att träna talmodeller inom hälso- och sjukvården
  • Dikteringsljud inspelat från olika enheter som telefondiktering (54.3 %), digital inspelare (24.9 %), talmikrofon (5.4 %), smarttelefon (2.7 %) och okänt (12.7 %)
  • PII-redigerat ljud och transkript som följer Safe Harbor-riktlinjerna i enlighet med HIPAA
Läkarens diktering ljuddata

Transkriberade journaler

Transkriberade patientjournaler avser transkription av samtal mellan läkare och patienter, transkription av medicinska rapporter och medicinska bedömningar. Det hjälper till att kartlägga patientens sjukdomshistoria inför framtida besök och fungerar även som en referenspunkt för läkarna. Det hjälper till att utvärdera patientens nuvarande tillstånd och föreslå lämplig behandling.

Off-the-shelf transkriberade journaler:

  • Transkription av 257,977 31 timmar av verklig läkarediktering från XNUMX specialiteter för att träna hälsovårdens talmodeller
  • Transkriberade journaler från olika arbetstyper som operationsrapport, utskrivningssammanfattning, konsultationsanteckning, erkännande, ED-anteckning, kliniknotis, röntgenrapport, etc.
  • PII-redigerat ljud och transkript som följer Safe Harbor-riktlinjerna i enlighet med HIPAA
Transkriberade medicinska journaler

Electronic Health Records (EHR)

Electronic Health Records eller EHR är journaler som innehåller patientens medicinska historia, diagnoser, recept, behandlingsplaner, vaccinations- eller immuniseringsdatum, allergier, röntgenbilder (CT-skanning, MRI, röntgen) och laboratorietester med mera.

Off-the-shelf Electronic Health Records (EHR):

  • 5.1M + registrerar och läkarens ljudfiler i 31 specialiteter
  • Verkliga journaler med guldstandard för att träna Clinical NLP och andra Document AI-modeller
  • Metadatainformation som MRN (Anonymiserad), Antagningsdatum, Utskrivningsdatum, Vistelsedagars längd, Kön, Patientklass, Betalare, Finansiell Klass, Stat, Utskrivningsdisposition, Ålder, DRG, DRG Beskrivning, $-ersättning, AMLOS, GMLOS, Risk för dödlighet, sjukdomens svårighetsgrad, Grouper, sjukhusets postnummer, etc.
  • Medicinska journaler från olika delstater och regioner i USA - North East (46%), South (9%), Mellanvästern (3%), West (28%), Övriga (14%)
  • Medicinska journaler som tillhör alla patientklasser som omfattas - slutenvård, öppenvård (klinisk, rehab, återkommande, kirurgisk dagvård), akut.
Elektroniska journaler (ehr)
  • Medicinska journaler tillhörande alla patientåldersgrupper <10 år (7.9%), 11-20 år (5.7%), 21-30 år (10.9%), 31-40 år (11.7%), 41-50 år (10.4% ), 51-60 år (13.8%), 61-70 år (16.1%), 71-80 år (13.3%), 81-90 år (7.8%), 90+ år (2.4%)
  • Patienternas könsförhållande på 46 % (man) och 54 % (kvinna)
  • PII-redigerade dokument som följer Safe Harbor-riktlinjerna i enlighet med HIPAA
Shaip kontakta oss

Hittar du inte det du letar efter?

Nya medicinska datauppsättningar från hyllan samlas in för alla datatyper 

Kontakta oss nu för att släppa dina bekymmer för insamling av data för hälsoträning

  • Genom att registrera mig godkänner jag Shaip Integritetspolicy och Användarvillkor och ge mitt samtycke till att ta emot B2B marknadsföringskommunikation från Shaip.

Medicinska datamängder inkluderar hälso- och sjukvårdsdata såsom läkares diktering, transkriberade journaler, elektroniska patientjournaler och medicinska bilder (CT, MRI, röntgen) som används för att träna AI-modeller.

Ja, datamängderna följer hälso- och sjukvårdsföreskrifter som HIPAA och GDPR för att säkerställa säker och etisk dataanvändning.

Ja, datamängder kan skräddarsys baserat på specifika specialiteter, demografi, dataformat och projektkrav.

Data genomgår rigorösa kvalitetskontroller, inklusive annoteringar av domänexperter, för att säkerställa noggrannhet och tillförlitlighet. Varje dataset är utformat för att uppfylla guldstandardkraven.

Ja, datamängderna är skalbara för att möta både små och stora projektkrav, inklusive miljontals poster eller timmar av ljud.

Ja, datamängderna tillhandahålls i färdiga format (t.ex. JSON, CSV) för sömlös integration med befintliga AI- och ML-arbetsflöden.

Kostnaden beror på faktorer som datatyp, volym, anpassning och leveranstider. Vänligen fyll i formuläret "Kontakta oss" med dina krav för en offert.

Leveranstider varierar beroende på projektets komplexitet och datamängd, men är strukturerade för att möta era projektdeadlines.

Högkvalitativa medicinska datamängder är avgörande för att träna AI-modeller för att förbättra noggrannhet, automatisera uppgifter och stärka beslutsfattandet inom hälso- och sjukvården.