Licens av högkvalitativ hälsovård/medicinsk data för AI- och ML-modeller
Off-the-shelf Healthcare/Medical Dataset för att kickstarta ditt Healthcare AI-projekt
Medicinska och hälsovårdande datamängder för maskininlärning
Läkarens diktering ljuddata
Vårt avidentifierade dataset för hälso- och sjukvård innehåller ljudfiler från 31 specialiteter, dikterade av läkare som beskriver patienters kliniska tillstånd och vårdplan baserat på läkar-patientmöten i klinisk miljö.
Off-the-shelf Physician Dikteringsljudfiler:
- 257,977 31 timmar datauppsättning om verklig läkares dikteringstal från XNUMX specialiteter för att träna talmodeller inom hälso- och sjukvården
- Dikteringsljud inspelat från olika enheter som telefondiktering (54.3 %), digital inspelare (24.9 %), talmikrofon (5.4 %), smarttelefon (2.7 %) och okänt (12.7 %)
- PII-redigerat ljud och transkript som följer Safe Harbor-riktlinjerna i enlighet med HIPAA
Transkriberade journaler
Transkriberade patientjournaler avser transkription av samtal mellan läkare och patienter, transkription av medicinska rapporter och medicinska bedömningar. Det hjälper till att kartlägga patientens sjukdomshistoria inför framtida besök och fungerar även som en referenspunkt för läkarna. Det hjälper till att utvärdera patientens nuvarande tillstånd och föreslå lämplig behandling.
Off-the-shelf transkriberade journaler:
- Transkription av 257,977 31 timmar av verklig läkarediktering från XNUMX specialiteter för att träna hälsovårdens talmodeller
- Transkriberade journaler från olika arbetstyper som operationsrapport, utskrivningssammanfattning, konsultationsanteckning, erkännande, ED-anteckning, kliniknotis, röntgenrapport, etc.
- PII-redigerat ljud och transkript som följer Safe Harbor-riktlinjerna i enlighet med HIPAA
Electronic Health Records (EHR)
Electronic Health Records eller EHR är journaler som innehåller patientens medicinska historia, diagnoser, recept, behandlingsplaner, vaccinations- eller immuniseringsdatum, allergier, röntgenbilder (CT-skanning, MRI, röntgen) och laboratorietester med mera.
Off-the-shelf Electronic Health Records (EHR):
- 5.1M + registrerar och läkarens ljudfiler i 31 specialiteter
- Verkliga journaler med guldstandard för att träna Clinical NLP och andra Document AI-modeller
- Metadatainformation som MRN (Anonymiserad), Antagningsdatum, Utskrivningsdatum, Vistelsedagars längd, Kön, Patientklass, Betalare, Finansiell Klass, Stat, Utskrivningsdisposition, Ålder, DRG, DRG Beskrivning, $-ersättning, AMLOS, GMLOS, Risk för dödlighet, sjukdomens svårighetsgrad, Grouper, sjukhusets postnummer, etc.
- Medicinska journaler från olika delstater och regioner i USA - North East (46%), South (9%), Mellanvästern (3%), West (28%), Övriga (14%)
- Medicinska journaler som tillhör alla patientklasser som omfattas - slutenvård, öppenvård (klinisk, rehab, återkommande, kirurgisk dagvård), akut.
- Medicinska journaler tillhörande alla patientåldersgrupper <10 år (7.9%), 11-20 år (5.7%), 21-30 år (10.9%), 31-40 år (11.7%), 41-50 år (10.4% ), 51-60 år (13.8%), 61-70 år (16.1%), 71-80 år (13.3%), 81-90 år (7.8%), 90+ år (2.4%)
- Patienternas könsförhållande på 46 % (man) och 54 % (kvinna)
- PII-redigerade dokument som följer Safe Harbor-riktlinjerna i enlighet med HIPAA
Hittar du inte det du letar efter?
Nya medicinska datauppsättningar från hyllan samlas in för alla datatyper
Kontakta oss nu för att släppa dina bekymmer för insamling av data för hälsoträning
Vanliga frågor (FAQ)
1. Vad är medicinska datamängder?
Medicinska datamängder inkluderar hälso- och sjukvårdsdata såsom läkares diktering, transkriberade journaler, elektroniska patientjournaler och medicinska bilder (CT, MRI, röntgen) som används för att träna AI-modeller.
2. Är uppgifterna i enlighet med hälso- och sjukvårdsföreskrifterna?
Ja, datamängderna följer hälso- och sjukvårdsföreskrifter som HIPAA och GDPR för att säkerställa säker och etisk dataanvändning.
3. Kan datamängderna anpassas för specifika behov?
Ja, datamängder kan skräddarsys baserat på specifika specialiteter, demografi, dataformat och projektkrav.
4. Hur fungerar kvalitetssäkringen för dessa datamängder?
Data genomgår rigorösa kvalitetskontroller, inklusive annoteringar av domänexperter, för att säkerställa noggrannhet och tillförlitlighet. Varje dataset är utformat för att uppfylla guldstandardkraven.
5. Är dessa datamängder skalbara för stora AI/ML-projekt?
Ja, datamängderna är skalbara för att möta både små och stora projektkrav, inklusive miljontals poster eller timmar av ljud.
6. Kan dessa datamängder integreras i befintliga AI-modeller?
Ja, datamängderna tillhandahålls i färdiga format (t.ex. JSON, CSV) för sömlös integration med befintliga AI- och ML-arbetsflöden.
7. Vad kostar medicinska datamängder?
Kostnaden beror på faktorer som datatyp, volym, anpassning och leveranstider. Vänligen fyll i formuläret "Kontakta oss" med dina krav för en offert.
8. Hur lång tid tar det att leverera datamängder?
Leveranstider varierar beroende på projektets komplexitet och datamängd, men är strukturerade för att möta era projektdeadlines.
9. Varför är medicinska datamängder viktiga för AI/ML?
Högkvalitativa medicinska datamängder är avgörande för att träna AI-modeller för att förbättra noggrannhet, automatisera uppgifter och stärka beslutsfattandet inom hälso- och sjukvården.