HIPAA-kompatibla ljuddata för läkares diktering för AI inom sjukvården

Accelerera AI-innovation inom hälso- och sjukvården med hjälp av färdiga ljuddata för läkares diktering som följer sekretess- och HIPAA-föreskrifter.

Läkarens diktering av ljuddatauppsättningar

Anslut datakällan du har saknat idag

Högkvalitativa medicinska ljuddatauppsättningar för smartare AI-modeller

Vårt avidentifierade vårddataset innehåller ljudfiler från 31 olika specialiteter, noggrant dikterade av läkare. Dessa inspelningar innehåller detaljerade beskrivningar av patienters kliniska tillstånd och vårdplaner, hämtade från verkliga läkare-patientinteraktioner på sjukhus och i kliniska miljöer. Detta dataset, som är helt i enlighet med sekretessregler, är idealiskt för att träna avancerade AI-modeller inom hälso- och sjukvård.

Medicinska ljuddata efter kön
SpecialitetPatientljudfiler (speltid i timmar)Totalt antal ljudfiler

Totalt

257,9775,172,766
man58,8502,444,910
Kvinna113,4061,290,900
Okänd85,7211,436,956
Medicinska ljuddata efter specialitet
SpecialitetPatientljudfiler (speltid i timmar)Totalt antal ljudfiler
Smärtstillande medicin111
Podiatrisk kirurgi424
Plastikkirurgi – specialitet13183
Läkare Asst.638
Sjukgymnast1141713
Fysikalisk medicin och rehabilitering134723523
Pediatrik8779271
Pediatrisk kirurgi223
Pediatrisk specialitet35682
Pediatrisk pulmonologi440
Pediatrisk tandvård15420
Patologi114343462
PANP10760145960
fotvård89212056
Smärtbehandling230
Otolaryngology99519548
Osteopatisk3105566
Ortopedisk4849145053
Ortopedi & Idrottsmedicin1493165
Oralkirurgi113
Mun- och käkkirurg18
Oftalmologi60919299
OPERATIV VÅRD05
Onkologi681682300
Arbetsterapeut868
Kirurgi14431236788
Sårvård15211
Vaskulär/Allmänt9268
VASKULÄR KIRURGI19156
Urologi317096934
Övre gastrointestinala kirurgi458
Okänd42269748054
Trauma & ortopedi1401308
Transplantation332
Thoracic operation437
Thoraxmedicin527
Kirurgisk specialitet22290
Kirurgisk läkare assistent03
Yrkesmedicin79763
Sportmedicin349
Talterapi29327
reumatologi13124
Resident46641
Rehabilitering251530078
Radiologi10962630983
Lung380964368
Psykoterapi (specialitet)50229
Psykiatri887170269
PRIMÄRVÅRD17
Förebyggande medicin21191
Dental551233
Allmänt26313
Gastroenterologi312762158
Familjepraxis2622498
Sjuksköterska utövare4249018
Familjemedicin13639263480
Endokrinologi2193212
Akutspecialist30378
Nödsituation367562256
ED Läkarassistent070
Öron, Näsa Och Hals51658
Diagnostisk radiologi2557591
Dermatologi1483474
Allmän tandläkarpraktik225
Intensivvård7079645
Klinisk fysiologi50160
Klinisk hematologi02
Kardiotorakisk kirurgi110
Kardiotorak17122
Kardiologi675041566721
APRN1631693
Anestetika19
anestesiologi67722280
Allergi och immunologi115222202
Olycka och nödsituation9359
IH-Industriell hälsa73945
GYNEKOLOG242442739
Sjuksköterska – Familj9113
Sjuksköterskautövare81432
Neurokirurgi86755
Neurologi147617786
Neuro/TBI1731157
Nephrology243139821
Läkemedel5122
Medicinsk onkologi1667
Internmedicin, lungmedicin, kritisk vårdmedicin och sömnmedicin5102
Internmedicin och nefrologi15111
Intern medicin42604623072

Totalt

257,9775,172,766
hospitalist991493
Hospice & Palliativ medicin441
HONOM019
Hematologi – Onkologi22394
Gynekologi425
GI55550
Geriatrisk medicin4615323
Allmän kirurgi2372220
Allmän kirurg27893
Allmän psykiatri336
Allmänmedicin30327
Medicinsk ljuddata per enhet
SpecialitetPatientljudfiler (speltid i timmar)Totalt antal ljudfiler

Totalt

257,9775,172,766
IPHONE66632,382
digital Recorder1,65922,377
Blandad typ 69,8181,408,679
Smartphone51,5331,306,405
SpeechMic10,329257,730
Telefondiktering120,8672,071,557
Okänd3,10473,636

Vi hanterar alla typer av datalicenser, dvs. text, ljud, video eller bild. Datauppsättningarna består av medicinska datauppsättningar för ML: Läkardikteringsdatauppsättning, läkares kliniska anteckningar, medicinska konversationsdatauppsättningar, medicinska transkriptionsdatauppsättningar, läkare-patientsamtal, medicinska textdata, medicinska bilder – CT-skanning, MRI, ultraljud (insamlade grund anpassade krav) .

Shaip kontakta oss

Hittar du inte det du letar efter?

Nya medicinska datauppsättningar från hyllan samlas in för alla datatyper 

Kontakta oss nu för att släppa dina bekymmer för insamling av data för hälsoträning

  • Genom att registrera mig godkänner jag Shaip Integritetspolicy och Användarvillkor och ge mitt samtycke till att ta emot B2B marknadsföringskommunikation från Shaip.

Läkardikteringsljuddata består av ljudfiler där läkare beskriver en patients kliniska tillstånd, behandlingsplan eller sjukdomshistoria under konsultationer eller sjukhusbesök.

Denna data är avgörande för att träna AI-modeller inom taligenkänning, naturlig språkbehandling (NLP) och automatisering av klinisk dokumentation. Den hjälper till att bygga system för att transkribera, analysera och förbättra arbetsflöden för vårddokumentation.

Datasetet innehåller 257,977 31 timmar av verklig läkares diktering från XNUMX medicinska specialiteter. Ljud spelas in med olika enheter, inklusive telefoner, digitala inspelare, smartphones och talmikrofoner.

Ja, alla ljudfiler avidentifieras för att ta bort personligt identifierbar information (PII), vilket säkerställer patientsekretessen.

Ja, datamängderna följer HIPAA- och Safe Harbor-riktlinjerna, tillsammans med andra globala integritetsstandarder.

Ja, datamängder kan skräddarsys för specifika specialiteter, demografi eller typer av inspelningsenheter baserat på projektets krav.

Absolut. Dataseten är omfattande, med miljontals ljudfiler, vilket gör dem lämpliga för både småskaliga och storskaliga AI/ML-projekt.

Medicinska ljuddata och motsvarande transkript tillhandahålls i standardformat som sömlöst kan integreras i modeller för taligenkänning och naturlig språkbehandling (NLP).

Ljuddatan genomgår rigorösa kvalitetskontroller, och domänexperter validerar annoteringar för att säkerställa noggrannhet och tillförlitlighet.

Kostnaden beror på faktorer som datavolym, anpassning och projektets omfattning. Vi ber dig att fylla i formuläret "Kontakta oss" med dina önskemål för att få den bästa offerten.

Leveranstider varierar beroende på projektets storlek och komplexitet, men är strukturerade för att effektivt möta deadlines.

Dessa datamängder förbättrar AI-kapaciteten för att automatisera klinisk dokumentation, förbättra transkriptionsnoggrannheten och möjliggöra bättre beslutsfattande för vårdgivare.