HIPAA-kompatibla ljuddata för läkares diktering för AI inom sjukvården

Accelerera AI-innovation inom hälso- och sjukvården med hjälp av färdiga ljuddata för läkares diktering som följer sekretess- och HIPAA-föreskrifter.

Läkarens diktering av ljuddatauppsättningar

Högkvalitativa medicinska ljuddatauppsättningar för smartare AI-modeller

Vårt avidentifierade vårddataset innehåller ljudfiler från 31 olika specialiteter, noggrant dikterade av läkare. Dessa inspelningar innehåller detaljerade beskrivningar av patienters kliniska tillstånd och vårdplaner, hämtade från verkliga läkare-patientinteraktioner på sjukhus och i kliniska miljöer. Detta dataset, som är helt i enlighet med sekretessregler, är idealiskt för att träna avancerade AI-modeller inom hälso- och sjukvård.

Medicinska ljuddata efter kön
Specialitet Patientljudfiler (speltid i timmar) Totalt antal ljudfiler
Totalt257,9775,172,766
man58,8502,444,910
Kvinna113,4061,290,900
Okänd85,7211,436,956
Medicinska ljuddata efter specialitet
Specialitet Patientljudfiler (speltid i timmar) Totalt antal ljudfiler
Totalt257,9775,172,766
Olycka och nödsituation9359
Allergi och immunologi115222202
anestesiologi67722280
Anestetika19
APRN1631693
Kardiologi675041566721
Kardiotorak17122
Kardiotorakisk kirurgi110
Klinisk hematologi02
Kolon och rektal kirurgi7162
Kolorektal kirurg45984
Intensivvårdsmedicin2204328
Tandläkare165
Dermatologi77123014
Dietist och näringsfysiolog44736
Nödfallsmedicin4911112518
Endokrinologi2057052
ENT7010175477
Familjemedicin1767106733
Gastroenterologi145840365
Allmänmedicin1405757
Allmän praktik411318
Allmän kirurgi203871744
Gynekologi3269103370
Handoperation245
Hematology2588125
hospitalist5931142529
Smittsam sjukdom49314001
Intern medicin15410445591
Interventionell kardiologi151143035
Maternal-Fetal medicin511355
neonatologi104524760
Nephrology73520334
Neurologi226963774
Neurokirurgi46211990
Kärnmedicin223
GYNEKOLOG3562122303
Onkologi293882996
Oftalmologi131641047
Optometri331066
Ortopedi5665164483
Otolaryngology3433100811
Patologi1664097
Pediatrisk pulmonologi440
Pediatrisk specialitet35682
Pediatrisk kirurgi223
Pediatrik8779271
Fysikalisk medicin och rehabilitering134723523
Sjukgymnast1141713
Läkare Asst.638
Podiatrisk kirurgi424
fotvård47312296
Primärvård65120120
Psykiatri212060381
Pulmonology129035290
Strålnings onkologi2396558
Radiologi334599641
reumatologi2938729
SICU125
Talpatologi328
Kirurgisk onkologi2175758
Thoracic operation1073336
Transplantationskirurgi611535
Urologi317096934
Övre gastrointestinala kirurgi458
VASKULÄR KIRURGI19156
Vaskulär/Allmänt9268
Sårvård15211
Medicinsk ljuddata per enhet
Specialitet Patientljudfiler (speltid i timmar) Totalt antal ljudfiler
Totalt257,9775,172,766
IPHONE66632,382
digital Recorder1,65922,377
Blandad typ69,8181,408,679
Smartphone51,5331,306,405
SpeechMic10,329257,730
Telefondiktering120,8672,071,557
Okänd3,10473,636

Vi hanterar alla typer av datalicenser, dvs. text, ljud, video eller bild. Datauppsättningarna består av medicinska datauppsättningar för ML: Läkardikteringsdatauppsättning, läkares kliniska anteckningar, medicinska konversationsdatauppsättningar, medicinska transkriptionsdatauppsättningar, läkare-patientsamtal, medicinska textdata, medicinska bilder – CT-skanning, MRI, ultraljud (insamlade grund anpassade krav) .

Shaip kontakta oss

Hittar du inte det du letar efter?

Nya medicinska datauppsättningar från hyllan samlas in för alla datatyper

Kontakta oss nu för att släppa dina bekymmer för insamling av data för hälsoträning

  • Genom att registrera mig godkänner jag Shaip Integritetspolicy och Användarvillkor och ge mitt samtycke till att ta emot B2B marknadsföringskommunikation från Shaip.

Läkardikteringsljuddata består av ljudfiler där läkare beskriver en patients kliniska tillstånd, behandlingsplan eller sjukdomshistoria under konsultationer eller sjukhusbesök.

Denna data är avgörande för att träna AI-modeller inom taligenkänning, naturlig språkbehandling (NLP) och automatisering av klinisk dokumentation. Den hjälper till att bygga system för att transkribera, analysera och förbättra arbetsflöden för vårddokumentation.

Datasetet innehåller 257,977 31 timmar av verklig läkares diktering från XNUMX medicinska specialiteter. Ljud spelas in med olika enheter, inklusive telefoner, digitala inspelare, smartphones och talmikrofoner.

Ja, alla ljudfiler avidentifieras för att ta bort personligt identifierbar information (PII), vilket säkerställer patientsekretessen.

Ja, datamängderna följer HIPAA- och Safe Harbor-riktlinjerna, tillsammans med andra globala integritetsstandarder.

Ja, datamängder kan skräddarsys för specifika specialiteter, demografi eller typer av inspelningsenheter baserat på projektets krav.

Absolut. Dataseten är omfattande, med miljontals ljudfiler, vilket gör dem lämpliga för både småskaliga och storskaliga AI/ML-projekt.

Medicinska ljuddata och motsvarande transkript tillhandahålls i standardformat som sömlöst kan integreras i modeller för taligenkänning och naturlig språkbehandling (NLP).

Ljuddatan genomgår rigorösa kvalitetskontroller, och domänexperter validerar annoteringar för att säkerställa noggrannhet och tillförlitlighet.

Kostnaden beror på faktorer som datavolym, anpassning och projektets omfattning. Vi ber dig att fylla i formuläret "Kontakta oss" med dina önskemål för att få den bästa offerten.

Leveranstider varierar beroende på projektets storlek och komplexitet, men är strukturerade för att effektivt möta deadlines.

Dessa datamängder förbättrar AI-kapaciteten för att automatisera klinisk dokumentation, förbättra transkriptionsnoggrannheten och möjliggöra bättre beslutsfattande för vårdgivare.