Mest pålitliga tjänster för insamling av taldata för din AI
Träna dina NLP -modeller, VA, TTS -prototyper med mera med kvalitetssamtal, med våra tjänster för ljud- och taldata
Upptäck ljuddatapipelines utan flaskhalsar
Utvalda klienter
Professionella tjänster för insamling av ljud/röstdata
Alla ämnen. Alla scenarier.
Hos Shaip ligger vår expertis i att skapa högkvalitativa taldataset utformade för olika AI/ML-krav. Vi erbjuder ett omfattande utbud av språk och spelar in i olika miljöer, vilket gör våra datauppsättningar heltäckande och anpassningsbara. Oditt fokus ligger på att mata modeller med den högsta volymen anpassade taldata, på minsta möjliga tid. Med oss ombord kan du förvänta dig:
- Kurerad högkvalitativ flerspråkig ljud-/röstdata för att förbättra noggrannheten
- Högsta möjliga nivå av domänspecificitet till target olika scenario inställning
- Skala din ML-modell för att passa olika demografier och vertikaler
- Inspelningsmiljöer: Studiokvalitet, med kristallklart ljud med minimalt bakgrundsljud, & Naturliga miljöer, där inspelningar innehåller omgivande ljud för att efterlikna verkliga situationer.
100+
55K +
Timmar av taldata
250+
Projekt
60+
Språk (100+ dialekter)
8 / 16 / 44 / 48 kHz
Samplingshastighet
Vår expertis
Justera ljuddata för smartare NLP-modeller
Shaip erbjuder end-to-end-tal/ljuddatainsamlingstjänster på över 100 språk för att möjliggöra röstaktiverad teknik för att tillgodose en mångfaldig publik över hela världen. Vi kan arbeta med projekt av alla omfattningar och storlekar; från licensiering av befintliga ljuddatauppsättningar, till hantering av anpassad ljuddatainsamling, till ljudtranskription och annotering. Oavsett hur stort ditt insamlingsprojekt för taldata är, kan vi anpassa ljudinsamlingstjänsterna efter dina behov för att bygga högkvalitativa NLP-datauppsättningar som riktar sig till dialekter, toner och språk. Välj bland vårt stora utbud av taldatauppsättningar och resurser för insamling av ljuddata, för röstaktiverande intelligenta inställningar.
Monolog manus & spontant tal
Den fokuserar på att bearbeta tal från en enda talare. Använd skriptade uppmaningar för att matas in i enkanaliga ljudfiler, vilket säkerställer att unika talmönster, toner och nyanser som är specifika för den individen fångas.
Dialogmanus och spontant tal
Interaktion med två personer, replikerande konversationer och dialoger i den verkliga världen med flerspråkig exponering via dubbelkanalsfiler och transkriberade resurser.
Grupp / Muti-party
samtal
Diskussioner med flera personer, fånga gruppdynamik, överlappningar och olika toner för att noggrant träna talmodeller.
Wake-word / Nyckelfras / Yttrandesamling
Träna AI:er att identifiera nyckelfraser eller väcka ord eller yttranden med liknande betydelser med hjälp av olika, rika och autentiska yttranden för avancerad naturlig språkbehandling och förståelse.
Akustiska data
Samling
Vi kan professionellt spela in ljuddata av studiokvalitet, oavsett om det är restauranger, kontor eller hem eller från olika miljöer och språk, samtidigt som vi täcker ett bredare akustiskt område (omfattande ljuddataset).
Automatisk taligenkänning (ASR)
Förbättra noggrannheten i dina automatiska taligenkänningssystem (ASR) genom att ha tillgång till toppmoderna diversifierade tal-/ljuddatauppsättningar från ett brett spektrum av demografi.
Flerspråkig tal/ljudträningsdata
Våra skickliga språkexperter över hela världen erbjuder flerspråkig ljud-/taldata på olika språk och dialekter. Denna insats främjar global kommunikation och överbryggar språkbarriärer, vilket bidrar till mer inkluderande och effektiva AI-lösningar.
Text-to-Speech
(TTS)
Bygg en text-to-speech (TTS) flerspråkig modell med hjälp av vår globala arbetsstyrka, som hjälper dig att samla in taldata på 150+ språk och dialekter för att förbättra dina AI-modeller från kontroller i bilen till chatbots och inlärningslösningar med hög- ljuddata av hög kvalitet.
Call Center
samtal
Genuina utbyten mellan agenter och kunder, som stöder många språk som spanska, tyska, amerikansk engelska, bengali, japanska, kinesiska och hindi.
Framgångsberättelser
Konversations-AI-datauppsättningar med över 3 8 timmars data på XNUMX språk
Kunden ville bygga en flerspråkig plattform för indiska språk och samarbetade med Shaip för att samla in, segmentera och transkribera stora datamängder på flera indiska språk. Detta skulle hjälpa till att utveckla effektiva talmodeller som kan driva kundens innovativa nya plattform.
Problem: Över 3,000 8 timmars ljuddata samlad in på XNUMX indiska språk, segmenterad och transkriberad för att utveckla automatisk taligenkänning.
Lösning: Vi tillhandahöll datainsamling, segmentering, transkription och levererade JSON-filer med metadata. Vi samlade in 3000 timmar ljuddata på 8 indiska språk i skala för kundens talteknikprojekt.
Anledningar att välja Shaip som din pålitliga samlingspartner för taldata
Personer
Dedikerade och utbildade team:
- 30,000+ medarbetare för dataskapande, märkning och kvalitetssäkring
- Godkänd projektledningsteam
- Erfaren produktutvecklingsteam
- Talent Pool Sourcing & Onboarding Team
Behandla
Högsta processeffektivitet säkerställs med:
- Robust 6 Sigma Stage-Gate-process
- Ett dedikerat team med 6 Sigma-svarta bälten - Viktiga processägare och kvalitetskrav
- Kontinuerlig förbättring och återkopplingsslinga
plattform
Den patenterade plattformen erbjuder fördelar:
- Webbaserad end-to-end-plattform
- Oklanderlig kvalitet
- Snabbare TAT
- Sömlös leverans
Personer
Dedikerade och utbildade team:
- 30,000+ medarbetare för dataskapande, märkning och kvalitetssäkring
- Godkänd projektledningsteam
- Erfaren produktutvecklingsteam
- Talent Pool Sourcing & Onboarding Team
Behandla
Högsta processeffektivitet säkerställs med:
- Robust 6 Sigma Stage-Gate-process
- Ett dedikerat team med 6 Sigma-svarta bälten - Viktiga processägare och kvalitetskrav
- Kontinuerlig förbättring och återkopplingsslinga
plattform
Den patenterade plattformen erbjuder fördelar:
- Webbaserad end-to-end-plattform
- Oklanderlig kvalitet
- Snabbare TAT
- Sömlös leverans
Off-the-shelf tal/ljuddataset
Detaljer | Corpus ID (Unikt) | Nyckelord | Språkdatauppsättning | Språkkod | Samplingshastighet | Dataset typ | Totala ljudtimmar | Kort beskrivning | Dataset Beskrivning | ljudkanal | Inspelningsplattform | VI ÄR (%) | Ljudformat | Transkriptionsformat | Användningsfall | Antal högtalare | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
New York English_GC_8 | New York engelska | New York engelska | sv | 8 kHz | Allmänt samtal | 107 | New York engelska allmänna konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 118, Man 114, Okänd 0 | Kontakta Oss | |
Ryska_SM_48 | ryska | ryska | ru-RU | 48 kHz | Manusmonolog | 2,398 | Rysk manusmonolog | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1689 Man 1937 Okänd 214 | Kontakta Oss | |
Punjabi_MA | punjabi | Punjabi (I pipeline) | punjabi | Media Audio | 40 | Punjabi (In Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Punjabi_GC | punjabi | Punjabi (I pipeline) | punjabi | Allmänt samtal | 100 | Punjabi (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Punjabi_CC_8 | punjabi | Punjabi (I pipeline) | punjabi | Call-center | 60 | Punjabi (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Polska Polen_SM_48 | Polska (Polen) | Polska (Polen) | pl-PL | 48 kHz | Manusmonolog | 1,482 | Polska Polen - Manusmonolog | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1324 Man 701 Okänd 24 | Kontakta Oss | |
Polska_MA_16 | polska | polska | pl_PL | 16 kHz | Media Audio | 269 | Polskt medialjud | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 173 Man 354 Okänd 6 | Kontakta Oss | |
Oriya_MA | oriya | Oriya (I Pipeline) | eller_IN | Media Audio | 40 | Oriya (In Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Oriya_GC | oriya | Oriya (I Pipeline) | eller_IN | Allmänt samtal | 100 | Oriya (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Oriya_CC_8 | oriya | Oriya (I Pipeline) | eller_IN | Call-center | 60 | Oriya (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Nya Zeeland_MA_16 | Nya Zeeland engelska | Nya Zeeland engelska | sv_NZ | 16 kHz | Media Audio | 400 | Nya Zeelands engelska medialjud | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 367, man 678, Okänd 26 | Kontakta Oss | |
Nya Zeeland_GC_8 | Nya Zeeland engelska | Nya Zeeland engelska | sv_NZ | 8 kHz | Allmänt samtal | 148 | Nya Zeeland engelska allmänna konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 167, man 121, Okänd 4 | Kontakta Oss | |
New York English_MA_16 | New York engelska | New York engelska | sv | 16 kHz | Media Audio | 140 | New York English Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 66, Man 230, Okänd 11 | Kontakta Oss | |
Skotsk_GC_8 | skotsk (engelsk accent) | skotsk (engelsk accent) | sv_AB | 8 kHz | Allmänt samtal | 292 | Skotsk allmänna konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 285 , Man 260, Okänd 3 | Kontakta Oss | |
New York engelska_CC_8 | New York engelska | New York engelska | sv | 8 kHz | Call-center | 103 | New York engelska Call-center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 610, Man 532, Okänd 0 | Kontakta Oss | |
Nederländerna_SM_48 | Dutch | Dutch | nl-NL | 48 kHz | Manusmonolog | 1,205 | Holländsk manusmonolog | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1285 Man 531 Okänd 3 | Kontakta Oss | |
Mexican_SM_48 | Spanska (Mexiko) | Spanska (Mexiko) | es-MX | 48 kHz | Manusmonolog | 1,492 | Mexikansk spansk manusmonolog | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1016 Man 1069 Okänd 95 | Kontakta Oss | |
Marathi_MA | marathi | Marathi (I Pipeline) | mr_IN | Media Audio | 40 | Marathi (In Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Marathi_GC | marathi | Marathi (I Pipeline) | mr_IN | Allmänt samtal | 100 | Marathi (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Marathi_CC_8 | marathi | Marathi (I Pipeline) | mr_IN | Call-center | 60 | Marathi (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Malayalam_MA | malayalam | Malayalam (I pipeline) | ml_IN | Media Audio | 40 | Malayalam (In Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Malayalam_GC | malayalam | Malayalam (I pipeline) | ml_IN | Allmänt samtal | 100 | Malayalam (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Malayalam_CC_8 | malayalam | Malayalam (I pipeline) | ml_IN | Call-center | 60 | Malayalam (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Malay_MA_16 | Malay | Malay | ms_MY | 16 kHz | Media Audio | 344 | Malay Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 236, Man 626, Okänd 47 | Kontakta Oss | |
Malay_GC_8 | Malay | Malay | ms_MY | 8 kHz | Allmänt samtal | 266 | Malajiska allmänna konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (omfång) - 15-60 minuter, Malay i Malaysia | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 316, Man 176 , Okänd 0 | Kontakta Oss | |
Telugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Allmänt samtal | 553 | Telugu Allmän konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 574 , Man 564, Okänd 0 | Kontakta Oss | |
Storbritannien engelska_WW_16 | UK engelska | UK engelska | sv_uk | 16 kHz | Wake Word | 200 högtalare | Wake Word brittisk engelska | nyckelfraser insamling av data
| 1 kanal | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kön: 50 % män, 50 % kvinnor, +/- 10 %. | Kontakta Oss | |
Welsh_GC_8 | walesiska (engelsk accent) | walesiska (engelsk accent) | sv_WL | 8 kHz | Allmänt samtal | 278 | walesiska allmänna konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 270, Man 324, Okänd 0 | Kontakta Oss | |
Vietnamesiska_MA_16 | vietnamesiska | vietnamesiska | vi_VN | 16 kHz | Media Audio | 257 | Vietnamesiska media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 249, man 200, okända 45 | Kontakta Oss | |
Vietnamese_GC_8 | vietnamesiska | vietnamesiska | vi_VN | 8 kHz | Allmänt samtal | 295 | Vietnamesiska allmänna konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, norra (t.ex. Hanoi), centrala och södra (t.ex. Ho Chi Minh City). | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 400, man 380, okända 2 | Kontakta Oss | |
Turkiska Turkiet_SM_48 | turkiska Turkiet | turkiska Turkiet | tr-TR | 48 kHz | Manusmonolog | 2,027 | turkiska Turkiet | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1561 Man 1241 Okänd 31 | Kontakta Oss | |
Thai_MA_8 | thailändska | thailändska | th_TH | 16 kHz | Media Audio | 173 | Thai media ljud | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 143, Man 502, Okänd 26 | Kontakta Oss | |
Thai_GC_8 | thailändska | thailändska | th_TH | 8 kHz | Allmänt samtal | 183 | Thailändskt allmänt samtal | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, ett informellt register som används mellan vänner | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 338, Man 96, Okänd 8 | Kontakta Oss | |
Telugu_MA | telugu | Telugu (I pipeline) | te_IN | Media Audio | 20 | Telugu (In Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Telugu_GC | telugu | Telugu (I pipeline) | te_IN | Allmänt samtal | 50 | Telugu (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Telugu_CC_8 | telugu | Telugu (I pipeline) | te_IN | Call-center | 30 | Telugu (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Telugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Media Audio | 648 | Telugu Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 207, Man 963, Okänd 2 | Kontakta Oss | |
Korean_SM_48 | koreanska | koreanska | ko-KR | 48 kHz | Manusmonolog | 1,955 | Koreansk manusmonolog | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1195 Man 1134 Okänd 122 | Kontakta Oss | |
Tamil_MA | tamil | Tamil (I Pipeline) | ta_IN | Media Audio | 40 | Tamil (In Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Tamil_GC | tamil | Tamil (I Pipeline) | ta_IN | Allmänt samtal | 100 | Tamil (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Tamil_CC_8 | tamil | Tamil (I Pipeline) | ta_IN | Call-center | 60 | Tamil (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Swedish_MA_16 | svenska | svenska | sv_SE | 16 kHz | Media Audio | 278 | Swedish Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 195, man 500, Okänd 21 | Kontakta Oss | |
Swedish_CC_8 | svenska | svenska | sv_SE | 8 kHz | Call-center | 250 | Svensk Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1581, man 727, Okänd 2 | Kontakta Oss | |
Swahili_MA_16 | swahili | swahili | sw_KE | 16 kHz | Media Audio | 265 | Swahili Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 118, Man 493, Okänd 25 | Kontakta Oss | |
Swahili_CC_8 | swahili | swahili | sw_KE | 8 kHz | Call-center | 230 | Swahili Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 611, Man 833, Okänd 0 | Kontakta Oss | |
Sydafrikansk engelska_MA_16 | Sydafrikanska engelska | Sydafrikanska engelska | sv_ZA | 16 kHz | Media Audio | 251 | Sydafrikanska engelska media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 235, Man 432, Okänd 36 | Kontakta Oss | |
Sydafrikansk engelska_CC_8 | Sydafrikanska engelska | Sydafrikanska engelska | sv_ZA | 8 kHz | Call-center | 261 | South African English Call-Center data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1274 , Man 935 , Okänd 1 | Kontakta Oss | |
Singapore_MA_16 | Singapore engelska | Singapore engelska | sv_SG | 16 kHz | Media Audio | 247 | Singapore Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 160, Man 455, Okänd 37 | Kontakta Oss | |
Singapore_CC_8 | Singapore engelska | Singapore engelska | sv_SG | 8 kHz | Call-center | 218 | Singapore Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 2139 , Man 884, Okänd 21 | Kontakta Oss | |
Boston_CC_8 | Boston engelska | Boston engelska | sv | 8 kHz | Call-center | 177 | Boston Call-center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 605, man: 711 och okänd: 0 | Kontakta Oss | |
Engelska Deep South_CC_8 | Engelska Deep South | Engelska Deep South | sv | 8 kHz | Call-center | 151 | Engelska Deep South Call-centerdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 221 , Man 1004 , Okänd 7 | Kontakta Oss | |
Danska_SM_48 | danska | danska | da-DK | 48 kHz | Manusmonolog | 2,579 | Dansk skriftmonolog | Enstaka inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder, danska från Danmark | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1551 Man 1233 Okänd 42 | Kontakta Oss | |
Danska_MA_16 | danska | danska | da_DK | 16 kHz | Media Audio | 664 | Danska media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 369, Man: 864, Okänd: 27 | Kontakta Oss | |
Danish_GC_8 | danska | danska | da_DK | 8 kHz | Allmänt samtal | 372 | Danska allmänna samtalsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 311, Man: 417, Okänd: 0 | Kontakta Oss | |
Traditionell kinesisk_SM_48 | Traditionell kinesiska | Traditionell kinesiska | zh-TW | 48 kHz | Manusmonolog | 1,028 | Traditionell kinesiska | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1069 Man 262 Okänd 3 | Kontakta Oss | |
Kinesiska förenklad_SM_48 | Förenklad kinesiska | Förenklad kinesiska | zh-CN | 48 kHz | Manusmonolog | 2,762 | Förenklad kinesiska | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1920 Man 1535 Okänd 270 | Kontakta Oss | |
kinesiska_MA_16 | Kinesiska engelska | Kinesiska engelska | sv | 16 kHz | Media Audio | 249 | Kinesiska media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 126, man: 346 och Okänd: 6 | Kontakta Oss | |
kinesiska_CC_8 | Kinesiska engelska | Kinesiska engelska | sv | 8 kHz | Call-center | 169 | Kinesiska callcenterdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 1790, man: 523 och Okänd: 13 | Kontakta Oss | |
Canadian_SM_48 | Kanadensiska franska | Kanadensiska franska | FR-CA | 48 kHz | Manusmonolog | 1,222 | Kanadensiska franska | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 974 Man 631 Okänd 1 | Kontakta Oss | |
Boston_MA_16 | Boston engelska | Boston engelska | sv | 16 kHz | Media Audio | 93 | Boston Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 43, man: 181 och okänd: 2 | Kontakta Oss | |
Boston_GC_8 | Boston engelska | Boston engelska | sv | 8 kHz | Allmänt samtal | 32 | Boston allmänna konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 53, man: 83 och okänd: 0 | Kontakta Oss | |
Engelska Deep South_GC_8 | Engelska Deep South | Engelska Deep South | sv | 8 kHz | Allmänt samtal | 56 | Engelska Deep South Allmän konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 99, Man 31, Okänd 0 | Kontakta Oss | |
Bengali_MA | bengali | Bengali (I Pipeline) | bn_IN | Media Audio | 40 | Bengali (In Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Bengali_GC | bengali | Bengali (I Pipeline) | bn_IN | Allmänt samtal | 100 | Bengali (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Bengali_CC_8 | bengali | Bengali (I Pipeline) | bn_IN | Call-center | 60 | Bengali (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Assamese_MA | Assamesiska | Assamese (I pipeline) | som i | Media Audio | 40 | Assamiska (I Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Assamese_GC | Assamesiska | Assamese (I pipeline) | som i | Allmänt samtal | 100 | Assamesiska (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Assamese_CC_8 | Assamesiska | Assamese (I pipeline) | som i | Call-center | 60 | Assamiska (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Arabiska_SM_48 | arabiska | arabiska | ar-SA | 48 kHz | Manusmonolog | 1,947 | Arabisk skriftmonolog | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 838 Man 1209 Okänd 78 | Kontakta Oss | |
Arabiska_GC_8 | arabiska | arabiska | ar_AE | 8 kHz | Allmänt samtal | 292 | Arabiska allmänna konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, arabiska från Gulfländerna | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 171, man: 534 och okänd: 1 | Kontakta Oss | |
Afrikaans_MA_16 | afrikaans | afrikaans | af_ZA | 16 kHz | Media Audio | 658 | afrikanska mediafiler | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 750, man: 1278 och okänd: 52 | Kontakta Oss | |
Afrikaans_GC_8 | afrikaans | afrikaans | af_ZA | 8 kHz | Allmänt samtal | 368 | Afrikaans Allmän konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (omfång) - 15-60 minuter, afrikaans talas i Afrika | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 502, man: 390 och okänd: 2 | Kontakta Oss | |
sv_US_MA_16 | Afroamerikansk folkspråk | Afroamerikansk folkspråk | sv | 16 kHz | Media Audio | 154 | African American Vernacular Media data | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 151, man: 150 och okänd: 10 | Kontakta Oss | |
HINGLISH_MA_16 | Hinglish | Hinglish | hg_IN | 16 kHz | Media Audio | 216 | HINGLISH Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 75, Man 380, Okänd 0 | Kontakta Oss | |
Korean_MA_16 | koreanska | koreanska | ko_KR | 16 kHz | Media Audio | 204 | Koreanska medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 70 Man 303, Okänd 25 | Kontakta Oss | |
Korean_CC_8 | koreanska | koreanska | ko_KR | 8 kHz | Call-center | 107 | Koreanska callcenterdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1086, Man 210 , Okänd 4 | Kontakta Oss | |
Kannada_MA | kannada | Kannada (I Pipeline) | kn_IN | Media Audio | 40 | Kannada (In Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Kannada_GC | kannada | Kannada (I Pipeline) | kn_IN | Allmänt samtal | 100 | Kannada (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Kannada_CC_8 | kannada | Kannada (I Pipeline) | kn_IN | Call-center | 60 | Kannada (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Japanska_SM_48 | japanska | japanska | ja-JP | 48 kHz | Manusmonolog | 2,335 | Japansk manusmonolog | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1460 Man 1221 Okänd 194 | Kontakta Oss | |
Irish_GC_8 | irländsk | irländsk | sv_IE | 8 kHz | Allmänt samtal | 192 | Irländska allmänna konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 213 , Man 153 , Okänd 0 | Kontakta Oss | |
Indonesiska_MA_16 | indonesiska | indonesiska | jag gjorde | 16 kHz | Media Audio | 643 | Indonesisk media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 746, Man 1507, Okänd 129 | Kontakta Oss | |
Indonesiska_GC_8 | indonesiska | indonesiska | jag gjorde | 8 kHz | Allmänt samtal | 496 | Indonesiska allmänna konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, indonesiska | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 524, Man 454, Okänd 2 | Kontakta Oss | |
Hispanic_MA_16 | spansktalande engelska | spansktalande engelska | sv | 16 kHz | Media Audio | 155 | Hispanic Call Media-ljud | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 140, Man 219, Okänd 5 | Kontakta Oss | |
Hispanic_CC_8 | spansktalande engelska | spansktalande engelska | sv | 8 kHz | Call-center | 212 | Hispanic Call-center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 822, Man 1262, Okänd 0 | Kontakta Oss | |
sv_US_CC_8 | Afroamerikansk folkspråk | Afroamerikansk folkspråk | sv | 8 kHz | Call-center | 211 | African American Vernacular Call-centerdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 612, man: 1242 och okänd: 12 | Kontakta Oss | |
HINGLISH_CC_8 | Hinglish | Hinglish | hg_IN | 8 kHz | Call-center | 208 | HINGLISH Callcenterdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 822, Man 1262 , Okänd 0 | Kontakta Oss | |
Hindi_SM_48 | hindi | hindi | hi-IN | 48 kHz | Manusmonolog | 2,867 | Hindi scripted monolog | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1977 Man 1864 Okänd 147 | Kontakta Oss | |
Hindi_MA_16 | hindi | hindi | hej_IN | 16 kHz | Media Audio | 219 | Hindi Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 83 , Man 309, Okänd 0 | Kontakta Oss | |
Hebrew_MA_16 | Hebreiska | Hebreiska | he_IL | 16 kHz | Media Audio | 427 | Hebrew Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 361 , Man 513, Okänd 13 | Kontakta Oss | |
Hebreiska_Allmän konversation_8 | Hebreiska | Hebreiska | he_IL | 8 kHz | Allmänt samtal | 399 | Hebreiska allmänna konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (omfång) - 15-60 minuter, hebreiska i Israel | Dubbel | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 414 , Man 399 , Okänd 1 | Kontakta Oss | |
Gujarati_MA | gujarati | Gujarati (I pipeline) | gu_IN | Media Audio | 40 | Gujarati (In Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Gujarati_GC | gujarati | Gujarati (I pipeline) | gu_IN | Allmänt samtal | 100 | Gujarati (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Gujarati_CC_8 | gujarati | Gujarati (I pipeline) | gu_IN | Call-center | 60 | Gujarati (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Desktop | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakta Oss | ||||
Tyska_IVR_8 | tyska | tyska | de-De | 8 kHz | IVR | 200 | Tyska IVR-data | människa till maskin. En IVR-typ av flöde där det finns en TTS-uppmaning (t.ex. ”Hur kan jag hjälpa dig”) följt av ett spontant mänskligt svar | Mono | Desktop | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 10115 Hane 8750 Okänd 0 | Kontakta Oss | ||
Tyska_CC_8 | tyska | tyska | de-De | 8 kHz | Call-center | 64 | Tyska callcenterdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Mono | Desktop | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 478 Man 1440 Okänd 0 | Kontakta Oss | ||
Engelska Deep South_MA_16 | Engelska Deep South | Engelska Deep South | sv | 16 kHz | Media Audio | 266 | Engelska Deep South Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 204, Man 356, Okänd 21 | Kontakta Oss |
Erbjudna tjänster
Expertinsamling av ljuddata är inte all-hands-on-deck för omfattande AI-inställningar. På Shaip kan du till och med överväga följande tjänster för att göra modeller betydligt mer utbredda än vanligt:
Insamling av textdata
Tjänster
Det verkliga värdet av Shaips kognitiva datainsamlingstjänster är att det ger organisationer nyckeln till att låsa upp kritisk information som finns i ostrukturerad data
Tjänster för insamling av bilddata
Se till att din datorvisionsmodell identifierar varje bild exakt för att sömlöst träna nästa generations AI-modeller i framtiden
Tjänster för insamling av videodata
Fokusera nu på datorsyn tillsammans med NLP för att träna dina modeller för att identifiera objekt, individer, avskräckande medel och andra visuella element till perfektion
Rekommenderade resurser
Erbjuder
Ljudkommentar för intelligenta AI: er
Ljudkommentartjänster har varit Shaips starka sida sedan starten. Utveckla, träna och förbättra konversations-AI, chatbots och taligenkänningsmotorer med våra toppmoderna ljudkommentarstjänster.
Köparhandboken
Köparguide: Komplett guide till konversations-AI
Chatboten du pratade med körs på ett avancerat konversations-AI-system som är tränat, testat och byggt med hjälp av massor av taligenkänningsdatauppsättningar.
Datakatalog
Off-the-shelf Speech Data Catalog & Licensing
Det finns ett stort antal vanliga applikationer för taldata i AI-projekt. Vi erbjuder dig enorma mängder högkvalitativ data redo för din röstigenkänning.
Vill du bygga din egen ljuddataset?
Ta kontakt med vår interna expert för taldatainsamling för att skapa ett ljudlager som bäst passar dina krav
Vanliga frågor (FAQ)
Taldatainsamling för en ML-modell avser processen att samla in ljudinspelningar av talat språk. Denna samling hjälper till att träna och förfina algoritmer för maskininlärning, särskilt de som fokuserar på att förstå och bearbeta mänskliga röster.
När du strävar efter att samla in ljuddata för Automatic Speech Recognition (ASR), bör du börja med att definiera ditt projekts specifika behov, inklusive önskat språk, accent och typ av tal. Efter att ha ställt in dessa parametrar, se till att du får alla nödvändiga behörigheter för att respektera användarnas integritet. Använd sedan lämpliga inspelningsenheter eller programvara för att fånga tydliga ljudprover. Varje inspelning bör noggrant annoteras med dess transkription eller andra relevanta metadata och lagras systematiskt för enkel åtkomst.
En taldatauppsättning inom maskininlärning är avgörande för utbildning, testning och validering av modeller som är skräddarsydda för att känna igen, transkribera eller tolka talat språk. Sådana datamängder banar väg för en myriad av applikationer, från röstassistenter och transkriptionstjänster till röstbiometri.
För att samla in exakta data från olika språk och accenter är samarbete med modersmålstalare av önskad språklig bakgrund avgörande. Sträva efter ett varierat och representativt urval för att täcka ett brett spektrum av demografiska nyanser. Använd standardiserad inspelningsutrustning i enhetliga miljöer för att säkerställa ljudkonsistens. Och viktigare, annotera varje databit med detaljerade transkriptioner och metadata, som anger det specifika språket och accenten.