Mest pålitliga tjänster för insamling av taldata för din AI
Träna dina NLP -modeller, VA, TTS -prototyper med mera med kvalitetssamtal, med våra tjänster för ljud- och taldata
Upptäck ljuddatapipelines utan flaskhalsar.
Utvalda klienter
Varför behövs datauppsättning för talutbildning för bearbetning av naturligt språk?
Har du någonsin märkt att din smartphone VA, dvs Siri, Bixby eller något annat, interagerar? Hur de besvarar varje fråga och analyserar och presenterar resultat enligt dina krav!
Tja, så mycket som dessa VA:er fascinerar oss, måste dessa intelligenta resurser och program tränas gradvis för att kunna svara, så exakt. Detta är anledningen till att du bör överväga att lägga ut tal/ljud och röstdatainsamling på entreprenad till specialiserade datainsamlingsföretag, med validerande professionell expertis.
Att investera i ljuddatainsamling förbereder din påstådda NLP för att tillgodose en flerspråkig publik. Inte bara det, taldatainsamling för NLP, som och när den hanteras av en expert, tar även hänsyn till insamling på fältet, semantisk analys och ljudtranskription. Med professionella lösningar för insamling av taldata kan du:
- Skaffa högkvalitativa ljuddataset för att förbättra noggrannheten
- Rikta in olika scenarier
- Samla in flerspråkig AI -utbildningsdata
- Skala din ML-modell för att passa olika demografier och vertikaler
Professionella ljud- / röstdatainsamlingstjänster för NLP
Alla ämnen. Alla scenarier.
Intelligenta NLP -system är allt annat än generiska. Beroende på programmets funktionalitet kan du behöva fokusera på rumsliga och flerspråkiga ljuddatatjänster, som endast kan erbjudas av kända röst-/ljuddatainsamlingsföretag. Det är här Shaip kommer in i sakerna som en mycket pålitlig leverantör av dataanslutningstjänster som är stolta över att göra tunga lyft för dina förment intelligenta AI: er.
På Shaip fokuserar vi främst på att mata modeller med högsta möjliga volym anpassade talprover, på minst möjlig tid. Med oss ombord kan du förvänta dig:
- Kurerad ljud- / röstdatainsamling för NLP
- Skräddarsydda program som svarar enligt specifika användningsfall
- Gör gruvdrift för ljuddatauppgifter redo
- Mönsterspecifik och automatiserad databehandling
- Högsta möjliga nivå av domänspecificitet
- Snabbare tid på marknaden med accelererade AI -modeller
Vår expertis
Justera ljuddata för att förbereda smarta NLP -modeller
Shaip erbjuder end-to-end-tal/ljuddatainsamlingstjänster på över 100 språk för att möjliggöra röstaktiverad teknik för att tillgodose en mångfaldig publik över hela världen. Vi kan arbeta med projekt av alla omfattningar och storlekar; från licensiering av befintliga ljuddatauppsättningar, till hantering av anpassad ljuddatainsamling, till ljudtranskription och annotering. Oavsett hur stort ditt insamlingsprojekt för taldata är, kan vi anpassa ljudinsamlingstjänsterna efter dina behov för att bygga högkvalitativa NLP-datauppsättningar som riktar sig till dialekter, toner och språk. Välj bland vårt stora utbud av taldatauppsättningar och resurser för insamling av ljuddata, för röstaktiverande intelligenta inställningar.
Monolog Tal Collection
Hantera talbaserade krav som gäller en fristående högtalare för dina Text-to-Speed-prototyper och transkriptionsspecifika krav med skriptad snabbmatning, via enkanalsfiler.
Dialogtal
Samling
Skapa intelligenta virtuella assistenter, hastighetsspecifika chatbots och modeller för automatisk taligenkänning med flerspråkig exponering via tvåkanalsfiler och transkriberade resurser.
Akustiska data
Samling
Vi kan professionellt spela in ljuddata i studiokvalitet, vare sig det är restauranger, kontor eller hem eller från olika miljöer och språk, genom vårt globala nätverk av samarbetspartners, samtidigt som vi täcker ett bredare akustiskt utbud
Samling för naturligt språkuttryck
Träna smarta kommersiella inställningar för att identifiera olika uttalade kundfraser med liknande betydelse, för att göra AI: erna mer autonoma i tid
Digital / virtuell
Assistenter
Fokusera på att bygga din kommande Virtual Assistant genom att träna modeller med varningar om mänskligt tal, flerspråkig exponering, kontextuell analys och NLU.
Automatisk taligenkänning (ASR)
Förbättra noggrannheten i dina automatiska taligenkänningssystem (ASR) genom att ha tillgång till toppmoderna diversifierade tal-/ljuddatauppsättningar från ett brett spektrum av demografi.
Flerspråkig tal/ljudträningsdata
Våra mycket skickliga språkproffs över hela världen erbjuder flerspråkig ljud-/talutbildningsdata på flera språk och dialekter inklusive arabiska, danska, kinesiska, afrikaans, Singapore, Nya Zeeland, hebreiska, indonesiska, irländska, koreanska, malajiska, polska, skotska, svenska , franska, tyska, vietnamesiska, thailändska, italienska, spanska och mer.
Text-to-Speech
(TTS)
För att erbjuda en bättre användarupplevelse med TTS är det viktigt att utveckla ett system som låter naturligt. Bygg en text-to-speech (TTS) flerspråkig modell med hjälp av vår globala arbetsstyrka, som hjälper dig att samla in taldata på 150+ språk och dialekter för att förbättra dina AI-modeller från kontroller i bilen till chatbots och inlärningslösningar med hög- ljuddata av hög kvalitet.
Anledningar att välja Shaip som din pålitliga samlingspartner för taldata
Personer
Dedikerade och utbildade team:
- 30,000+ medarbetare för dataskapande, märkning och kvalitetssäkring
- Godkänd projektledningsteam
- Erfaren produktutvecklingsteam
- Talent Pool Sourcing & Onboarding Team
Behandla
Högsta processeffektivitet säkerställs med:
- Robust 6 Sigma Stage-Gate-process
- Ett dedikerat team med 6 Sigma-svarta bälten - Viktiga processägare och kvalitetskrav
- Kontinuerlig förbättring och återkopplingsslinga
plattform
Den patenterade plattformen erbjuder fördelar:
- Webbaserad end-to-end-plattform
- Oklanderlig kvalitet
- Snabbare TAT
- Sömlös leverans
Personer
Dedikerade och utbildade team:
- 30,000+ medarbetare för dataskapande, märkning och kvalitetssäkring
- Godkänd projektledningsteam
- Erfaren produktutvecklingsteam
- Talent Pool Sourcing & Onboarding Team
Behandla
Högsta processeffektivitet säkerställs med:
- Robust 6 Sigma Stage-Gate-process
- Ett dedikerat team med 6 Sigma-svarta bälten - Viktiga processägare och kvalitetskrav
- Kontinuerlig förbättring och återkopplingsslinga
plattform
Den patenterade plattformen erbjuder fördelar:
- Webbaserad end-to-end-plattform
- Oklanderlig kvalitet
- Snabbare TAT
- Sömlös leverans
Språk: Insamlade ljuddataset
Off-the-shelf tal/ljuddataset
Detaljer | Corpus ID (Unikt) | Nyckelord | Språkdatauppsättning | Språkkod | Samplingshastighet | Dataset typ | Totala ljudtimmar | Kort beskrivning | Dataset Beskrivning | ljudkanal | Inspelningsplattform | VI ÄR (%) | Ljudformat | Transkriptionsformat | Användningsfall | Antal högtalare | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
sv_US_CC_8 | Afroamerikansk folkspråk | Afroamerikansk folkspråk | sv | 8 kHz | Call-center | 211 | African American Vernacular Call-centerdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 612, man: 1242 och okänd: 12 | Kontakt | |
sv_US_MA_16 | Afroamerikansk folkspråk | Afroamerikansk folkspråk | sv | 16 kHz | Media Audio | 154 | African American Vernacular Media data | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 151, man: 150 och okänd: 10 | Kontakt | |
Afrikaans_GC_8 | afrikaans | afrikaans | af_ZA | 8 kHz | Allmänt samtal | 368 | Afrikaans Allmän konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (omfång) - 15-60 minuter, afrikaans talas i Afrika | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 502, man: 390 och okänd: 2 | Kontakt | |
Afrikaans_MA_16 | afrikaans | afrikaans | af_ZA | 16 kHz | Media Audio | 658 | afrikanska mediafiler | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 750, man: 1278 och okänd: 52 | Kontakt | |
Arabiska_GC_8 | arabiska | arabiska | ar_AE | 8 kHz | Allmänt samtal | 292 | Arabiska allmänna konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, arabiska från Gulfländerna | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 171, man: 534 och okänd: 1 | Kontakt | |
Arabiska_SM_48 | arabiska | arabiska | ar-SA | 48 kHz | Manusmonolog | 1,947 | Arabisk skriftmonolog | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 838 Man 1209 Okänd 78 | Kontakt | |
Assamese_CC_8 | Assamesiska | Assamese (I pipeline) | som i | Call-center | 60 | Assamiska (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Assamese_GC | Assamesiska | Assamese (I pipeline) | som i | Allmänt samtal | 100 | Assamesiska (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Assamese_MA | Assamesiska | Assamese (I pipeline) | som i | Media Audio | 40 | Assamiska (I Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Bengali_CC_8 | bengali | Bengali (I Pipeline) | bn_IN | Call-center | 60 | Bengali (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Bengali_GC | bengali | Bengali (I Pipeline) | bn_IN | Allmänt samtal | 100 | Bengali (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Bengali_MA | bengali | Bengali (I Pipeline) | bn_IN | Media Audio | 40 | Bengali (In Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Boston_CC_8 | Boston engelska | Boston engelska | sv | 8 kHz | Call-center | 177 | Boston Call-center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 605, man: 711 och okänd: 0 | Kontakt | |
Boston_GC_8 | Boston engelska | Boston engelska | sv | 8 kHz | Allmänt samtal | 32 | Boston allmänna konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 53, man: 83 och okänd: 0 | Kontakt | |
Boston_MA_16 | Boston engelska | Boston engelska | sv | 16 kHz | Media Audio | 93 | Boston Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 43, man: 181 och okänd: 2 | Kontakt | |
Canadian_SM_48 | Kanadensiska franska | Kanadensiska franska | FR-CA | 48 kHz | Manusmonolog | 1,222 | Kanadensiska franska | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 974 Man 631 Okänd 1 | Kontakt | |
kinesiska_CC_8 | Kinesiska engelska | Kinesiska engelska | sv | 8 kHz | Call-center | 169 | Kinesiska callcenterdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 1790, man: 523 och Okänd: 13 | Kontakt | |
kinesiska_MA_16 | Kinesiska engelska | Kinesiska engelska | sv | 16 kHz | Media Audio | 249 | Kinesiska media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 126, man: 346 och Okänd: 6 | Kontakt | |
Kinesiska förenklad_SM_48 | Förenklad kinesiska | Förenklad kinesiska | zh-CN | 48 kHz | Manusmonolog | 2,762 | Förenklad kinesiska | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1920 Man 1535 Okänd 270 | Kontakt | |
Traditionell kinesisk_SM_48 | Traditionell kinesiska | Traditionell kinesiska | zh-TW | 48 kHz | Manusmonolog | 1,028 | Traditionell kinesiska | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1069 Man 262 Okänd 3 | Kontakt | |
Danish_GC_8 | danska | danska | da_DK | 8 kHz | Allmänt samtal | 372 | Danska allmänna samtalsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 311, Man: 417, Okänd: 0 | Kontakt | |
Danska_MA_16 | danska | danska | da_DK | 16 kHz | Media Audio | 664 | Danska media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna: 369, Man: 864, Okänd: 27 | Kontakt | |
Danska_SM_48 | danska | danska | da-DK | 48 kHz | Manusmonolog | 2,579 | Dansk skriftmonolog | Enstaka inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder, danska från Danmark | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1551 Man 1233 Okänd 42 | Kontakt | |
Engelska Deep South_CC_8 | Engelska Deep South | Engelska Deep South | sv | 8 kHz | Call-center | 151 | Engelska Deep South Call-centerdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 221 , Man 1004 , Okänd 7 | Kontakt | |
Engelska Deep South_GC_8 | Engelska Deep South | Engelska Deep South | sv | 8 kHz | Allmänt samtal | 56 | Engelska Deep South Allmän konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 99, Man 31, Okänd 0 | Kontakt | |
Engelska Deep South_MA_16 | Engelska Deep South | Engelska Deep South | sv | 16 kHz | Media Audio | 266 | Engelska Deep South Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 204, Man 356, Okänd 21 | Kontakt | |
Tyska_CC_8 | tyska | tyska | de-De | 8 kHz | Call-center | 64 | Tyska callcenterdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Mono | stationär dator | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 478 Man 1440 Okänd 0 | Kontakt | ||
Tyska_IVR_8 | tyska | tyska | de-De | 8 kHz | IVR | 200 | Tyska IVR-data | människa till maskin. En IVR-typ av flöde där det finns en TTS-uppmaning (t.ex. ”Hur kan jag hjälpa dig”) följt av ett spontant mänskligt svar | Mono | stationär dator | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 10115 Hane 8750 Okänd 0 | Kontakt | ||
Gujarati_CC_8 | gujarati | Gujarati (I pipeline) | gu_IN | Call-center | 60 | Gujarati (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Gujarati_GC | gujarati | Gujarati (I pipeline) | gu_IN | Allmänt samtal | 100 | Gujarati (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Gujarati_MA | gujarati | Gujarati (I pipeline) | gu_IN | Media Audio | 40 | Gujarati (In Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Hebreiska_Allmän konversation_8 | Hebreiska | Hebreiska | he_IL | 8 kHz | Allmänt samtal | 399 | Hebreiska allmänna konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (omfång) - 15-60 minuter, hebreiska i Israel | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 414 , Man 399 , Okänd 1 | Kontakt | |
Hebrew_MA_16 | Hebreiska | Hebreiska | he_IL | 16 kHz | Media Audio | 427 | Hebrew Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 361 , Man 513, Okänd 13 | Kontakt | |
Hindi_MA_16 | hindi | hindi | hej_IN | 16 kHz | Media Audio | 219 | Hindi Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 83 , Man 309, Okänd 0 | Kontakt | |
Hindi_SM_48 | hindi | hindi | hi-IN | 48 kHz | Manusmonolog | 2,867 | Hindi scripted monolog | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1977 Man 1864 Okänd 147 | Kontakt | |
HINGLISH_CC_8 | Hinglish | Hinglish | hg_IN | 8 kHz | Call-center | 208 | HINGLISH Callcenterdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 822, Man 1262 , Okänd 0 | Kontakt | |
HINGLISH_MA_16 | Hinglish | Hinglish | hg_IN | 16 kHz | Media Audio | 216 | HINGLISH Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 75, Man 380, Okänd 0 | Kontakt | |
Hispanic_CC_8 | spansktalande engelska | spansktalande engelska | sv | 8 kHz | Call-center | 212 | Hispanic Call-center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 822, Man 1262, Okänd 0 | Kontakt | |
Hispanic_MA_16 | spansktalande engelska | spansktalande engelska | sv | 16 kHz | Media Audio | 155 | Hispanic Call Media-ljud | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 140, Man 219, Okänd 5 | Kontakt | |
Indonesiska_GC_8 | indonesiska | indonesiska | jag gjorde | 8 kHz | Allmänt samtal | 496 | Indonesiska allmänna konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, indonesiska | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 524, Man 454, Okänd 2 | Kontakt | |
Indonesiska_MA_16 | indonesiska | indonesiska | jag gjorde | 16 kHz | Media Audio | 643 | Indonesisk media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 746, Man 1507, Okänd 129 | Kontakt | |
Irish_GC_8 | irländsk | irländsk | sv_IE | 8 kHz | Allmänt samtal | 192 | Irländska allmänna konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 213 , Man 153 , Okänd 0 | Kontakt | |
Japanska_SM_48 | japanska | japanska | ja-JP | 48 kHz | Manusmonolog | 2,335 | Japansk manusmonolog | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1460 Man 1221 Okänd 194 | Kontakt | |
Kannada_CC_8 | kannada | Kannada (I Pipeline) | kn_IN | Call-center | 60 | Kannada (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Kannada_GC | kannada | Kannada (I Pipeline) | kn_IN | Allmänt samtal | 100 | Kannada (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Kannada_MA | kannada | Kannada (I Pipeline) | kn_IN | Media Audio | 40 | Kannada (In Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Korean_CC_8 | koreanska | koreanska | ko_KR | 8 kHz | Call-center | 107 | Koreanska callcenterdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1086, Man 210 , Okänd 4 | Kontakt | |
Korean_MA_16 | koreanska | koreanska | ko_KR | 16 kHz | Media Audio | 204 | Koreanska medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 70 Man 303, Okänd 25 | Kontakt | |
Korean_SM_48 | koreanska | koreanska | ko-KR | 48 kHz | Manusmonolog | 1,955 | Koreansk manusmonolog | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1195 Man 1134 Okänd 122 | Kontakt | |
Malay_GC_8 | Malay | Malay | ms_MY | 8 kHz | Allmänt samtal | 266 | Malajiska allmänna konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (omfång) - 15-60 minuter, Malay i Malaysia | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 316, Man 176 , Okänd 0 | Kontakt | |
Malay_MA_16 | Malay | Malay | ms_MY | 16 kHz | Media Audio | 344 | Malay Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 236, Man 626, Okänd 47 | Kontakt | |
Malayalam_CC_8 | malayalam | Malayalam (I pipeline) | ml_IN | Call-center | 60 | Malayalam (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Malayalam_GC | malayalam | Malayalam (I pipeline) | ml_IN | Allmänt samtal | 100 | Malayalam (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Malayalam_MA | malayalam | Malayalam (I pipeline) | ml_IN | Media Audio | 40 | Malayalam (In Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Marathi_CC_8 | marathi | Marathi (I Pipeline) | mr_IN | Call-center | 60 | Marathi (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Marathi_GC | marathi | Marathi (I Pipeline) | mr_IN | Allmänt samtal | 100 | Marathi (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Marathi_MA | marathi | Marathi (I Pipeline) | mr_IN | Media Audio | 40 | Marathi (In Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Mexican_SM_48 | Spanska (Mexiko) | Spanska (Mexiko) | es-MX | 48 kHz | Manusmonolog | 1,492 | Mexikansk spansk manusmonolog | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1016 Man 1069 Okänd 95 | Kontakt | |
Nederländerna_SM_48 | Dutch | Dutch | nl-NL | 48 kHz | Manusmonolog | 1,205 | Holländsk manusmonolog | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1285 Man 531 Okänd 3 | Kontakt | |
New York engelska_CC_8 | New York engelska | New York engelska | sv | 8 kHz | Call-center | 103 | New York engelska Call-center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 610, Man 532, Okänd 0 | Kontakt | |
New York English_GC_8 | New York engelska | New York engelska | sv | 8 kHz | Allmänt samtal | 107 | New York engelska allmänna konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 118, Man 114, Okänd 0 | Kontakt | |
New York English_MA_16 | New York engelska | New York engelska | sv | 16 kHz | Media Audio | 140 | New York English Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 66, Man 230, Okänd 11 | Kontakt | |
Nya Zeeland_GC_8 | Nya Zeeland engelska | Nya Zeeland engelska | sv_NZ | 8 kHz | Allmänt samtal | 148 | Nya Zeeland engelska allmänna konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 167, man 121, Okänd 4 | Kontakt | |
Nya Zeeland_MA_16 | Nya Zeeland engelska | Nya Zeeland engelska | sv_NZ | 16 kHz | Media Audio | 400 | Nya Zeelands engelska medialjud | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 367, man 678, Okänd 26 | Kontakt | |
Oriya_CC_8 | oriya | Oriya (I Pipeline) | eller_IN | Call-center | 60 | Oriya (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Oriya_GC | oriya | Oriya (I Pipeline) | eller_IN | Allmänt samtal | 100 | Oriya (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Oriya_MA | oriya | Oriya (I Pipeline) | eller_IN | Media Audio | 40 | Oriya (In Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Polska_MA_16 | polska | polska | pl_PL | 16 kHz | Media Audio | 269 | Polskt medialjud | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 173 Man 354 Okänd 6 | Kontakt | |
Polska Polen_SM_48 | Polska (Polen) | Polska (Polen) | pl-PL | 48 kHz | Manusmonolog | 1,482 | Polska Polen - Manusmonolog | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1324 Man 701 Okänd 24 | Kontakt | |
Punjabi_CC_8 | punjabi | Punjabi (I pipeline) | punjabi | Call-center | 60 | Punjabi (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Punjabi_GC | punjabi | Punjabi (I pipeline) | punjabi | Allmänt samtal | 100 | Punjabi (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Punjabi_MA | punjabi | Punjabi (I pipeline) | punjabi | Media Audio | 40 | Punjabi (In Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Ryska_SM_48 | ryska | ryska | ru-RU | 48 kHz | Manusmonolog | 2,398 | Rysk manusmonolog | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1689 Man 1937 Okänd 214 | Kontakt | |
Skotsk_GC_8 | skotsk (engelsk accent) | skotsk (engelsk accent) | sv_AB | 8 kHz | Allmänt samtal | 292 | Skotsk allmänna konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 285 , Man 260, Okänd 3 | Kontakt | |
Singapore_CC_8 | Singapore engelska | Singapore engelska | sv_SG | 8 kHz | Call-center | 218 | Singapore Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 2139 , Man 884, Okänd 21 | Kontakt | |
Singapore_MA_16 | Singapore engelska | Singapore engelska | sv_SG | 16 kHz | Media Audio | 247 | Singapore Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 160, Man 455, Okänd 37 | Kontakt | |
Sydafrikansk engelska_CC_8 | Sydafrikanska engelska | Sydafrikanska engelska | sv_ZA | 8 kHz | Call-center | 261 | South African English Call-Center data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1274 , Man 935 , Okänd 1 | Kontakt | |
Sydafrikansk engelska_MA_16 | Sydafrikanska engelska | Sydafrikanska engelska | sv_ZA | 16 kHz | Media Audio | 251 | Sydafrikanska engelska media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 235, Man 432, Okänd 36 | Kontakt | |
Swahili_CC_8 | swahili | swahili | sw_KE | 8 kHz | Call-center | 230 | Swahili Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 611, Man 833, Okänd 0 | Kontakt | |
Swahili_MA_16 | swahili | swahili | sw_KE | 16 kHz | Media Audio | 265 | Swahili Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 118, Man 493, Okänd 25 | Kontakt | |
Swedish_CC_8 | svenska | svenska | sv_SE | 8 kHz | Call-center | 250 | Svensk Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1581, man 727, Okänd 2 | Kontakt | |
Swedish_MA_16 | svenska | svenska | sv_SE | 16 kHz | Media Audio | 278 | Swedish Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 195, man 500, Okänd 21 | Kontakt | |
Tamil_CC_8 | tamil | Tamil (I Pipeline) | ta_IN | Call-center | 60 | Tamil (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Tamil_GC | tamil | Tamil (I Pipeline) | ta_IN | Allmänt samtal | 100 | Tamil (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Tamil_MA | tamil | Tamil (I Pipeline) | ta_IN | Media Audio | 40 | Tamil (In Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Telugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Allmänt samtal | 553 | Telugu Allmän konversationsdata | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 574 , Man 564, Okänd 0 | Kontakt | |
Telugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Media Audio | 648 | Telugu Media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 207, Man 963, Okänd 2 | Kontakt | |
Telugu_CC_8 | telugu | Telugu (I pipeline) | te_IN | Call-center | 30 | Telugu (In Pipeline) Call-Center-data | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Telugu_GC | telugu | Telugu (I pipeline) | te_IN | Allmänt samtal | 50 | Telugu (In Pipeline) Allmän konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Telugu_MA | telugu | Telugu (I pipeline) | te_IN | Media Audio | 20 | Telugu (In Pipeline) Medialjuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Thai_GC_8 | thailändska | thailändska | th_TH | 8 kHz | Allmänt samtal | 183 | Thailändskt allmänt samtal | Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, ett informellt register som används mellan vänner | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 338, Man 96, Okänd 8 | Kontakt | |
Thai_MA_8 | thailändska | thailändska | th_TH | 16 kHz | Media Audio | 173 | Thai media ljud | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 143, Man 502, Okänd 26 | Kontakt | |
Turkiska Turkiet_SM_48 | turkiska Turkiet | turkiska Turkiet | tr-TR | 48 kHz | Manusmonolog | 2,027 | turkiska Turkiet | Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder | Mono | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 1561 Man 1241 Okänd 31 | Kontakt | |
Vietnamese_GC_8 | vietnamesiska | vietnamesiska | vi_VN | 8 kHz | Allmänt samtal | 295 | Vietnamesiska allmänna konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, norra (t.ex. Hanoi), centrala och södra (t.ex. Ho Chi Minh City). | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 400, man 380, okända 2 | Kontakt | |
Vietnamesiska_MA_16 | vietnamesiska | vietnamesiska | vi_VN | 16 kHz | Media Audio | 257 | Vietnamesiska media ljuddata | Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter | Mono | Webbkälla | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 249, man 200, okända 45 | Kontakt | |
Welsh_GC_8 | walesiska (engelsk accent) | walesiska (engelsk accent) | sv_WL | 8 kHz | Allmänt samtal | 278 | walesiska allmänna konversationsdata | Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, | Dubbel | stationär dator | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinna 270, Man 324, Okänd 0 | Kontakt | |
Storbritannien engelska_WW_16 | UK engelska | UK engelska | sv_uk | 16 kHz | Wake Word | 200 högtalare | Wake Word brittisk engelska | nyckelfraser insamling av data
| 1 kanal | Mobile App | 5.0 | . WAV | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kön: 50 % män, 50 % kvinnor, +/- 10 %. | Kontakt |
Erbjudna tjänster
Expertinsamling av ljuddata är inte all-hands-on-deck för omfattande AI-inställningar. På Shaip kan du till och med överväga följande tjänster för att göra modeller betydligt mer utbredda än vanligt:
Insamling av textdata
Tjänster
Det verkliga värdet av Shaips kognitiva datainsamlingstjänster är att det ger organisationer nyckeln till att låsa upp kritisk information som finns i ostrukturerad data
Tjänster för insamling av bilddata
Se till att din datorvisionsmodell identifierar varje bild exakt för att sömlöst träna nästa generations AI-modeller i framtiden
Tjänster för insamling av videodata
Fokusera nu på datorsyn tillsammans med NLP för att träna dina modeller för att identifiera objekt, individer, avskräckande medel och andra visuella element till perfektion
Rekommenderade resurser
Erbjuder
Ljudkommentar för intelligenta AI: er
Ljudkommentartjänster har varit Shaips starka sida sedan starten. Utveckla, träna och förbättra konversations-AI, chatbots och taligenkänningsmotorer med våra toppmoderna ljudkommentarstjänster.
Köparhandboken
Köparguide: Komplett guide till konversations-AI
Chatboten du pratade med körs på ett avancerat konversations-AI-system som är tränat, testat och byggt med hjälp av massor av taligenkänningsdatauppsättningar.
Datakatalog
Off-the-shelf Speech Data Catalog & Licensing
Det finns ett stort antal vanliga applikationer för taldata i AI-projekt. Vi erbjuder dig enorma mängder högkvalitativ data redo för din röstigenkänning.
Vill du bygga din egen ljuddataset?
Ta kontakt med vår interna expert för taldatainsamling för att skapa ett ljudlager som bäst passar dina krav
Vanliga frågor (FAQ)
Taldatainsamling för en ML-modell avser processen att samla in ljudinspelningar av talat språk. Denna samling hjälper till att träna och förfina algoritmer för maskininlärning, särskilt de som fokuserar på att förstå och bearbeta mänskliga röster.
När du strävar efter att samla in ljuddata för Automatic Speech Recognition (ASR), bör du börja med att definiera ditt projekts specifika behov, inklusive önskat språk, accent och typ av tal. Efter att ha ställt in dessa parametrar, se till att du får alla nödvändiga behörigheter för att respektera användarnas integritet. Använd sedan lämpliga inspelningsenheter eller programvara för att fånga tydliga ljudprover. Varje inspelning bör noggrant annoteras med dess transkription eller andra relevanta metadata och lagras systematiskt för enkel åtkomst.
En taldatauppsättning inom maskininlärning är avgörande för utbildning, testning och validering av modeller som är skräddarsydda för att känna igen, transkribera eller tolka talat språk. Sådana datamängder banar väg för en myriad av applikationer, från röstassistenter och transkriptionstjänster till röstbiometri.
För att samla in exakta data från olika språk och accenter är samarbete med modersmålstalare av önskad språklig bakgrund avgörande. Sträva efter ett varierat och representativt urval för att täcka ett brett spektrum av demografiska nyanser. Använd standardiserad inspelningsutrustning i enhetliga miljöer för att säkerställa ljudkonsistens. Och viktigare, annotera varje databit med detaljerade transkriptioner och metadata, som anger det specifika språket och accenten.