Mest pålitliga tjänster för insamling av taldata för dina AI:er

Träna dina NLP -modeller, VA, TTS -prototyper med mera med kvalitetssamtal, med våra tjänster för ljud- och taldata

Insamling av ljuddata

Upptäck ljuddatapipelines utan flaskhalsar.

Utvalda klienter

Varför behövs datauppsättning för talutbildning för bearbetning av naturligt språk?

Har du någonsin märkt att din smartphone VA, dvs Siri, Bixby eller något annat, interagerar? Hur de besvarar varje fråga och analyserar och presenterar resultat enligt dina krav!

Tja, så mycket som dessa VA:er fascinerar oss, måste dessa intelligenta resurser och program tränas gradvis för att kunna svara, så exakt. Detta är anledningen till att du bör överväga att lägga ut tal/ljud och röstdatainsamling på entreprenad till specialiserade datainsamlingsföretag, med validerande professionell expertis.

Att investera i ljuddatainsamling förbereder din påstådda NLP för att tillgodose en flerspråkig publik. Inte bara det, taldatainsamling för NLP, som och när den hanteras av en expert, tar även hänsyn till insamling på fältet, semantisk analys och ljudtranskription. Med professionella lösningar för insamling av taldata kan du:

  • Skaffa högkvalitativa ljuddataset för att förbättra noggrannheten
  • Rikta in olika scenarier
  • Samla in flerspråkig AI -utbildningsdata
  • Skala din ML-modell för att passa olika demografier och vertikaler

Professionella ljud- / röstdatainsamlingstjänster för NLP

Alla ämnen. Alla scenarier.

Intelligenta NLP -system är allt annat än generiska. Beroende på programmets funktionalitet kan du behöva fokusera på rumsliga och flerspråkiga ljuddatatjänster, som endast kan erbjudas av kända röst-/ljuddatainsamlingsföretag. Det är här Shaip kommer in i sakerna som en mycket pålitlig leverantör av dataanslutningstjänster som är stolta över att göra tunga lyft för dina förment intelligenta AI: er.

På Shaip fokuserar vi främst på att mata modeller med högsta möjliga volym anpassade talprover, på minst möjlig tid. Med oss ​​ombord kan du förvänta dig:

Talsamling
  • Kurerad ljud- / röstdatainsamling för NLP
  • Skräddarsydda program som svarar enligt specifika användningsfall
  • Gör gruvdrift för ljuddatauppgifter redo
  • Mönsterspecifik och automatiserad databehandling
  • Högsta möjliga nivå av domänspecificitet
  • Snabbare tid på marknaden med accelererade AI -modeller

Vår expertis

Justera ljuddata för att förbereda smarta NLP -modeller

Shaip erbjuder end-to-end-tal/ljuddatainsamlingstjänster på över 100 språk för att möjliggöra röstaktiverad teknik för att tillgodose en mångfaldig publik över hela världen. Vi kan arbeta med projekt av alla omfattningar och storlekar; från licensiering av befintliga ljuddatauppsättningar, till hantering av anpassad ljuddatainsamling, till ljudtranskription och annotering. Oavsett hur stort ditt insamlingsprojekt för taldata är, kan vi anpassa ljudinsamlingstjänsterna efter dina behov för att bygga högkvalitativa NLP-datauppsättningar som riktar sig till dialekter, toner och språk. Välj bland vårt stora utbud av taldatauppsättningar och resurser för insamling av ljuddata, för röstaktiverande intelligenta inställningar.

Monolog tal

Monolog Tal Collection

Hantera talbaserade krav som gäller en fristående högtalare för dina Text-to-Speed-prototyper och transkriptionsspecifika krav med skriptad snabbmatning, via enkanalsfiler.

Dialogtal

Dialogtal
Samling

Skapa intelligenta virtuella assistenter, hastighetsspecifika chatbots och modeller för automatisk taligenkänning med flerspråkig exponering via tvåkanalsfiler och transkriberade resurser.

Akustiskt tal

Akustiska data
Samling

Vi kan professionellt spela in ljuddata i studiokvalitet, vare sig det är restauranger, kontor eller hem eller från olika miljöer och språk, genom vårt globala nätverk av samarbetspartners, samtidigt som vi täcker ett bredare akustiskt utbud

Naturligt språkuttryck

Samling för naturligt språkuttryck

Träna smarta kommersiella inställningar för att identifiera olika uttalade kundfraser med liknande betydelse, för att göra AI: erna mer autonoma i tid

Digitala virtuella assistenter

Digital / virtuell
Assistenter

Fokusera på att bygga din kommande Virtual Assistant genom att träna modeller med varningar om mänskligt tal, flerspråkig exponering, kontextuell analys och NLU.

Automatisk taligenkänning

Automatisk taligenkänning (ASR)

Förbättra noggrannheten i dina automatiska taligenkänningssystem (ASR) genom att ha tillgång till toppmoderna diversifierade tal-/ljuddatauppsättningar från ett brett spektrum av demografi.

Naturligt språkuttryck

Flerspråkig tal/ljudträningsdata

Våra mycket skickliga språkproffs över hela världen erbjuder flerspråkig ljud-/talutbildningsdata på flera språk och dialekter inklusive arabiska, danska, kinesiska, afrikaans, Singapore, Nya Zeeland, hebreiska, indonesiska, irländska, koreanska, malajiska, polska, skotska, svenska , franska, tyska, vietnamesiska, thailändska, italienska, spanska och mer.

Digitala virtuella assistenter

Text-to-Speech
(TTS)

För att erbjuda en bättre användarupplevelse med TTS är det viktigt att utveckla ett system som låter naturligt. Bygg en text-to-speech (TTS) flerspråkig modell med hjälp av vår globala arbetsstyrka, som hjälper dig att samla in taldata på 150+ språk och dialekter för att förbättra dina AI-modeller från kontroller i bilen till chatbots och inlärningslösningar med hög- ljuddata av hög kvalitet.

Anledningar att välja Shaip som din pålitliga samlingspartner för taldata

Personer

Personer

Dedikerade och utbildade team:

  • 30,000+ medarbetare för dataskapande, märkning och kvalitetssäkring
  • Godkänd projektledningsteam
  • Erfaren produktutvecklingsteam
  • Talent Pool Sourcing & Onboarding Team
Processen

Processen

Högsta processeffektivitet säkerställs med:

  • Robust 6 Sigma Stage-Gate-process
  • Ett dedikerat team med 6 Sigma-svarta bälten - Viktiga processägare och kvalitetskrav
  • Kontinuerlig förbättring och återkopplingsslinga
plattform

plattform

Den patenterade plattformen erbjuder fördelar:

  • Webbaserad end-to-end-plattform
  • Oklanderlig kvalitet
  • Snabbare TAT
  • Sömlös leverans

Språk: Insamlade ljuddataset

Off-the-shelf tal/ljuddataset

detaljerSpråkdatauppsättningSamplingshastighetDataset typTotala ljudtimmarKort beskrivningDataset BeskrivningljudkanalInspelningsplattformVI ÄR (%)LjudformatTranskriptionsformatAnvändningsfallAntal högtalareCTA
Talsv_US_CC_8Afroamerikansk folkspråkAfroamerikansk folkspråksv8 kHzCall-center211African American Vernacular Call-centerdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 612, man: 1242 och okänd: 12
Talsv_US_MA_16Afroamerikansk folkspråkAfroamerikansk folkspråksv16 kHzMedia Audio154African American Vernacular Media dataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 151, man: 150 och okänd: 10
TalAfrikaans_GC_8afrikaansafrikaansaf_ZA8 kHzAllmänt samtal368Afrikaans Allmän konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (omfång) - 15-60 minuter, afrikaans talas i AfrikaDubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 502, man: 390 och okänd: 2
TalAfrikaans_MA_16afrikaansafrikaansaf_ZA16 kHzMedia Audio658afrikanska mediafilerLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 750, man: 1278 och okänd: 52
TalArabiska_GC_8ArabicArabicar_AE8 kHzAllmänt samtal292Arabiska allmänna konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, arabiska från GulfländernaDubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 171, man: 534 och okänd: 1
TalArabiska_SM_48ArabicArabicar-SA48 kHzManusmonolog1,947Arabisk skriftmonologEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 838 Man 1209 Okänd 78
TalAssamese_CC_8AssamesiskaAssamese (I pipeline) som iCall-center60Assamiska (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalAssamese_GCAssamesiskaAssamese (I pipeline) som iAllmänt samtal100Assamesiska (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalAssamese_MAAssamesiskaAssamese (I pipeline) som iMedia Audio40Assamiska (I Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalBengali_CC_8bengaliBengali (I Pipeline) bn_INCall-center60Bengali (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalBengali_GCbengaliBengali (I Pipeline) bn_INAllmänt samtal100Bengali (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalBengali_MAbengaliBengali (I Pipeline) bn_INMedia Audio40Bengali (In Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalBoston_CC_8Boston engelskaBoston engelskasv8 kHzCall-center177Boston Call-center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 605, man: 711 och okänd: 0
TalBoston_GC_8Boston engelskaBoston engelskasv8 kHzAllmänt samtal32Boston allmänna konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 53, man: 83 och okänd: 0
TalBoston_MA_16Boston engelskaBoston engelskasv16 kHzMedia Audio93Boston Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 43, man: 181 och okänd: 2
TalCanadian_SM_48Kanadensiska franskaKanadensiska franskaFR-CA48 kHzManusmonolog1,222Kanadensiska franskaEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 974 Man 631 Okänd 1
Talkinesiska_CC_8Kinesiska engelskaKinesiska engelskasv8 kHzCall-center169Kinesiska callcenterdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 1790, man: 523 och Okänd: 13
Talkinesiska_MA_16Kinesiska engelskaKinesiska engelskasv16 kHzMedia Audio249Kinesiska media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 126, man: 346 och Okänd: 6
TalKinesiska förenklad_SM_48Förenklad kinesiskaFörenklad kinesiskazh-CN48 kHzManusmonolog2,762Förenklad kinesiskaEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1920 Man 1535 Okänd 270
TalTraditionell kinesisk_SM_48Traditionell kinesiskaTraditionell kinesiskazh-TW48 kHzManusmonolog1,028Traditionell kinesiskaEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1069 Man 262 Okänd 3
TalDanish_GC_8danskadanskada_DK8 kHzAllmänt samtal372Danska allmänna samtalsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 311, Man: 417, Okänd: 0
TalDanska_MA_16danskadanskada_DK16 kHzMedia Audio664Danska media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 369, Man: 864, Okänd: 27
TalDanska_SM_48danskadanskada-DK48 kHzManusmonolog2,579Dansk skriftmonologEnstaka inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder, danska från DanmarkMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1551 Man 1233 Okänd 42
TalEngelska Deep South_CC_8Engelska Deep SouthEngelska Deep Southsv8 kHzCall-center151Engelska Deep South Call-centerdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 221 , Man 1004 , Okänd 7
TalEngelska Deep South_GC_8Engelska Deep SouthEngelska Deep Southsv8 kHzAllmänt samtal56Engelska Deep South Allmän konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 99, Man 31, Okänd 0
TalEngelska Deep South_MA_16Engelska Deep SouthEngelska Deep Southsv16 kHzMedia Audio266Engelska Deep South Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 204, Man 356, Okänd 21
TalTyska_CC_8GermanGermande-De8 kHzCall-center64Tyska callcenterdata Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Monostationär dator. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 478 Man 1440 Okänd 0
TalTyska_IVR_8GermanGermande-De8 kHz IVR200Tyska IVR-datamänniska till maskin. En IVR-typ av flöde där det finns en TTS-uppmaning (t.ex. ”Hur kan jag hjälpa dig”) följt av ett spontant mänskligt svarMonostationär dator. WAV .jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling Kvinna 10115 Hane 8750 Okänd 0
TalGujarati_CC_8gujaratiGujarati (I pipeline) gu_INCall-center60Gujarati (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalGujarati_GCgujaratiGujarati (I pipeline) gu_INAllmänt samtal100Gujarati (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalGujarati_MAgujaratiGujarati (I pipeline) gu_INMedia Audio40Gujarati (In Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalHebreiska_Allmän konversation_8HebreiskaHebreiskahe_IL8 kHzAllmänt samtal399Hebreiska allmänna konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (omfång) - 15-60 minuter, hebreiska i IsraelDubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 414 , Man 399 , Okänd 1
TalHebrew_MA_16HebreiskaHebreiskahe_IL16 kHzMedia Audio427Hebrew Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 361 , Man 513, Okänd 13
TalHindi_MA_16hindihindihej_IN16 kHzMedia Audio219Hindi Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 83 , Man 309, Okänd 0
TalHindi_SM_48hindihindihi-IN48 kHzManusmonolog2,867Hindi scripted monologEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1977 Man 1864 Okänd 147
TalHINGLISH_CC_8HinglishHinglishhg_IN8 kHzCall-center208HINGLISH CallcenterdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 822, Man 1262 , Okänd 0
TalHINGLISH_MA_16HinglishHinglishhg_IN16 kHzMedia Audio216HINGLISH MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 75, Man 380, Okänd 0
TalHispanic_CC_8spansktalande engelskaspansktalande engelskasv8 kHzCall-center212Hispanic Call-center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 822, Man 1262, Okänd 0
TalHispanic_MA_16spansktalande engelskaspansktalande engelskasv16 kHzMedia Audio155Hispanic Call Media-ljudLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 140, Man 219, Okänd 5
TalIndonesiska_GC_8IndonesianIndonesianjag gjorde8 kHzAllmänt samtal496Indonesiska allmänna konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, indonesiskaDubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 524, Man 454, Okänd 2
TalIndonesiska_MA_16IndonesianIndonesianjag gjorde16 kHzMedia Audio643Indonesisk media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 746, Man 1507, Okänd 129
TalIrish_GC_8irländskirländsksv_IE8 kHzAllmänt samtal192Irländska allmänna konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 213 , Man 153 , Okänd 0
TalJapanska_SM_48JapaneseJapaneseja-JP48 kHzManusmonolog2,335Japansk manusmonologEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1460 Man 1221 Okänd 194
TalKannada_CC_8kannadaKannada (I Pipeline) kn_INCall-center60Kannada (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalKannada_GCkannadaKannada (I Pipeline) kn_INAllmänt samtal100Kannada (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalKannada_MAkannadaKannada (I Pipeline) kn_INMedia Audio40Kannada (In Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalKorean_CC_8KoreanKoreanko_KR8 kHzCall-center107Koreanska callcenterdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1086, Man 210 , Okänd 4
TalKorean_MA_16KoreanKoreanko_KR16 kHzMedia Audio204Koreanska medialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 70 Man 303, Okänd 25
TalKorean_SM_48KoreanKoreanko-KR48 kHzManusmonolog1,955Koreansk manusmonologEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1195 Man 1134 Okänd 122
TalMalay_GC_8MalayMalayms_MY8 kHzAllmänt samtal266Malajiska allmänna konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (omfång) - 15-60 minuter, Malay i MalaysiaDubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 316, Man 176 , Okänd 0
TalMalay_MA_16MalayMalayms_MY16 kHzMedia Audio344Malay Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 236, Man 626, Okänd 47
TalMalayalam_CC_8malayalamMalayalam (I pipeline) ml_INCall-center60Malayalam (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalMalayalam_GCmalayalamMalayalam (I pipeline) ml_INAllmänt samtal100Malayalam (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalMalayalam_MAmalayalamMalayalam (I pipeline) ml_INMedia Audio40Malayalam (In Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalMarathi_CC_8marathiMarathi (I Pipeline) mr_INCall-center60Marathi (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalMarathi_GCmarathiMarathi (I Pipeline) mr_INAllmänt samtal100Marathi (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalMarathi_MAmarathiMarathi (I Pipeline) mr_INMedia Audio40Marathi (In Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalMexican_SM_48Spanska (Mexiko)Spanska (Mexiko)es-MX48 kHzManusmonolog1,492Mexikansk spansk manusmonologEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1016 Man 1069 Okänd 95
TalNederländerna_SM_48DutchDutchnl-NL48 kHzManusmonolog1,205Holländsk manusmonologEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1285 Man 531 Okänd 3
TalNew York English_CC_8New York engelskaNew York engelskasv8 kHzCall-center103New York engelska Call-center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 610, Man 532, Okänd 0
TalNew York English_GC_8New York engelskaNew York engelskasv8 kHzAllmänt samtal107New York engelska allmänna konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 118, Man 114, Okänd 0
TalNew York English_MA_16New York engelskaNew York engelskasv16 kHzMedia Audio140New York English Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 66, Man 230, Okänd 11
TalNya Zeeland_GC_8Nya Zeeland engelska Nya Zeeland engelska sv_NZ8 kHzAllmänt samtal148Nya Zeeland engelska allmänna konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 167, man 121, Okänd 4
TalNya Zeeland_MA_16Nya Zeeland engelska Nya Zeeland engelska sv_NZ16 kHzMedia Audio400Nya Zeelands engelska medialjudLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 367, man 678, Okänd 26
TalOriya_CC_8oriyaOriya (I Pipeline) eller_INCall-center60Oriya (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalOriya_GCoriyaOriya (I Pipeline) eller_INAllmänt samtal100Oriya (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalOriya_MAoriyaOriya (I Pipeline) eller_INMedia Audio40Oriya (In Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalPolska_MA_16polskapolskapl_PL16 kHzMedia Audio269Polskt medialjudLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 173 Man 354 Okänd 6
TalPolska Polen_SM_48Polska (Polen)Polska (Polen)pl-PL48 kHzManusmonolog1,482Polska Polen - ManusmonologEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1324 Man 701 Okänd 24
TalPunjabi_CC_8punjabiPunjabi (I pipeline) punjabiCall-center60Punjabi (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalPunjabi_GCpunjabiPunjabi (I pipeline) punjabiAllmänt samtal100Punjabi (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalPunjabi_MApunjabiPunjabi (I pipeline) punjabi Media Audio40Punjabi (In Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalRyska_SM_48RussianRussianru-RU48 kHzManusmonolog2,398Rysk manusmonologEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1689 Man 1937 Okänd 214
TalSkotsk_GC_8skotsk (engelsk accent)skotsk (engelsk accent)sv_AB8 kHzAllmänt samtal292Skotsk allmänna konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 285 , Man 260, Okänd 3
TalSingapore_CC_8Singapore engelskaSingapore engelskasv_SG8 kHzCall-center218Singapore Call-center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 2139 , Man 884, Okänd 21
TalSingapore_MA_16Singapore engelskaSingapore engelskasv_SG16 kHzMedia Audio247Singapore Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 160, Man 455, Okänd 37
TalSydafrikansk engelska_CC_8Sydafrikanska engelskaSydafrikanska engelskasv_ZA8 kHzCall-center261Sydafrikansk engelska Call-center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1274 , Man 935 , Okänd 1
TalSydafrikansk engelska_MA_16Sydafrikanska engelskaSydafrikanska engelskasv_ZA16 kHzMedia Audio251Sydafrikanska engelska media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 235, Man 432, Okänd 36
TalSwahili_CC_8swahiliswahilisw_KE8 kHzCall-center230Swahili Call-center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 611, Man 833, Okänd 0
TalSwahili_MA_16swahiliswahilisw_KE16 kHzMedia Audio265Swahili Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 118, Man 493, Okänd 25
TalSwedish_CC_8SwedishSwedishsv_SE8 kHzCall-center250Svensk Call-center dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1581, man 727, Okänd 2
TalSwedish_MA_16SwedishSwedishsv_SE16 kHzMedia Audio278Swedish Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 195, man 500, Okänd 21
TalTamil_CC_8tamilTamil (I Pipeline) ta_INCall-center60Tamil (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalTamil_GCtamilTamil (I Pipeline) ta_INAllmänt samtal100Tamil (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalTamil_MAtamil Tamil (I Pipeline) ta_INMedia Audio40Tamil (In Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalTelugu_GC_8telugutelugute_IN8 kHzAllmänt samtal553Telugu Allmän konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 574 , Man 564, Okänd 0
TalTelugu_MA_16telugutelugute_IN16 kHzMedia Audio648Telugu Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 207, Man 963, Okänd 2
TalTelugu_CC_8teluguTelugu (I pipeline) te_INCall-center30Telugu (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalTelugu_GCteluguTelugu (I pipeline) te_INAllmänt samtal50Telugu (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,stationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalTelugu_MAteluguTelugu (I pipeline) te_INMedia Audio20Telugu (In Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalThai_GC_8ThaiThaith_TH8 kHzAllmänt samtal183Thailändskt allmänt samtalOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, ett informellt register som används mellan vännerDubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 338, Man 96, Okänd 8
TalThai_MA_8ThaiThaith_TH16 kHzMedia Audio173Thai media ljudLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 143, Man 502, Okänd 26
TalTurkiska Turkiet_SM_48turkiska Turkietturkiska Turkiettr-TR48 kHzManusmonolog2,027turkiska TurkietEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1561 Man 1241 Okänd 31
TalVietnamese_GC_8vietnamesevietnamesevi_VN8 kHzAllmänt samtal295Vietnamesiska allmänna konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, norra (t.ex. Hanoi), centrala och södra (t.ex. Ho Chi Minh City).Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 400, man 380, okända 2
TalVietnamese_MA_16vietnamesevietnamesevi_VN16 kHzMedia Audio257Vietnamesiska media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 249, man 200, okända 45
TalWelsh_GC_8walesiska (engelsk accent)walesiska (engelsk accent)sv_WL8 kHzAllmänt samtal278walesiska allmänna konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 270, Man 324, Okänd 0
TalStorbritannien engelska_WW_16UK engelskaUK engelskasv_uk16 kHzWake Word200Wake Word brittisk engelskanyckelfraser insamling av data
  • 200 högtalare
  • 4 unika nyckelfraser per högtalare
  • 25-30 upprepade nyckelfrasinspelningar per unik nyckelfras
  • 25-30 ljudfiler per unik nyckelfras
  • Totalt 120 inspelade yttranden per talare
1 kanalMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKön: 50 % män, 50 % kvinnor, +/- 10 %.

Erbjudna tjänster

Expertinsamling av ljuddata är inte all-hands-on-deck för omfattande AI-inställningar. På Shaip kan du till och med överväga följande tjänster för att göra modeller betydligt mer utbredda än vanligt:

Insamling av textdata

Insamling av textdata
Tjänster

Det verkliga värdet av Shaips kognitiva datainsamlingstjänster är att det ger organisationer nyckeln till att låsa upp kritisk information som finns i ostrukturerad data

Insamling av bilddata

Tjänster för insamling av bilddata

Se till att din datorvisionsmodell identifierar varje bild exakt för att sömlöst träna nästa generations AI-modeller i framtiden

Insamling av videodata

Tjänster för insamling av videodata

Fokusera nu på datorsyn tillsammans med NLP för att träna dina modeller för att identifiera objekt, individer, avskräckande medel och andra visuella element till perfektion

Shaip Kontakta oss

Vill du bygga din egen ljuddataset?

Ta kontakt med vår interna expert för taldatainsamling för att skapa ett ljudlager som bäst passar dina krav

  • Genom att registrera mig godkänner jag Shaip Integritetspolicy och Användarvillkor och ge mitt samtycke till att ta emot B2B marknadsföringskommunikation från Shaip.