Mest pålitliga tjänster för insamling av taldata för din AI

Träna dina NLP -modeller, VA, TTS -prototyper med mera med kvalitetssamtal, med våra tjänster för ljud- och taldata

Insamling av ljuddata

Upptäck ljuddatapipelines utan flaskhalsar

Utvalda klienter

Professionella tjänster för insamling av ljud/röstdata

Alla ämnen. Alla scenarier.

Hos Shaip ligger vår expertis i att skapa högkvalitativa taldataset utformade för olika AI/ML-krav. Vi erbjuder ett omfattande utbud av språk och spelar in i olika miljöer, vilket gör våra datauppsättningar heltäckande och anpassningsbara. Oditt fokus ligger på att mata modeller med den högsta volymen anpassade taldata, på minsta möjliga tid. Med oss ​​ombord kan du förvänta dig: 

Talsamling
  • Kurerad högkvalitativ flerspråkig ljud-/röstdata för att förbättra noggrannheten
  • Högsta möjliga nivå av domänspecificitet till target olika scenario inställning
  •  Skala din ML-modell för att passa olika demografier och vertikaler
  • Inspelningsmiljöer: Studiokvalitet, med kristallklart ljud med minimalt bakgrundsljud, & Naturliga miljöer, där inspelningar innehåller omgivande ljud för att efterlikna verkliga situationer.

100+

Länder

55K +

Timmar av taldata

250+

Projekt

60+

Språk (100+ dialekter)

8 / 16 / 44 / 48 kHz

Samplingshastighet

Vår expertis

Justera ljuddata för smartare NLP-modeller

Shaip erbjuder end-to-end-tal/ljuddatainsamlingstjänster på över 100 språk för att möjliggöra röstaktiverad teknik för att tillgodose en mångfaldig publik över hela världen. Vi kan arbeta med projekt av alla omfattningar och storlekar; från licensiering av befintliga ljuddatauppsättningar, till hantering av anpassad ljuddatainsamling, till ljudtranskription och annotering. Oavsett hur stort ditt insamlingsprojekt för taldata är, kan vi anpassa ljudinsamlingstjänsterna efter dina behov för att bygga högkvalitativa NLP-datauppsättningar som riktar sig till dialekter, toner och språk. Välj bland vårt stora utbud av taldatauppsättningar och resurser för insamling av ljuddata, för röstaktiverande intelligenta inställningar.

Monologtal

Monolog Tal Collection

Den fokuserar på att bearbeta tal från en enda talare. Använd skriptade uppmaningar för att matas in i enkanaliga ljudfiler, vilket säkerställer att unika talmönster, toner och nyanser som är specifika för den individen fångas.

Dialogtal

Dialogtal
Samling

Interaktion med två personer, replikerande konversationer och dialoger i den verkliga världen med flerspråkig exponering via dubbelkanalsfiler och transkriberade resurser.

Multi-party conversations

Grupp / Muti-party
samtal

Diskussioner med flera personer, fånga gruppdynamik, överlappningar och olika toner för att noggrant träna talmodeller.

Naturligt språkyttrande

Samling för naturligt språkuttryck

Träna AI:er att identifiera fraser eller väcka ord med liknande betydelser med hjälp av olika, rika och autentiska yttranden för avancerad naturlig språkbehandling och förståelse.

Akustiskt tal

Akustiska data
Samling

Vi kan professionellt spela in ljuddata av studiokvalitet, oavsett om det är restauranger, kontor eller hem eller från olika miljöer och språk, samtidigt som vi täcker ett bredare akustiskt område (omfattande ljuddataset).

Automatisk taligenkänning

Automatisk taligenkänning (ASR)

Förbättra noggrannheten i dina automatiska taligenkänningssystem (ASR) genom att ha tillgång till toppmoderna diversifierade tal-/ljuddatauppsättningar från ett brett spektrum av demografi.

Naturligt språkyttrande

Flerspråkig tal/ljudträningsdata

Våra skickliga språkexperter över hela världen erbjuder flerspråkig ljud-/taldata på olika språk och dialekter. Denna insats främjar global kommunikation och överbryggar språkbarriärer, vilket bidrar till mer inkluderande och effektiva AI-lösningar.

Digital virtual assistants

Text-to-Speech
(TTS)

Bygg en text-to-speech (TTS) flerspråkig modell med hjälp av vår globala arbetsstyrka, som hjälper dig att samla in taldata på 150+ språk och dialekter för att förbättra dina AI-modeller från kontroller i bilen till chatbots och inlärningslösningar med hög- ljuddata av hög kvalitet.

Call center recordings

Call Center
Inspelningar

Genuina utbyten mellan agenter och kunder, som stöder många språk som spanska, tyska, amerikansk engelska, bengali, japanska, kinesiska och hindi.

Framgångsberättelser

Konversations-AI-datauppsättningar med över 3 8 timmars data på XNUMX språk

Kunden ville bygga en flerspråkig plattform för indiska språk och samarbetade med Shaip för att samla in, segmentera och transkribera stora datamängder på flera indiska språk. Detta skulle hjälpa till att utveckla effektiva talmodeller som kan driva kundens innovativa nya plattform.

Problem: Över 3,000 8 timmars ljuddata samlad in på XNUMX indiska språk, segmenterad och transkriberad för att utveckla automatisk taligenkänning.

Lösning: Vi tillhandahöll datainsamling, segmentering, transkription och levererade JSON-filer med metadata. Vi samlade in 3000 timmar ljuddata på 8 indiska språk i skala för kundens talteknikprojekt.

Speech data collection case study

Anledningar att välja Shaip som din pålitliga samlingspartner för taldata

Personer

Personer

Dedikerade och utbildade team:

  • 30,000+ medarbetare för dataskapande, märkning och kvalitetssäkring
  • Godkänd projektledningsteam
  • Erfaren produktutvecklingsteam
  • Talent Pool Sourcing & Onboarding Team
Behandla

Behandla

Högsta processeffektivitet säkerställs med:

  • Robust 6 Sigma Stage-Gate-process
  • Ett dedikerat team med 6 Sigma-svarta bälten - Viktiga processägare och kvalitetskrav
  • Kontinuerlig förbättring och återkopplingsslinga
plattform

plattform

Den patenterade plattformen erbjuder fördelar:

  • Webbaserad end-to-end-plattform
  • Oklanderlig kvalitet
  • Snabbare TAT
  • Sömlös leverans

Off-the-shelf tal/ljuddataset

DetaljerSpråkdatauppsättningSamplingshastighetDataset typTotala ljudtimmarKort beskrivningDataset BeskrivningljudkanalInspelningsplattformVI ÄR (%)LjudformatTranskriptionsformatAnvändningsfallAntal högtalareCTA
Talsv_US_CC_8Afroamerikansk folkspråkAfroamerikansk folkspråksv8 kHzCall-center211African American Vernacular Call-centerdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 612, man: 1242 och okänd: 12
Talsv_US_MA_16Afroamerikansk folkspråkAfroamerikansk folkspråksv16 kHzMedia Audio154African American Vernacular Media dataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 151, man: 150 och okänd: 10
TalAfrikaans_GC_8afrikaansafrikaansaf_ZA8 kHzAllmänt samtal368Afrikaans Allmän konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (omfång) - 15-60 minuter, afrikaans talas i AfrikaDubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 502, man: 390 och okänd: 2
TalAfrikaans_MA_16afrikaansafrikaansaf_ZA16 kHzMedia Audio658afrikanska mediafilerLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 750, man: 1278 och okänd: 52
TalArabiska_GC_8arabiskaarabiskaar_AE8 kHzAllmänt samtal292Arabiska allmänna konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, arabiska från GulfländernaDubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 171, man: 534 och okänd: 1
TalArabiska_SM_48arabiskaarabiskaar-SA48 kHzManusmonolog1,947Arabisk skriftmonologEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 838 Man 1209 Okänd 78
TalAssamese_CC_8AssamesiskaAssamese (I pipeline) som iCall-center60Assamiska (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalAssamese_GCAssamesiskaAssamese (I pipeline) som iAllmänt samtal100Assamesiska (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalAssamese_MAAssamesiskaAssamese (I pipeline) som iMedia Audio40Assamiska (I Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalBengali_CC_8bengaliBengali (I Pipeline) bn_INCall-center60Bengali (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalBengali_GCbengaliBengali (I Pipeline) bn_INAllmänt samtal100Bengali (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalBengali_MAbengaliBengali (I Pipeline) bn_INMedia Audio40Bengali (In Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalBoston_CC_8Boston engelskaBoston engelskasv8 kHzCall-center177Boston Call-center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 605, man: 711 och okänd: 0
TalBoston_GC_8Boston engelskaBoston engelskasv8 kHzAllmänt samtal32Boston allmänna konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 53, man: 83 och okänd: 0
TalBoston_MA_16Boston engelskaBoston engelskasv16 kHzMedia Audio93Boston Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 43, man: 181 och okänd: 2
TalCanadian_SM_48Kanadensiska franskaKanadensiska franskaFR-CA48 kHzManusmonolog1,222Kanadensiska franskaEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 974 Man 631 Okänd 1
Talkinesiska_CC_8Kinesiska engelskaKinesiska engelskasv8 kHzCall-center169Kinesiska callcenterdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 1790, man: 523 och Okänd: 13
Talkinesiska_MA_16Kinesiska engelskaKinesiska engelskasv16 kHzMedia Audio249Kinesiska media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 126, man: 346 och Okänd: 6
TalKinesiska förenklad_SM_48Förenklad kinesiskaFörenklad kinesiskazh-CN48 kHzManusmonolog2,762Förenklad kinesiskaEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1920 Man 1535 Okänd 270
TalTraditionell kinesisk_SM_48Traditionell kinesiskaTraditionell kinesiskazh-TW48 kHzManusmonolog1,028Traditionell kinesiskaEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1069 Man 262 Okänd 3
TalDanish_GC_8danskadanskada_DK8 kHzAllmänt samtal372Danska allmänna samtalsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 311, Man: 417, Okänd: 0
TalDanska_MA_16danskadanskada_DK16 kHzMedia Audio664Danska media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna: 369, Man: 864, Okänd: 27
TalDanska_SM_48danskadanskada-DK48 kHzManusmonolog2,579Dansk skriftmonologEnstaka inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder, danska från DanmarkMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1551 Man 1233 Okänd 42
TalEngelska Deep South_CC_8Engelska Deep SouthEngelska Deep Southsv8 kHzCall-center151Engelska Deep South Call-centerdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 221 , Man 1004 , Okänd 7
TalEngelska Deep South_GC_8Engelska Deep SouthEngelska Deep Southsv8 kHzAllmänt samtal56Engelska Deep South Allmän konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 99, Man 31, Okänd 0
TalEngelska Deep South_MA_16Engelska Deep SouthEngelska Deep Southsv16 kHzMedia Audio266Engelska Deep South Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 204, Man 356, Okänd 21
TalTyska_CC_8tyskatyskade-De8 kHzCall-center64Tyska callcenterdata Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,MonoDesktop. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 478 Man 1440 Okänd 0
TalTyska_IVR_8tyskatyskade-De8 kHz IVR200Tyska IVR-datamänniska till maskin. En IVR-typ av flöde där det finns en TTS-uppmaning (t.ex. ”Hur kan jag hjälpa dig”) följt av ett spontant mänskligt svarMonoDesktop. WAV .jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling Kvinna 10115 Hane 8750 Okänd 0
TalGujarati_CC_8gujaratiGujarati (I pipeline) gu_INCall-center60Gujarati (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalGujarati_GCgujaratiGujarati (I pipeline) gu_INAllmänt samtal100Gujarati (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalGujarati_MAgujaratiGujarati (I pipeline) gu_INMedia Audio40Gujarati (In Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalHebreiska_Allmän konversation_8HebreiskaHebreiskahe_IL8 kHzAllmänt samtal399Hebreiska allmänna konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (omfång) - 15-60 minuter, hebreiska i IsraelDubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 414 , Man 399 , Okänd 1
TalHebrew_MA_16HebreiskaHebreiskahe_IL16 kHzMedia Audio427Hebrew Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 361 , Man 513, Okänd 13
TalHindi_MA_16hindihindihej_IN16 kHzMedia Audio219Hindi Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 83 , Man 309, Okänd 0
TalHindi_SM_48hindihindihi-IN48 kHzManusmonolog2,867Hindi scripted monologEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1977 Man 1864 Okänd 147
TalHINGLISH_CC_8HinglishHinglishhg_IN8 kHzCall-center208HINGLISH CallcenterdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 822, Man 1262 , Okänd 0
TalHINGLISH_MA_16HinglishHinglishhg_IN16 kHzMedia Audio216HINGLISH MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 75, Man 380, Okänd 0
TalHispanic_CC_8spansktalande engelskaspansktalande engelskasv8 kHzCall-center212Hispanic Call-center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 822, Man 1262, Okänd 0
TalHispanic_MA_16spansktalande engelskaspansktalande engelskasv16 kHzMedia Audio155Hispanic Call Media-ljudLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 140, Man 219, Okänd 5
TalIndonesiska_GC_8indonesiskaindonesiskajag gjorde8 kHzAllmänt samtal496Indonesiska allmänna konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, indonesiskaDubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 524, Man 454, Okänd 2
TalIndonesiska_MA_16indonesiskaindonesiskajag gjorde16 kHzMedia Audio643Indonesisk media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 746, Man 1507, Okänd 129
TalIrish_GC_8irländskirländsksv_IE8 kHzAllmänt samtal192Irländska allmänna konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 213 , Man 153 , Okänd 0
TalJapanska_SM_48japanskajapanskaja-JP48 kHzManusmonolog2,335Japansk manusmonologEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1460 Man 1221 Okänd 194
TalKannada_CC_8kannadaKannada (I Pipeline) kn_INCall-center60Kannada (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalKannada_GCkannadaKannada (I Pipeline) kn_INAllmänt samtal100Kannada (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalKannada_MAkannadaKannada (I Pipeline) kn_INMedia Audio40Kannada (In Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalKorean_CC_8koreanskakoreanskako_KR8 kHzCall-center107Koreanska callcenterdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1086, Man 210 , Okänd 4
TalKorean_MA_16koreanskakoreanskako_KR16 kHzMedia Audio204Koreanska medialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 70 Man 303, Okänd 25
TalKorean_SM_48koreanskakoreanskako-KR48 kHzManusmonolog1,955Koreansk manusmonologEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1195 Man 1134 Okänd 122
TalMalay_GC_8MalayMalayms_MY8 kHzAllmänt samtal266Malajiska allmänna konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (omfång) - 15-60 minuter, Malay i MalaysiaDubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 316, Man 176 , Okänd 0
TalMalay_MA_16MalayMalayms_MY16 kHzMedia Audio344Malay Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 236, Man 626, Okänd 47
TalMalayalam_CC_8malayalamMalayalam (I pipeline) ml_INCall-center60Malayalam (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalMalayalam_GCmalayalamMalayalam (I pipeline) ml_INAllmänt samtal100Malayalam (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalMalayalam_MAmalayalamMalayalam (I pipeline) ml_INMedia Audio40Malayalam (In Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalMarathi_CC_8marathiMarathi (I Pipeline) mr_INCall-center60Marathi (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalMarathi_GCmarathiMarathi (I Pipeline) mr_INAllmänt samtal100Marathi (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalMarathi_MAmarathiMarathi (I Pipeline) mr_INMedia Audio40Marathi (In Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalMexican_SM_48Spanska (Mexiko)Spanska (Mexiko)es-MX48 kHzManusmonolog1,492Mexikansk spansk manusmonologEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1016 Man 1069 Okänd 95
TalNederländerna_SM_48DutchDutchnl-NL48 kHzManusmonolog1,205Holländsk manusmonologEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1285 Man 531 Okänd 3
TalNew York engelska_CC_8New York engelskaNew York engelskasv8 kHzCall-center103New York engelska Call-center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 610, Man 532, Okänd 0
TalNew York English_GC_8New York engelskaNew York engelskasv8 kHzAllmänt samtal107New York engelska allmänna konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 118, Man 114, Okänd 0
TalNew York English_MA_16New York engelskaNew York engelskasv16 kHzMedia Audio140New York English Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 66, Man 230, Okänd 11
TalNya Zeeland_GC_8Nya Zeeland engelska Nya Zeeland engelska sv_NZ8 kHzAllmänt samtal148Nya Zeeland engelska allmänna konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 167, man 121, Okänd 4
TalNya Zeeland_MA_16Nya Zeeland engelska Nya Zeeland engelska sv_NZ16 kHzMedia Audio400Nya Zeelands engelska medialjudLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 367, man 678, Okänd 26
TalOriya_CC_8oriyaOriya (I Pipeline) eller_INCall-center60Oriya (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalOriya_GCoriyaOriya (I Pipeline) eller_INAllmänt samtal100Oriya (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalOriya_MAoriyaOriya (I Pipeline) eller_INMedia Audio40Oriya (In Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalPolska_MA_16polskapolskapl_PL16 kHzMedia Audio269Polskt medialjudLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 173 Man 354 Okänd 6
TalPolska Polen_SM_48Polska (Polen)Polska (Polen)pl-PL48 kHzManusmonolog1,482Polska Polen - ManusmonologEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1324 Man 701 Okänd 24
TalPunjabi_CC_8punjabiPunjabi (I pipeline) punjabiCall-center60Punjabi (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalPunjabi_GCpunjabiPunjabi (I pipeline) punjabiAllmänt samtal100Punjabi (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalPunjabi_MApunjabiPunjabi (I pipeline) punjabi Media Audio40Punjabi (In Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalRyska_SM_48ryskaryskaru-RU48 kHzManusmonolog2,398Rysk manusmonologEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1689 Man 1937 Okänd 214
TalSkotsk_GC_8skotsk (engelsk accent)skotsk (engelsk accent)sv_AB8 kHzAllmänt samtal292Skotsk allmänna konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 285 , Man 260, Okänd 3
TalSingapore_CC_8Singapore engelskaSingapore engelskasv_SG8 kHzCall-center218Singapore Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 2139 , Man 884, Okänd 21
TalSingapore_MA_16Singapore engelskaSingapore engelskasv_SG16 kHzMedia Audio247Singapore Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 160, Man 455, Okänd 37
TalSydafrikansk engelska_CC_8Sydafrikanska engelskaSydafrikanska engelskasv_ZA8 kHzCall-center261South African English Call-Center dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1274 , Man 935 , Okänd 1
TalSydafrikansk engelska_MA_16Sydafrikanska engelskaSydafrikanska engelskasv_ZA16 kHzMedia Audio251Sydafrikanska engelska media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 235, Man 432, Okänd 36
TalSwahili_CC_8swahiliswahilisw_KE8 kHzCall-center230Swahili Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 611, Man 833, Okänd 0
TalSwahili_MA_16swahiliswahilisw_KE16 kHzMedia Audio265Swahili Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 118, Man 493, Okänd 25
TalSwedish_CC_8svenskasvenskasv_SE8 kHzCall-center250Svensk Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1581, man 727, Okänd 2
TalSwedish_MA_16svenskasvenskasv_SE16 kHzMedia Audio278Swedish Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 195, man 500, Okänd 21
TalTamil_CC_8tamilTamil (I Pipeline) ta_INCall-center60Tamil (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalTamil_GCtamilTamil (I Pipeline) ta_INAllmänt samtal100Tamil (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalTamil_MAtamil Tamil (I Pipeline) ta_INMedia Audio40Tamil (In Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalTelugu_GC_8telugutelugute_IN8 kHzAllmänt samtal553Telugu Allmän konversationsdataOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 574 , Man 564, Okänd 0
TalTelugu_MA_16telugutelugute_IN16 kHzMedia Audio648Telugu Media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 207, Man 963, Okänd 2
TalTelugu_CC_8teluguTelugu (I pipeline) te_INCall-center30Telugu (In Pipeline) Call-Center-dataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalTelugu_GCteluguTelugu (I pipeline) te_INAllmänt samtal50Telugu (In Pipeline) Allmän konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Desktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalTelugu_MAteluguTelugu (I pipeline) te_INMedia Audio20Telugu (In Pipeline) MedialjuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalThai_GC_8thailändskathailändskath_TH8 kHzAllmänt samtal183Thailändskt allmänt samtalOskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, ett informellt register som används mellan vännerDubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 338, Man 96, Okänd 8
TalThai_MA_8thailändskathailändskath_TH16 kHzMedia Audio173Thai media ljudLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 143, Man 502, Okänd 26
TalTurkiska Turkiet_SM_48turkiska Turkietturkiska Turkiettr-TR48 kHzManusmonolog2,027turkiska TurkietEnspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 1561 Man 1241 Okänd 31
TalVietnamese_GC_8vietnamesiskavietnamesiskavi_VN8 kHzAllmänt samtal295Vietnamesiska allmänna konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, norra (t.ex. Hanoi), centrala och södra (t.ex. Ho Chi Minh City).DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 400, man 380, okända 2
TalVietnamesiska_MA_16vietnamesiskavietnamesiskavi_VN16 kHzMedia Audio257Vietnamesiska media ljuddataLicenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonoWebbkälla5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 249, man 200, okända 45
TalWelsh_GC_8walesiska (engelsk accent)walesiska (engelsk accent)sv_WL8 kHzAllmänt samtal278walesiska allmänna konversationsdataOmanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,DubbelDesktop5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinna 270, Man 324, Okänd 0
TalStorbritannien engelska_WW_16UK engelskaUK engelskasv_uk16 kHzWake Word200 högtalareWake Word brittisk engelskanyckelfraser insamling av data
  • 200 högtalare
  • 4 unika nyckelfraser per högtalare
  • 25-30 upprepade nyckelfrasinspelningar per unik nyckelfras
  • 25-30 ljudfiler per unik nyckelfras
  • Totalt 120 inspelade yttranden per talare
1 kanalMobile App5.0. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKön: 50 % män, 50 % kvinnor, +/- 10 %.

Erbjudna tjänster

Expertinsamling av ljuddata är inte all-hands-on-deck för omfattande AI-inställningar. På Shaip kan du till och med överväga följande tjänster för att göra modeller betydligt mer utbredda än vanligt:

Insamling av textdata

Insamling av textdata
Tjänster

Det verkliga värdet av Shaips kognitiva datainsamlingstjänster är att det ger organisationer nyckeln till att låsa upp kritisk information som finns i ostrukturerad data

Bilddatainsamling

Tjänster för insamling av bilddata

Se till att din datorvisionsmodell identifierar varje bild exakt för att sömlöst träna nästa generations AI-modeller i framtiden

Insamling av videodata

Tjänster för insamling av videodata

Fokusera nu på datorsyn tillsammans med NLP för att träna dina modeller för att identifiera objekt, individer, avskräckande medel och andra visuella element till perfektion

Shaip kontakta oss

Vill du bygga din egen ljuddataset?

Ta kontakt med vår interna expert för taldatainsamling för att skapa ett ljudlager som bäst passar dina krav

  • Genom att registrera mig godkänner jag Shaip Sekretesspolicy och Användarvillkor och ge mitt samtycke till att ta emot B2B marknadsföringskommunikation från Shaip.

Taldatainsamling för en ML-modell avser processen att samla in ljudinspelningar av talat språk. Denna samling hjälper till att träna och förfina algoritmer för maskininlärning, särskilt de som fokuserar på att förstå och bearbeta mänskliga röster.

När du strävar efter att samla in ljuddata för Automatic Speech Recognition (ASR), bör du börja med att definiera ditt projekts specifika behov, inklusive önskat språk, accent och typ av tal. Efter att ha ställt in dessa parametrar, se till att du får alla nödvändiga behörigheter för att respektera användarnas integritet. Använd sedan lämpliga inspelningsenheter eller programvara för att fånga tydliga ljudprover. Varje inspelning bör noggrant annoteras med dess transkription eller andra relevanta metadata och lagras systematiskt för enkel åtkomst.

En taldatauppsättning inom maskininlärning är avgörande för utbildning, testning och validering av modeller som är skräddarsydda för att känna igen, transkribera eller tolka talat språk. Sådana datamängder banar väg för en myriad av applikationer, från röstassistenter och transkriptionstjänster till röstbiometri.

För att samla in exakta data från olika språk och accenter är samarbete med modersmålstalare av önskad språklig bakgrund avgörande. Sträva efter ett varierat och representativt urval för att täcka ett brett spektrum av demografiska nyanser. Använd standardiserad inspelningsutrustning i enhetliga miljöer för att säkerställa ljudkonsistens. Och viktigare, annotera varje databit med detaljerade transkriptioner och metadata, som anger det specifika språket och accenten.