Mest pålitliga tjänster för insamling av taldata för din AI

Träna dina NLP -modeller, VA, TTS -prototyper med mera med kvalitetssamtal, med våra tjänster för ljud- och taldata

Upptäck ljuddatapipelines utan flaskhalsar

Utvalda klienter

föregående

Nästa

Professionella tjänster för insamling av ljud/röstdata

Alla ämnen. Alla scenarier.

Hos Shaip ligger vår expertis i att skapa högkvalitativa taldataset utformade för olika AI/ML-krav. Vi erbjuder ett omfattande utbud av språk och spelar in i olika miljöer, vilket gör våra datauppsättningar heltäckande och anpassningsbara. Oditt fokus ligger på att mata modeller med den högsta volymen anpassade taldata, på minsta möjliga tid. Med oss ombord kan du förvänta dig:

Kurerad högkvalitativ flerspråkig ljud-/röstdata för att förbättra noggrannheten
Högsta möjliga nivå av domänspecificitet till target olika scenario inställning

Skala din ML-modell för att passa olika demografier och vertikaler
Inspelningsmiljöer: Studiokvalitet, med kristallklart ljud med minimalt bakgrundsljud, & Naturliga miljöer, där inspelningar innehåller omgivande ljud för att efterlikna verkliga situationer.

100+

Länder

55K +

Timmar av taldata

250+

Projekt

60+

Språk (100+ dialekter)

8 / 16 / 44 / 48 kHz

Samplingshastighet

Vår expertis

Justera ljuddata för smartare NLP-modeller

Shaip erbjuder end-to-end-tal/ljuddatainsamlingstjänster på över 100 språk för att möjliggöra röstaktiverad teknik för att tillgodose en mångfaldig publik över hela världen. Vi kan arbeta med projekt av alla omfattningar och storlekar; från licensiering av befintliga ljuddatauppsättningar, till hantering av anpassad ljuddatainsamling, till ljudtranskription och annotering. Oavsett hur stort ditt insamlingsprojekt för taldata är, kan vi anpassa ljudinsamlingstjänsterna efter dina behov för att bygga högkvalitativa NLP-datauppsättningar som riktar sig till dialekter, toner och språk. Välj bland vårt stora utbud av taldatauppsättningar och resurser för insamling av ljuddata, för röstaktiverande intelligenta inställningar.

Framgångsberättelser

Konversations-AI-datauppsättningar med över 3 8 timmars data på XNUMX språk

Kunden ville bygga en flerspråkig plattform för indiska språk och samarbetade med Shaip för att samla in, segmentera och transkribera stora datamängder på flera indiska språk. Detta skulle hjälpa till att utveckla effektiva talmodeller som kan driva kundens innovativa nya plattform.

Problem: Över 3,000 8 timmars ljuddata samlad in på XNUMX indiska språk, segmenterad och transkriberad för att utveckla automatisk taligenkänning.

Lösning: Vi tillhandahöll datainsamling, segmentering, transkription och levererade JSON-filer med metadata. Vi samlade in 3000 timmar ljuddata på 8 indiska språk i skala för kundens talteknikprojekt.

Anledningar att välja Shaip som din pålitliga samlingspartner för taldata

Personer

Dedikerade och utbildade team:

30,000+ medarbetare för dataskapande, märkning och kvalitetssäkring
Godkänd projektledningsteam
Erfaren produktutvecklingsteam
Talent Pool Sourcing & Onboarding Team

Behandla

Högsta processeffektivitet säkerställs med:

Robust 6 Sigma Stage-Gate-process
Ett dedikerat team med 6 Sigma-svarta bälten - Viktiga processägare och kvalitetskrav
Kontinuerlig förbättring och återkopplingsslinga

plattform

Den patenterade plattformen erbjuder fördelar:

Webbaserad end-to-end-plattform
Oklanderlig kvalitet
Snabbare TAT
Sömlös leverans

Personer

Dedikerade och utbildade team:

30,000+ medarbetare för dataskapande, märkning och kvalitetssäkring
Godkänd projektledningsteam
Erfaren produktutvecklingsteam
Talent Pool Sourcing & Onboarding Team

Behandla

Högsta processeffektivitet säkerställs med:

Robust 6 Sigma Stage-Gate-process
Ett dedikerat team med 6 Sigma-svarta bälten - Viktiga processägare och kvalitetskrav
Kontinuerlig förbättring och återkopplingsslinga

plattform

Den patenterade plattformen erbjuder fördelar:

Webbaserad end-to-end-plattform
Oklanderlig kvalitet
Snabbare TAT
Sömlös leverans

Off-the-shelf tal/ljuddataset

Corpus ID (Unikt)	Nyckelord	Språkdatauppsättning	Språkkod	Samplingshastighet	Dataset typ	Totala ljudtimmar	Kort beskrivning	Dataset Beskrivning	ljudkanal	Inspelningsplattform	VI ÄR (%)	Ljudformat	Transkriptionsformat	Användningsfall	Antal högtalare	CTA
sv_US_CC_8	Afroamerikansk folkspråk	Afroamerikansk folkspråk	sv	8 kHz	Call-center	211	African American Vernacular Call-centerdata	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna: 612, man: 1242 och okänd: 12	Kontakta oss
sv_US_MA_16	Afroamerikansk folkspråk	Afroamerikansk folkspråk	sv	16 kHz	Media Audio	154	African American Vernacular Media data	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna: 151, man: 150 och okänd: 10	Kontakta oss
Afrikaans_GC_8	afrikaans	afrikaans	af_ZA	8 kHz	Allmänt samtal	368	Afrikaans Allmän konversationsdata	Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (omfång) - 15-60 minuter, afrikaans talas i Afrika	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna: 502, man: 390 och okänd: 2	Kontakta oss
Afrikaans_MA_16	afrikaans	afrikaans	af_ZA	16 kHz	Media Audio	658	afrikanska mediafiler	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna: 750, man: 1278 och okänd: 52	Kontakta oss
Arabiska_GC_8	arabiska	arabiska	ar_AE	8 kHz	Allmänt samtal	292	Arabiska allmänna konversationsdata	Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, arabiska från Gulfländerna	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna: 171, man: 534 och okänd: 1	Kontakta oss
Arabiska_SM_48	arabiska	arabiska	ar-SA	48 kHz	Manusmonolog	1,947	Arabisk skriftmonolog	Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder	Mono	Mobile App	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 838 Man 1209 Okänd 78	Kontakta oss
Assamese_CC_8	Assamesiska	Assamese (I pipeline)	som i		Call-center	60	Assamiska (In Pipeline) Call-Center-data	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Assamese_GC	Assamesiska	Assamese (I pipeline)	som i		Allmänt samtal	100	Assamesiska (In Pipeline) Allmän konversationsdata	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Assamese_MA	Assamesiska	Assamese (I pipeline)	som i		Media Audio	40	Assamiska (I Pipeline) Medialjuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter		Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Bengali_CC_8	bengali	Bengali (I Pipeline)	bn_IN		Call-center	60	Bengali (In Pipeline) Call-Center-data	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Bengali_GC	bengali	Bengali (I Pipeline)	bn_IN		Allmänt samtal	100	Bengali (In Pipeline) Allmän konversationsdata	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Bengali_MA	bengali	Bengali (I Pipeline)	bn_IN		Media Audio	40	Bengali (In Pipeline) Medialjuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter		Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Boston_CC_8	Boston engelska	Boston engelska	sv	8 kHz	Call-center	177	Boston Call-center-data	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna: 605, man: 711 och okänd: 0	Kontakta oss
Boston_GC_8	Boston engelska	Boston engelska	sv	8 kHz	Allmänt samtal	32	Boston allmänna konversationsdata	Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna: 53, man: 83 och okänd: 0	Kontakta oss
Boston_MA_16	Boston engelska	Boston engelska	sv	16 kHz	Media Audio	93	Boston Media ljuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna: 43, man: 181 och okänd: 2	Kontakta oss
Canadian_SM_48	Kanadensiska franska	Kanadensiska franska	FR-CA	48 kHz	Manusmonolog	1,222	Kanadensiska franska	Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder	Mono	Mobile App	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 974 Man 631 Okänd 1	Kontakta oss
kinesiska_CC_8	Kinesiska engelska	Kinesiska engelska	sv	8 kHz	Call-center	169	Kinesiska callcenterdata	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna: 1790, man: 523 och Okänd: 13	Kontakta oss
kinesiska_MA_16	Kinesiska engelska	Kinesiska engelska	sv	16 kHz	Media Audio	249	Kinesiska media ljuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna: 126, man: 346 och Okänd: 6	Kontakta oss
Kinesiska förenklad_SM_48	Förenklad kinesiska	Förenklad kinesiska	zh-CN	48 kHz	Manusmonolog	2,762	Förenklad kinesiska	Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder	Mono	Mobile App	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 1920 Man 1535 Okänd 270	Kontakta oss
Traditionell kinesisk_SM_48	Traditionell kinesiska	Traditionell kinesiska	zh-TW	48 kHz	Manusmonolog	1,028	Traditionell kinesiska	Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder	Mono	Mobile App	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 1069 Man 262 Okänd 3	Kontakta oss
Danish_GC_8	danska	danska	da_DK	8 kHz	Allmänt samtal	372	Danska allmänna samtalsdata	Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna: 311, Man: 417, Okänd: 0	Kontakta oss
Danska_MA_16	danska	danska	da_DK	16 kHz	Media Audio	664	Danska media ljuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna: 369, Man: 864, Okänd: 27	Kontakta oss
Danska_SM_48	danska	danska	da-DK	48 kHz	Manusmonolog	2,579	Dansk skriftmonolog	Enstaka inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder, danska från Danmark	Mono	Mobile App	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 1551 Man 1233 Okänd 42	Kontakta oss
Engelska Deep South_CC_8	Engelska Deep South	Engelska Deep South	sv	8 kHz	Call-center	151	Engelska Deep South Call-centerdata	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 221 , Man 1004 , Okänd 7	Kontakta oss
Engelska Deep South_GC_8	Engelska Deep South	Engelska Deep South	sv	8 kHz	Allmänt samtal	56	Engelska Deep South Allmän konversationsdata	Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 99, Man 31, Okänd 0	Kontakta oss
Engelska Deep South_MA_16	Engelska Deep South	Engelska Deep South	sv	16 kHz	Media Audio	266	Engelska Deep South Media ljuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 204, Man 356, Okänd 21	Kontakta oss
Tyska_CC_8	tyska	tyska	de-De	8 kHz	Call-center	64	Tyska callcenterdata	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,	Mono	Desktop		. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 478 Man 1440 Okänd 0	Kontakta oss
Tyska_IVR_8	tyska	tyska	de-De	8 kHz	IVR	200	Tyska IVR-data	människa till maskin. En IVR-typ av flöde där det finns en TTS-uppmaning (t.ex. ”Hur kan jag hjälpa dig”) följt av ett spontant mänskligt svar	Mono	Desktop		. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 10115 Hane 8750 Okänd 0	Kontakta oss
Gujarati_CC_8	gujarati	Gujarati (I pipeline)	gu_IN		Call-center	60	Gujarati (In Pipeline) Call-Center-data	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Gujarati_GC	gujarati	Gujarati (I pipeline)	gu_IN		Allmänt samtal	100	Gujarati (In Pipeline) Allmän konversationsdata	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Gujarati_MA	gujarati	Gujarati (I pipeline)	gu_IN		Media Audio	40	Gujarati (In Pipeline) Medialjuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter		Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Hebreiska_Allmän konversation_8	Hebreiska	Hebreiska	he_IL	8 kHz	Allmänt samtal	399	Hebreiska allmänna konversationsdata	Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (omfång) - 15-60 minuter, hebreiska i Israel	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 414 , Man 399 , Okänd 1	Kontakta oss
Hebrew_MA_16	Hebreiska	Hebreiska	he_IL	16 kHz	Media Audio	427	Hebrew Media ljuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 361 , Man 513, Okänd 13	Kontakta oss
Hindi_MA_16	hindi	hindi	hej_IN	16 kHz	Media Audio	219	Hindi Media ljuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 83 , Man 309, Okänd 0	Kontakta oss
Hindi_SM_48	hindi	hindi	hi-IN	48 kHz	Manusmonolog	2,867	Hindi scripted monolog	Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder	Mono	Mobile App	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 1977 Man 1864 Okänd 147	Kontakta oss
HINGLISH_CC_8	Hinglish	Hinglish	hg_IN	8 kHz	Call-center	208	HINGLISH Callcenterdata	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 822, Man 1262 , Okänd 0	Kontakta oss
HINGLISH_MA_16	Hinglish	Hinglish	hg_IN	16 kHz	Media Audio	216	HINGLISH Medialjuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 75, Man 380, Okänd 0	Kontakta oss
Hispanic_CC_8	spansktalande engelska	spansktalande engelska	sv	8 kHz	Call-center	212	Hispanic Call-center-data	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 822, Man 1262, Okänd 0	Kontakta oss
Hispanic_MA_16	spansktalande engelska	spansktalande engelska	sv	16 kHz	Media Audio	155	Hispanic Call Media-ljud	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 140, Man 219, Okänd 5	Kontakta oss
Indonesiska_GC_8	indonesiska	indonesiska	jag gjorde	8 kHz	Allmänt samtal	496	Indonesiska allmänna konversationsdata	Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, indonesiska	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 524, Man 454, Okänd 2	Kontakta oss
Indonesiska_MA_16	indonesiska	indonesiska	jag gjorde	16 kHz	Media Audio	643	Indonesisk media ljuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 746, Man 1507, Okänd 129	Kontakta oss
Irish_GC_8	irländsk	irländsk	sv_IE	8 kHz	Allmänt samtal	192	Irländska allmänna konversationsdata	Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 213 , Man 153 , Okänd 0	Kontakta oss
Japanska_SM_48	japanska	japanska	ja-JP	48 kHz	Manusmonolog	2,335	Japansk manusmonolog	Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder	Mono	Mobile App	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 1460 Man 1221 Okänd 194	Kontakta oss
Kannada_CC_8	kannada	Kannada (I Pipeline)	kn_IN		Call-center	60	Kannada (In Pipeline) Call-Center-data	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Kannada_GC	kannada	Kannada (I Pipeline)	kn_IN		Allmänt samtal	100	Kannada (In Pipeline) Allmän konversationsdata	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Kannada_MA	kannada	Kannada (I Pipeline)	kn_IN		Media Audio	40	Kannada (In Pipeline) Medialjuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter		Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Korean_CC_8	koreanska	koreanska	ko_KR	8 kHz	Call-center	107	Koreanska callcenterdata	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 1086, Man 210 , Okänd 4	Kontakta oss
Korean_MA_16	koreanska	koreanska	ko_KR	16 kHz	Media Audio	204	Koreanska medialjuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 70 Man 303, Okänd 25	Kontakta oss
Korean_SM_48	koreanska	koreanska	ko-KR	48 kHz	Manusmonolog	1,955	Koreansk manusmonolog	Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder	Mono	Mobile App	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 1195 Man 1134 Okänd 122	Kontakta oss
Malay_GC_8	Malay	Malay	ms_MY	8 kHz	Allmänt samtal	266	Malajiska allmänna konversationsdata	Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (omfång) - 15-60 minuter, Malay i Malaysia	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 316, Man 176 , Okänd 0	Kontakta oss
Malay_MA_16	Malay	Malay	ms_MY	16 kHz	Media Audio	344	Malay Media ljuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 236, Man 626, Okänd 47	Kontakta oss
Malayalam_CC_8	malayalam	Malayalam (I pipeline)	ml_IN		Call-center	60	Malayalam (In Pipeline) Call-Center-data	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Malayalam_GC	malayalam	Malayalam (I pipeline)	ml_IN		Allmänt samtal	100	Malayalam (In Pipeline) Allmän konversationsdata	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Malayalam_MA	malayalam	Malayalam (I pipeline)	ml_IN		Media Audio	40	Malayalam (In Pipeline) Medialjuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter		Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Marathi_CC_8	marathi	Marathi (I Pipeline)	mr_IN		Call-center	60	Marathi (In Pipeline) Call-Center-data	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Marathi_GC	marathi	Marathi (I Pipeline)	mr_IN		Allmänt samtal	100	Marathi (In Pipeline) Allmän konversationsdata	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Marathi_MA	marathi	Marathi (I Pipeline)	mr_IN		Media Audio	40	Marathi (In Pipeline) Medialjuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter		Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Mexican_SM_48	Spanska (Mexiko)	Spanska (Mexiko)	es-MX	48 kHz	Manusmonolog	1,492	Mexikansk spansk manusmonolog	Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder	Mono	Mobile App	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 1016 Man 1069 Okänd 95	Kontakta oss
Nederländerna_SM_48	Dutch	Dutch	nl-NL	48 kHz	Manusmonolog	1,205	Holländsk manusmonolog	Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder	Mono	Mobile App	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 1285 Man 531 Okänd 3	Kontakta oss
New York engelska_CC_8	New York engelska	New York engelska	sv	8 kHz	Call-center	103	New York engelska Call-center-data	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 610, Man 532, Okänd 0	Kontakta oss
New York English_GC_8	New York engelska	New York engelska	sv	8 kHz	Allmänt samtal	107	New York engelska allmänna konversationsdata	Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 118, Man 114, Okänd 0	Kontakta oss
New York English_MA_16	New York engelska	New York engelska	sv	16 kHz	Media Audio	140	New York English Media ljuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 66, Man 230, Okänd 11	Kontakta oss
Nya Zeeland_GC_8	Nya Zeeland engelska	Nya Zeeland engelska	sv_NZ	8 kHz	Allmänt samtal	148	Nya Zeeland engelska allmänna konversationsdata	Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 167, man 121, Okänd 4	Kontakta oss
Nya Zeeland_MA_16	Nya Zeeland engelska	Nya Zeeland engelska	sv_NZ	16 kHz	Media Audio	400	Nya Zeelands engelska medialjud	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 367, man 678, Okänd 26	Kontakta oss
Oriya_CC_8	oriya	Oriya (I Pipeline)	eller_IN		Call-center	60	Oriya (In Pipeline) Call-Center-data	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Oriya_GC	oriya	Oriya (I Pipeline)	eller_IN		Allmänt samtal	100	Oriya (In Pipeline) Allmän konversationsdata	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Oriya_MA	oriya	Oriya (I Pipeline)	eller_IN		Media Audio	40	Oriya (In Pipeline) Medialjuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter		Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Polska_MA_16	polska	polska	pl_PL	16 kHz	Media Audio	269	Polskt medialjud	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 173 Man 354 Okänd 6	Kontakta oss
Polska Polen_SM_48	Polska (Polen)	Polska (Polen)	pl-PL	48 kHz	Manusmonolog	1,482	Polska Polen - Manusmonolog	Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder	Mono	Mobile App	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 1324 Man 701 Okänd 24	Kontakta oss
Punjabi_CC_8	punjabi	Punjabi (I pipeline)	punjabi		Call-center	60	Punjabi (In Pipeline) Call-Center-data	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Punjabi_GC	punjabi	Punjabi (I pipeline)	punjabi		Allmänt samtal	100	Punjabi (In Pipeline) Allmän konversationsdata	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Punjabi_MA	punjabi	Punjabi (I pipeline)	punjabi		Media Audio	40	Punjabi (In Pipeline) Medialjuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter		Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Ryska_SM_48	ryska	ryska	ru-RU	48 kHz	Manusmonolog	2,398	Rysk manusmonolog	Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder	Mono	Mobile App	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 1689 Man 1937 Okänd 214	Kontakta oss
Skotsk_GC_8	skotsk (engelsk accent)	skotsk (engelsk accent)	sv_AB	8 kHz	Allmänt samtal	292	Skotsk allmänna konversationsdata	Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 285 , Man 260, Okänd 3	Kontakta oss
Singapore_CC_8	Singapore engelska	Singapore engelska	sv_SG	8 kHz	Call-center	218	Singapore Call-Center-data	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 2139 , Man 884, Okänd 21	Kontakta oss
Singapore_MA_16	Singapore engelska	Singapore engelska	sv_SG	16 kHz	Media Audio	247	Singapore Media ljuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 160, Man 455, Okänd 37	Kontakta oss
Sydafrikansk engelska_CC_8	Sydafrikanska engelska	Sydafrikanska engelska	sv_ZA	8 kHz	Call-center	261	South African English Call-Center data	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 1274 , Man 935 , Okänd 1	Kontakta oss
Sydafrikansk engelska_MA_16	Sydafrikanska engelska	Sydafrikanska engelska	sv_ZA	16 kHz	Media Audio	251	Sydafrikanska engelska media ljuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 235, Man 432, Okänd 36	Kontakta oss
Swahili_CC_8	swahili	swahili	sw_KE	8 kHz	Call-center	230	Swahili Call-Center-data	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 611, Man 833, Okänd 0	Kontakta oss
Swahili_MA_16	swahili	swahili	sw_KE	16 kHz	Media Audio	265	Swahili Media ljuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 118, Man 493, Okänd 25	Kontakta oss
Swedish_CC_8	svenska	svenska	sv_SE	8 kHz	Call-center	250	Svensk Call-Center-data	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 1581, man 727, Okänd 2	Kontakta oss
Swedish_MA_16	svenska	svenska	sv_SE	16 kHz	Media Audio	278	Swedish Media ljuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 195, man 500, Okänd 21	Kontakta oss
Tamil_CC_8	tamil	Tamil (I Pipeline)	ta_IN		Call-center	60	Tamil (In Pipeline) Call-Center-data	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Tamil_GC	tamil	Tamil (I Pipeline)	ta_IN		Allmänt samtal	100	Tamil (In Pipeline) Allmän konversationsdata	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Tamil_MA	tamil	Tamil (I Pipeline)	ta_IN		Media Audio	40	Tamil (In Pipeline) Medialjuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter		Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Telugu_GC_8	telugu	telugu	te_IN	8 kHz	Allmänt samtal	553	Telugu Allmän konversationsdata	Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 574 , Man 564, Okänd 0	Kontakta oss
Telugu_MA_16	telugu	telugu	te_IN	16 kHz	Media Audio	648	Telugu Media ljuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 207, Man 963, Okänd 2	Kontakta oss
Telugu_CC_8	telugu	Telugu (I pipeline)	te_IN		Call-center	30	Telugu (In Pipeline) Call-Center-data	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Telugu_GC	telugu	Telugu (I pipeline)	te_IN		Allmänt samtal	50	Telugu (In Pipeline) Allmän konversationsdata	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,		Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Telugu_MA	telugu	Telugu (I pipeline)	te_IN		Media Audio	20	Telugu (In Pipeline) Medialjuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter		Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakta oss
Thai_GC_8	thailändska	thailändska	th_TH	8 kHz	Allmänt samtal	183	Thailändskt allmänt samtal	Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, ett informellt register som används mellan vänner	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 338, Man 96, Okänd 8	Kontakta oss
Thai_MA_8	thailändska	thailändska	th_TH	16 kHz	Media Audio	173	Thai media ljud	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 143, Man 502, Okänd 26	Kontakta oss
Turkiska Turkiet_SM_48	turkiska Turkiet	turkiska Turkiet	tr-TR	48 kHz	Manusmonolog	2,027	turkiska Turkiet	Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder	Mono	Mobile App	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 1561 Man 1241 Okänd 31	Kontakta oss
Vietnamese_GC_8	vietnamesiska	vietnamesiska	vi_VN	8 kHz	Allmänt samtal	295	Vietnamesiska allmänna konversationsdata	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, norra (t.ex. Hanoi), centrala och södra (t.ex. Ho Chi Minh City).	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 400, man 380, okända 2	Kontakta oss
Vietnamesiska_MA_16	vietnamesiska	vietnamesiska	vi_VN	16 kHz	Media Audio	257	Vietnamesiska media ljuddata	Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuter	Mono	Webbkälla	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 249, man 200, okända 45	Kontakta oss
Welsh_GC_8	walesiska (engelsk accent)	walesiska (engelsk accent)	sv_WL	8 kHz	Allmänt samtal	278	walesiska allmänna konversationsdata	Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,	Dubbel	Desktop	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinna 270, Man 324, Okänd 0	Kontakta oss
Storbritannien engelska_WW_16	UK engelska	UK engelska	sv_uk	16 kHz	Wake Word	200 högtalare	Wake Word brittisk engelska	nyckelfraser insamling av data 200 högtalare 4 unika nyckelfraser per högtalare 25-30 upprepade nyckelfrasinspelningar per unik nyckelfras 25-30 ljudfiler per unik nyckelfras Totalt 120 inspelade yttranden per talare	1 kanal	Mobile App	5.0	. WAV	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kön: 50 % män, 50 % kvinnor, +/- 10 %.	Kontakta oss

Erbjudna tjänster

Expertinsamling av ljuddata är inte all-hands-on-deck för omfattande AI-inställningar. På Shaip kan du till och med överväga följande tjänster för att göra modeller betydligt mer utbredda än vanligt:

Rekommenderade resurser

Erbjuder

Ljudkommentar för intelligenta AI: er

Ljudkommentartjänster har varit Shaips starka sida sedan starten. Utveckla, träna och förbättra konversations-AI, chatbots och taligenkänningsmotorer med våra toppmoderna ljudkommentarstjänster.

Köparhandboken

Köparguide: Komplett guide till konversations-AI

Chatboten du pratade med körs på ett avancerat konversations-AI-system som är tränat, testat och byggt med hjälp av massor av taligenkänningsdatauppsättningar.

Datakatalog

Off-the-shelf Speech Data Catalog & Licensing

Det finns ett stort antal vanliga applikationer för taldata i AI-projekt. Vi erbjuder dig enorma mängder högkvalitativ data redo för din röstigenkänning.

Vill du bygga din egen ljuddataset?

Ta kontakt med vår interna expert för taldatainsamling för att skapa ett ljudlager som bäst passar dina krav

Förnamn*
Efternamn*
E-postadress *
Telefon*
Företag*
Land*
Land
Kommentarer*
Genom att registrera mig godkänner jag Shaip Sekretesspolicy och Användarvillkor och ge mitt samtycke till att ta emot B2B marknadsföringskommunikation från Shaip.
CAPTCHA

Vanliga frågor (FAQ)

1. Vad är insamling av taldata?

Taldatainsamling för en ML-modell avser processen att samla in ljudinspelningar av talat språk. Denna samling hjälper till att träna och förfina algoritmer för maskininlärning, särskilt de som fokuserar på att förstå och bearbeta mänskliga röster.

2. Hur samlar man in ljuddata för ASR (Automatic Speech Recognition)?

När du strävar efter att samla in ljuddata för Automatic Speech Recognition (ASR), bör du börja med att definiera ditt projekts specifika behov, inklusive önskat språk, accent och typ av tal. Efter att ha ställt in dessa parametrar, se till att du får alla nödvändiga behörigheter för att respektera användarnas integritet. Använd sedan lämpliga inspelningsenheter eller programvara för att fånga tydliga ljudprover. Varje inspelning bör noggrant annoteras med dess transkription eller andra relevanta metadata och lagras systematiskt för enkel åtkomst.

3. Användning av taldataset för maskininlärning

En taldatauppsättning inom maskininlärning är avgörande för utbildning, testning och validering av modeller som är skräddarsydda för att känna igen, transkribera eller tolka talat språk. Sådana datamängder banar väg för en myriad av applikationer, från röstassistenter och transkriptionstjänster till röstbiometri.

4. Hur man samlar in korrekt data från flera språk och accenter

För att samla in exakta data från olika språk och accenter är samarbete med modersmålstalare av önskad språklig bakgrund avgörande. Sträva efter ett varierat och representativt urval för att täcka ett brett spektrum av demografiska nyanser. Använd standardiserad inspelningsutrustning i enhetliga miljöer för att säkerställa ljudkonsistens. Och viktigare, annotera varje databit med detaljerade transkriptioner och metadata, som anger det specifika språket och accenten.

Mest pålitliga tjänster för insamling av taldata för din AI

Upptäck ljuddatapipelines utan flaskhalsar

Utvalda klienter

Professionella tjänster för insamling av ljud/röstdata

Alla ämnen. Alla scenarier.

100+

55K +

250+

60+

8 / 16 / 44 / 48 kHz

Vår expertis

Justera ljuddata för smartare NLP-modeller

Monolog Tal Collection

Dialogtal Samling

Grupp / Muti-party samtal

Samling för naturligt språkuttryck

Akustiska data Samling

Automatisk taligenkänning (ASR)

Flerspråkig tal/ljudträningsdata

Text-to-Speech (TTS)

Call Center Inspelningar

Framgångsberättelser

Anledningar att välja Shaip som din pålitliga samlingspartner för taldata

Personer

Behandla

plattform

Personer

Behandla

plattform

Off-the-shelf tal/ljuddataset

Erbjudna tjänster

Insamling av textdata Tjänster

Tjänster för insamling av bilddata

Tjänster för insamling av videodata

Rekommenderade resurser

Erbjuder

Ljudkommentar för intelligenta AI: er

Köparhandboken

Köparguide: Komplett guide till konversations-AI

Datakatalog

Off-the-shelf Speech Data Catalog & Licensing

Vill du bygga din egen ljuddataset?

Vanliga frågor (FAQ)

AI-datatjänster

Specialitet

Industri

Produkter

Företag

Resurser

Kontakta oss

Dialogtal
Samling

Grupp / Muti-party
samtal

Akustiska data
Samling

Text-to-Speech
(TTS)

Call Center
Inspelningar

Insamling av textdata
Tjänster