Högkvalitativa datauppsättningar för ljud/tal/röst för att träna din konversations-AI-modell 

Off-the-hylla röst-/tal-/ljuddataset på flera språk för att snabbt komma igång med dina automatiska taligenkänningsmodeller (ASR)

Taldatauppsättningar

Plugga in ljuddatakatalogen du har saknat idag

detaljerSpråkdatauppsättningSamplingshastighetDataset typTotala ljudtimmarTotala taltimmarDatauppsättningsbeskrivningljudkanalInspelningsplattformVI ÄR (%)LjudformatTranskriptionsformatAnvändningsfallCTA
TalAfrican AmericanAfroamerikansk folkspråk8 kHzCall-center214211Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalAfrican AmericanAfroamerikansk folkspråk16 kHzMedia Audio159149Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talafrikaansafrikaans8 kHzAllmänt samtal368404Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (omfång) - 15-60 minuter, afrikaans talas i AfrikaDubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talafrikaansafrikaans16 kHzMedia Audio658615Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalArabicArabic8 kHzAllmänt samtal293297Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, arabiska från GulfländernaDubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talbostonboston8 kHzCall-center177175Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talbostonboston8 kHzAllmänt samtal3232Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talbostonboston16 kHzMedia Audio9393Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalKinesiska engelskaKinesiska engelska8 kHzCall-center169130Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalKinesiska engelskaKinesiska engelska16 kHzMedia Audio249236Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Taldanskadanska8 kHzAllmänt samtal372395Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Taldanskadanska16 kHzMedia Audio664603Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalEnglishEnglish16 kHzMedia Audio109Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalEngelska Deep SouthEngelska Deep South8 kHzCall-center151149Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalEngelska Deep SouthEngelska Deep South8 kHzAllmänt samtal5656Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalEngelska Deep SouthEngelska Deep South16 kHzMedia Audio266248Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalHebreiskaHebreiska8 kHzAllmänt samtal399397Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (omfång) - 15-60 minuter, hebreiska i IsraelDubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalHebreiskaHebreiska16 kHzMedia Audio427400Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalHinglishHinglish8 kHzCall-center208185Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalHinglishHinglish16 kHzMedia Audio216219Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talspansktalande engelskaspansktalande engelska8 kHzCall-center212209Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talspansktalande engelskaspansktalande engelska16 kHzMedia Audio155150Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalIndisk engelskaIndisk engelska16 kHzMedia Audio13787Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalIndonesianIndonesian8 kHzAllmänt samtal496598Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, indonesiskaDubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalIndonesianIndonesian16 kHzMedia Audio643610Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talirländskirländsk8 kHzAllmänt samtal192180Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalKoreanKorean8 kHzCall-center107103Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalKoreanKorean16 kHzMedia Audio204197Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalMalayMalay8 kHzAllmänt samtal266302Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (omfång) - 15-60 minuter, Malay i MalaysiaDubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalMalayMalay16 kHzMedia Audio344305Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalNya Zeeland engelska Nya Zeeland engelska 8 kHzAllmänt samtal148142Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalNya Zeeland engelska Nya Zeeland engelska 16 kHzMedia Audio400400Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalNew York engelskaNew York engelska8 kHzCall-center103103Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalNew York engelskaNew York engelska8 kHzAllmänt samtal107106Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalNew York engelskaNew York engelska16 kHzMedia Audio140140Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talpolskapolska16 kHzMedia Audio269255Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalScottishScottish8 kHzAllmänt samtal292267Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalSingapore engelskaSingapore engelska8 kHzCall-center218194Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalSingapore engelskaSingapore engelska16 kHzMedia Audio247240Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalSydafrikanska engelskaSydafrikanska engelska8 kHzCall-center261204Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalSydafrikanska engelskaSydafrikanska engelska16 kHzMedia Audio251245Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalSpanishSpanish16 kHzMedia Audio32Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talswahiliswahili8 kHzCall-center184165Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talswahiliswahili8 kHzCall-center4644Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talswahiliswahili16 kHzMedia Audio203191Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talswahiliswahili16 kHzMedia Audio6258Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalSwedishSwedish8 kHzCall-center250224Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalSwedishSwedish16 kHzMedia Audio278255Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Taltelugutelugu8 kHzAllmänt samtal553582Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Taltelugutelugu16 kHzMedia Audio648599Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalThaiThai8 kHzAllmänt samtal183201Oskrivet telefonsamtal mellan två personer. Ungefär. Ljudlängd (intervall) - 15-60 minuter, ett informellt register som används mellan vännerDubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalThaiThai16 kHzMedia Audio173167Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talvietnamesevietnamese8 kHzAllmänt samtal295293Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter, norra (t.ex. Hanoi), centrala och södra (t.ex. Ho Chi Minh City).Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talvietnamesevietnamese16 kHzMedia Audio257248Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talwalesiskwalesisk8 kHzAllmänt samtal278299Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalIndisk engelskaIndisk engelska8 kHzCall-center200200Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Monostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Taltelugu telugu NACall-center3030Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Taltamil tamil NACall-center6060Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talkannada kannada NACall-center6060Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talmalayalam malayalam NACall-center6060Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talbengali bengali NACall-center6060Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talgujarati gujarati NACall-center6060Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talmarathi marathi NACall-center6060Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalAssamesiska Assamesiska NACall-center6060Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Taloriya oriya NACall-center6060Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talpunjabi punjabi NACall-center6060Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Taltelugu telugu NAAllmänt samtal5050Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Taltamil tamil NAAllmänt samtal100100Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talkannada kannada NAAllmänt samtal100100Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talmalayalam malayalam NAAllmänt samtal100100Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talbengali bengali NAAllmänt samtal100100Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talgujarati gujarati NAAllmänt samtal100100Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talmarathi marathi NAAllmänt samtal100100Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalAssamesiska Assamesiska NAAllmänt samtal100100Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Taloriya oriya NAAllmänt samtal100100Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talpunjabi punjabi NAAllmänt samtal100100Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,NAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Taltelugu telugu NAMedia Audio2020Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterNAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Taltamil tamil NAMedia Audio4040Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterNAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talkannada kannada NAMedia Audio4040Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterNAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talmalayalam malayalam NAMedia Audio4040Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterNAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talbengali bengali NAMedia Audio4040Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterNAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talgujarati gujarati NAMedia Audio4040Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterNAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talmarathi marathi NAMedia Audio4040Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterNAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalAssamesiska Assamesiska NAMedia Audio4040Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterNAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Taloriya oriya NAMedia Audio4040Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterNAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalpunjabipunjabiNAMedia Audio4040Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterNAstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalEngelska ossEngelska oss48 kHzManusmonolog54Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalSpanska SpanienSpanska Spanien48 kHzManusmonolog108Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalMexicanMexican48 kHzManusmonolog1,4921,228Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalCanadianCanadian48 kHzManusmonolog1,2221,049Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalNederländernaNederländerna48 kHzManusmonolog1,2051,021Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talpolska Polenpolska Polen48 kHzManusmonolog1,4821,266Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talturkiska Turkietturkiska Turkiet48 kHzManusmonolog2,0271,735Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalTraditionell kinesiskaTraditionell kinesiska48 kHzManusmonolog1,028891Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalArabicArabic48 kHzManusmonolog1,9471,594Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Taldanskadanska48 kHzManusmonolog2,5792,041Enstaka inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder, danska från DanmarkMonoMobile App5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talhindihindi8 kHzCall-center122131Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talhindihindi16 kHzMedialjud219202Licenserbara ljud-/videofiler i allmän egendom såsom intervjuer, poddsändningar etc - 1 till 5 personer. Ungefär. Ljudlängd (intervall) 15-60 minuterMonostationär dator5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Talhindihindi48 kHzManusmonolog2,8672,105Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalJapaneseJapanese48 kHzManusmonolog2,3352,029Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalKoreanKorean48 kHzManusmonolog1,9551,548Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalRussianRussian48 kHzManusmonolog2,3982,046Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalFörenklad kinesiskaFörenklad kinesiska48 kHzManusmonolog2,7622,181Enspråkiga inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunderMonoMobile App5. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalGermanGerman8 kHzCall-center640Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter,Dubbelstationär dator. WAV.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Ground Truth Audio & Speech Data för att påskynda din konversations-AI-utveckling

Med över 40 XNUMX timmars ljuddataset/röstdataset kan Shaip hjälpa dig att skala dina konversations-AI-modeller med högkvalitativa taldataset. De guldstandardiserade röstuppsättningarna samlas in på flera språk och dialekter, demografi, talaregenskaper, dialogtyper, miljöer och scenarier. Om du inte hittar det du letar efter? – Shaip kan hjälpa dig med valfri röstdatauppsättning oavsett kön, ålder, språk eller inställningar.

Några av språkdataseten vi stöder: Vi har dataset på alla större språk och dialekter. Några av våra mest populära språk inkluderar:

Afrikanska röstdataset

Arabiska röstdataset

Kanadensiska röstdataset

Kinesiska röstdataset

Danska röstdataset

Engelska röstdataset

Tyska röstdataset

Hebreiska röstdataset

Indonesiska röstdataset

Irländska röstdataset

Japanska röstdataset

Koreanska röstdataset

Mexikanska röstdataset

Polska röstdataset

Ryska röstdataset

Skotska röstdataset

Spanska röstdataset

Svenska röstdataset

Thai röstdataset

Turkiska röstdataset

Vietnamesiska röstdataset

Dataset Beskrivning

Call Center-samtal 8khz: Omanuslöst, syntetiskt telefonsamtal: "agent" och "kund"

Generiska samtal 8khz: Oskrivet telefonsamtal mellan 2 personer

Media och poddsändningar 16khz: Public domain audio/video intervjuer, poddar etc. 1-5 personer

Yttrande/manusmonolog 16khz: Inspelning baserad på prompt 

Shaip Kontakta oss

Hittar du inte det du letar efter?

Nya standarduppsättningar för ljud och tal samlas in för alla datatyper 

Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata

  • Genom att registrera mig godkänner jag Shaip Integritetspolicy och Användarvillkor och ge mitt samtycke till att ta emot B2B marknadsföringskommunikation från Shaip.