Thailändsk datauppsättning
ชุดข้อมูลภาษาไทย
Högkvalitativ thailändsk allmän konversation, manusbaserad monolog och mediadata (podcast) för AI och talmodeller
Översikt
Titel (språk)
Thailändsk språkdatauppsättning
Datasettyper
Allmänna samtal, Media (Podcast), Manusförfattad monolog
Land
Thailand
BESKRIVNING
Denna datauppsättning innehåller oskriptade telefonsamtal mellan två personer på hebreiska från Israel (15–60 minuter), licensierbara ljud- eller videofiler som är allmän egendom med 1 till 5 deltagare (15–60 minuter) och skriptade monologer där en enskild talare levererar fördefinierat innehåll för träning och utvärdering av tal- och språkmodeller.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
| Dataset typ | Samplingshastighet | högtalare | Kanal | Totalt antal timmar | Totalt antal högtalare |
|---|---|---|---|---|---|
| Allmänt samtal | 8 kHz | 2 högtalare | Dubbel | 211:48:42 | 170 |
| Mediedata | 16 kHz | Enstaka högtalare | Mono | 249:14:31 | 670 |
| Manusmonolog | 24 kHz | Enstaka högtalare | Mono | 500:00:00 | På förfrågan |
Utvalda klienter
Stärka team för att bygga världsledande AI-produkter.
Hittar du inte det du letar efter?
Nya färdiga datamängder samlas in för alla datatyper
Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata