Kinesisk datauppsättning
简体中文数据集
Högkvalitativ kinesisk datauppsättning för AI och talmodeller
Översikt
Titel (språk)
Kinesisk språkdatauppsättning
Datasettyper
Callcenter, musik, manusbaserad monolog, mediedata (podcastdata)
Land
Kina
BESKRIVNING
Denna datauppsättning inkluderar oskriptade syntetiska telefonsamtal mellan agenter och kunder (5–15 minuter), naturliga telefonsamtal mellan människor (15–60 minuter) och sångljud med transkriptioner, vilket tillhandahåller olika taldata för träning och utvärdering av tal- och språkteknik.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
| Språk | Dataset typ | Samplingshastighet | högtalare | Kanal | Totalt antal timmar | Totalt antal högtalare |
|---|---|---|---|---|---|---|
| Kinesisk sång | Musik | 48 kHz | Enstaka högtalare | Mono | 06:11:32 | 10 |
| kinesiska | Manusmonolog | 48 kHz | Enstaka högtalare | Mono | 1,499:00:00 | 1,805 |
| Kinesisk accentuerad engelska | Mediedata | 16 kHz | Flera högtalare | Mono | 306:04:58 | 2,130 |
| Förenklad kinesiska | Manusmonolog | 48 kHz | Enstaka högtalare | Mono | 2,761:00:00 | 3,725 |
| Kinesiska med amerikansk accent och engelska | Call Center | 8 kHz | 2 högtalare | Dubbel | 152:18:33 | 2,058 |
| Kinesiska med amerikansk accent och engelska | Mediedata | 16 kHz | Flera högtalare | Mono | 245:55:15 | 468 |
Utvalda klienter
Stärka team för att bygga världsledande AI-produkter.
Hittar du inte det du letar efter?
Nya färdiga datamängder samlas in för alla datatyper
Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata