Kinesisk datauppsättning

简体中文数据集

Högkvalitativ kinesisk datauppsättning för AI och talmodeller

Översikt

Titel (språk)

Kinesisk språkdatauppsättning

Datasettyper

Callcenter, musik, manusbaserad monolog, mediedata (podcastdata)

Land

Kina

BESKRIVNING

Denna datauppsättning inkluderar oskriptade syntetiska telefonsamtal mellan agenter och kunder (5–15 minuter), naturliga telefonsamtal mellan människor (15–60 minuter) och sångljud med transkriptioner, vilket tillhandahåller olika taldata för träning och utvärdering av tal- och språkteknik.

Användningsfall

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datauppsättningsdetaljer

Språk Dataset typ Samplingshastighet högtalare Kanal Totalt antal timmar Totalt antal högtalare
Kinesisk sång Musik 48 kHz Enstaka högtalare Mono 06:11:32 10
kinesiska Manusmonolog 48 kHz Enstaka högtalare Mono 1,499:00:00 1,805
Kinesisk accentuerad engelska Mediedata 16 kHz Flera högtalare Mono 306:04:58 2,130
Förenklad kinesiska Manusmonolog 48 kHz Enstaka högtalare Mono 2,761:00:00 3,725
Kinesiska med amerikansk accent och engelska Call Center 8 kHz 2 högtalare Dubbel 152:18:33 2,058
Kinesiska med amerikansk accent och engelska Mediedata 16 kHz Flera högtalare Mono 245:55:15 468

Utvalda klienter

Stärka team för att bygga världsledande AI-produkter.

Shaip kontakta oss

Hittar du inte det du letar efter?

Nya färdiga datamängder samlas in för alla datatyper

Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata

  • Detta fält är för validering och bör lämnas oförändrad.
  • Genom att registrera mig godkänner jag Shaip Integritetspolicy och Användarvillkor och ge mitt samtycke till att ta emot B2B marknadsföringskommunikation från Shaip.