Tamil Dataset

தமிழ் தரவுத்தொகுப்பு

Lås upp kraften i tamilska taldatauppsättningar för ASR, TTS och konversations-AI. Shaip erbjuder premium tamilska ljuddatauppsättningar för att träna smartare språkmodeller.

Översikt

Titel (språk)

tamilska språkdatauppsättning

Datasettyper

Callcenter, Allmänna samtal, Mediedata, Manusmonolog

Land

Indien

BESKRIVNING

Denna datauppsättning inkluderar oskriptade syntetiska agent-kund-konversationer (5–15 minuter), naturliga telefonsamtal mellan människor (15–60 minuter) och mediedata med transkriptioner, vilket erbjuder olika taldata för träning och utvärdering av tal- och språkteknik.

Användningsfall

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datauppsättningsdetaljer

Dataset typ Samplingshastighet högtalare Kanal Totalt antal timmar Totalt antal högtalare
Call Center 8 kHz 2 högtalare Dubbel 124:23:52 484
Call Center 16 kHz 2 högtalare Mono 199:44:21 1,986
Allmänt samtal 8 kHz 2 högtalare Dubbel 101:42:05 440
Allmänt samtal 48 kHz 2 högtalare Mono 80:21:16 141
Mediedata 16 kHz Flera högtalare Mono 43:07:01 32
Manusmonolog 24 kHz Enstaka högtalare Mono 500:00:00 På förfrågan

Utvalda klienter

Stärka team för att bygga världsledande AI-produkter.

Amazon
Google
Microsoft
Shaip kontakta oss

Hittar du inte det du letar efter?

Nya färdiga datamängder samlas in för alla datatyper

Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata

  • Detta fält är för validering och bör lämnas oförändrad.
  • Genom att registrera mig godkänner jag Shaip Integritetspolicy och Användarvillkor och ge mitt samtycke till att ta emot B2B marknadsföringskommunikation från Shaip.