Röstbaserade UPI-betalningsuppmaningar: fånga mångfald för förbättrade AI-modeller

Utnyttja Shaips expertis inom snabbt skapande och olika ljudinspelningar för att stödja röstbaserade UPI-betalningssystem med högkvalitativ, kulturellt mångsidig data.

Röstbaserade upi-betalningsuppmaningar

Projektöversikt

Shaip samarbetade med ett ledande fintech-företag för att utveckla en röstbaserad betalningsapplikation genom att skapa och spela in olika UPI-betalningsuppmaningar. Projektet involverade skapandet av 2,500 87,000 unika uppmaningar och 13 200 diversifierade uppmaningar över 45 betalningsrelaterade avsikter, som att skicka pengar, begära pengar, saldoförfrågan och betalningar av räkningar. Dessa uppmaningar spelades in under XNUMX timmar av XNUMX talare från olika regioner, bakgrunder och åldersgrupper, vilket säkerställer ett brett utbud av språklig och miljömässig mångfald.

Projektets mål var att utveckla träningsdata av hög kvalitet för en AI-modell som kan känna igen och svara på röstkommandon relaterade till UPI-betalningar i verkliga miljöer.

Röstbaserad upi-betalning

Nyckelstatistik

Ljudtimmar med UPI-betalningsuppmaningar inspelade

200

Talare från olika bakgrunder (ålder, utbildning, region)

45

Avsikter täckta, med 87,000 XNUMX+ diversifierade uppmaningar

13

språk: Engelska, med talare från olika modersmålsbakgrunder (Kumaoni, Bengali, Malayalam, Gujarati, Hindi, Marathi etc.)

Projektets omfattning

Snabb skapelse

Omfattningen inkluderade att skapa unika uppmaningar för ett röstbaserat UPI-betalningssystem. Uppmaningar utformades för att täcka flera syften, vilket säkerställer att de var olika i struktur, ordförråd och namngivna enheter. Några nyckelaspekter inkluderade:

13 viktiga syften, inklusive:

  • Skicka pengar: 65,653 XNUMX unika och diversifierade meddelanden
  • Balansförfrågan: 3,052 uppmaningar
  • Fråga efter pengar: 26,972 uppmaningar
  • Transaktionshistorik, omladdning, fakturabetalning, etc.

Ljudinspelning

För att säkerställa äkthet och tillämplighet i verkligheten spelades uppmaningar in av 45 talare från olika språkliga bakgrunder. Mångfalden som fångats genom olika inhemska språk, regionala dialekter och miljöer (inomhus och utomhus) bidrog till att förbättra träningsdata.

  • Språk mångfald: Användare som talar engelska flytande men med olika modersmål, såsom Kumaoni, Gujarati, Hindi, Bangla, Marathi och Malayalam.
  • Ålder, kön och utbildningsbakgrund: Data fångade ett brett spektrum av demografi.
  • Stads- och landsbygdshögtalare: För att spegla den verkliga användningen inkluderades både stads- och landsbygdstalare.
  • Inspelningsmiljö: Ljudinspelningar gjordes både inomhus och utomhus, med en mängd olika bakgrundsljud inkluderade.

Utmaningar

Språklig och regional mångfald

Att säkerställa att uppmaningarna återspeglar olika regionala dialekter och talaregenskaper krävde noggrann planering och utförande.

Naturliga ljudvariationer

Hantering av bakgrundsljud och miljöförhållanden (inomhus vs. utomhus) var avgörande för tillämpningar i verkligheten.

Olika högtalarprofiler

Inkluderingen av talare från olika åldersgrupper, utbildningsbakgrund och landsbygds-/stadsregioner introducerade komplexiteten i att fånga autentiska data.

Lösning

Shaip levererade en lösning som tog itu med projektets utmaningar genom att implementera avancerade NLP-tekniker och noggrann planering i både snabbt skapande och inspelning. Nyckelaspekter av
lösning ingår:

Snabb skapelse

  • 2,500 unika uppmaningar skapades, var och en diversifierad efter struktur och vokabulär.
  • 13 avsikter täcktes, allt från grundläggande betalningsförfrågningar till mer komplexa förfrågningar som transaktionshistorik och fakturabetalningar.

Ljudinspelning

  • 200 timmar av ljudinspelningar genomfördes av 45 användare, vilket säkerställer mångfald mellan modersmål, miljöer och talardemografi.
  • Både inomhus- och utomhusmiljöer användes för inspelning för att säkerställa naturlig ljudvariation.
  • Talare representerade en rad regionala dialekter, vilket säkerställde korrekt språklig representation.
IntentSkickaBalansförfråganFråga efter pengarTransaktionshistorik
PromptGör en betalning på tjugohundra till Sumatri för hushyraJag vill veta mitt nuvarande saldo på mitt sparkonto.Kan du begära Raji, trehundra och arton rupier för en nödsituation?
Visa mig min transaktionshistorik för betalkort.
gujaratiસુમાત્રીને ઘરના ભાડા પેટે એકવીસસફ ચસફહું મારા બચત ખાતામાં મારી વર્તમાન બઇ વા માંગુ છું.શું તમે રાજી પાસેથી ઇમર્જન્સી માટઍ ત ર રૂપિયા માંગી શકો છો?મને મારા ડેબિટ કાર્ડના વ્યવહાર દેફા.
hindiसुमात्री को मकान किराए के लिए इक्ॕरऌ ा भुगतान करें |मैं अपने बचत खाते में वर्तमान शेष शान शान ाहता हूँ।क्या आप राजी से किसी इमरजेंसी के लनऌ ल।त रह रुपये मांग सकते हैं?मुझे मेरा डेबिट कार्ड का लेनदेन ब्रौ
malayalamവീട്ടുവാടകയായി സുമത്രിക്ക് രണ്ടിര്ടിരവ ന്നൂറ് നൽകൂ.എൻ്റെ സേവിംഗ്സ് അക്കൗണ്ടിലെ നിലവിലയവില ാൻ ഞാൻ ആഗ്രഹിക്കുന്നു.രാജിയോട് മുന്നൂറ്റി പതിനെട്ട഍ ര്നടാൿയാ വശ്യത്തിന് ആവശ്യപ്പെടാമോ?എൻ്റെ ഡെബിറ്റ് കാർഡ് ഇടപാട് വിവകക഍഍വകണി .
teluguఇంటి అద్దె కోసం సుమత్రికి ఇరవై ఒక్క ఒక఍క ించండినేను నా సేవింగ్స్ అకౌంట్ లో నా ప్రత౰్రస౰్రస౰ ెన్స్ ను తెలుసుకోవాలనుకుంటున్నాను.ఎమర్జెన్సీ కోసం రాజిని మూడు వందల్রররর রর రూపాయలు అడగగలరా?నా డెబిట్ కార్డ్ లావాదేవీ చరిత్రన౰౰న౰ ంచండి.
Bangla বাংলাবাড়ি ভাড়ার জন্য সুমাত্রিকে ২১,০০র পির োধ করুনআমি আমার সঞ্চয় অ্যাকাউন্টে বর্লমনন স জানতে চাই।আপনি রাজির কাছে তাৎক্ষণিক অবস্থাননজননজষণিক আঠারো টাকাচেয়ে নিতে পারেন?আমার ডেবিট কার্ডের লেনদেনের ইতিহনাই আমার ডেবিট
marathiसुमात्री ला घरा चे रेंट साठी दोन हकतरसरार ुपये चुकवामला माये बचत खाते मधी चालू बॅलन्स णाआ णाआकाय तुम्ही राजी पासून तीन सो अठराँहर। शकते इमरजेंसी साठी ?मला माझे डेबिट कार्ड चे लेन देन दाखव.

Den Utfall

Den högkvalitativa, mångsidiga ljuddata som levererades av Shaip gjorde det möjligt för kunden att utveckla ett AI-drivet röstbaserat UPI-betalningssystem som kan känna igen kommandon i olika dialekter, miljöer och sammanhang. Uppgifterna hjälpte till att förbättra:

  • Röstigenkänning i realtid i komplexa miljöer.
  • Mer exakt UPI-transaktion hantering för ett bredare spektrum av användare.
  • skalbarhet: Projektet lägger en stark grund för att expandera till andra indiska språk.

Deliverables

  • 200 timmar av ljudfiler (8 kHz PCM WAV-format, mono)
  • 87,000+ diversifierade uppmaningar kommenterade med unika avsikter
  • metadata: Högtalarprofiler, miljödetaljer och transkriptionsnoggrannhet

Shaips förmåga att fånga Indiens mångfald genom unika uppmaningar och autentiska ljudinspelningar har förändrat vårt röstbaserade UPI-betalningssystem. Deras team såg till att varje aspekt av projektet – från snabbt skapande till inspelningskvalitet – hanterades med precision, vilket hjälpte oss att bygga en mer inkluderande, robust röstigenkänningsmodell.

Gyllene-5-stjärniga