Röstbaserade UPI-betalningsuppmaningar: fånga mångfald för förbättrade AI-modeller
Utnyttja Shaips expertis inom snabbt skapande och olika ljudinspelningar för att stödja röstbaserade UPI-betalningssystem med högkvalitativ, kulturellt mångsidig data.
Projektöversikt
Shaip samarbetade med ett ledande fintech-företag för att utveckla en röstbaserad betalningsapplikation genom att skapa och spela in olika UPI-betalningsuppmaningar. Projektet involverade skapandet av 2,500 87,000 unika uppmaningar och 13 200 diversifierade uppmaningar över 45 betalningsrelaterade avsikter, som att skicka pengar, begära pengar, saldoförfrågan och betalningar av räkningar. Dessa uppmaningar spelades in under XNUMX timmar av XNUMX talare från olika regioner, bakgrunder och åldersgrupper, vilket säkerställer ett brett utbud av språklig och miljömässig mångfald.
Projektets mål var att utveckla träningsdata av hög kvalitet för en AI-modell som kan känna igen och svara på röstkommandon relaterade till UPI-betalningar i verkliga miljöer.

Nyckelstatistik
Ljudtimmar med UPI-betalningsuppmaningar inspelade
200
Talare från olika bakgrunder (ålder, utbildning, region)
45
Avsikter täckta, med 87,000 XNUMX+ diversifierade uppmaningar
13
språk: Engelska, med talare från olika modersmålsbakgrunder (Kumaoni, Bengali, Malayalam, Gujarati, Hindi, Marathi etc.)
Projektets omfattning
Snabb skapelse
Omfattningen inkluderade att skapa unika uppmaningar för ett röstbaserat UPI-betalningssystem. Uppmaningar utformades för att täcka flera syften, vilket säkerställer att de var olika i struktur, ordförråd och namngivna enheter. Några nyckelaspekter inkluderade:
13 viktiga syften, inklusive:
- Skicka pengar: 65,653 XNUMX unika och diversifierade meddelanden
- Balansförfrågan: 3,052 uppmaningar
- Fråga efter pengar: 26,972 uppmaningar
- Transaktionshistorik, omladdning, fakturabetalning, etc.
Ljudinspelning
För att säkerställa äkthet och tillämplighet i verkligheten spelades uppmaningar in av 45 talare från olika språkliga bakgrunder. Mångfalden som fångats genom olika inhemska språk, regionala dialekter och miljöer (inomhus och utomhus) bidrog till att förbättra träningsdata.
- Språk mångfald: Användare som talar engelska flytande men med olika modersmål, såsom Kumaoni, Gujarati, Hindi, Bangla, Marathi och Malayalam.
- Ålder, kön och utbildningsbakgrund: Data fångade ett brett spektrum av demografi.
- Stads- och landsbygdshögtalare: För att spegla den verkliga användningen inkluderades både stads- och landsbygdstalare.
- Inspelningsmiljö: Ljudinspelningar gjordes både inomhus och utomhus, med en mängd olika bakgrundsljud inkluderade.
Utmaningar
Att säkerställa att uppmaningarna återspeglar olika regionala dialekter och talaregenskaper krävde noggrann planering och utförande.
Hantering av bakgrundsljud och miljöförhållanden (inomhus vs. utomhus) var avgörande för tillämpningar i verkligheten.
Inkluderingen av talare från olika åldersgrupper, utbildningsbakgrund och landsbygds-/stadsregioner introducerade komplexiteten i att fånga autentiska data.
Lösning
Shaip levererade en lösning som tog itu med projektets utmaningar genom att implementera avancerade NLP-tekniker och noggrann planering i både snabbt skapande och inspelning. Nyckelaspekter av
lösning ingår:
Snabb skapelse
- 2,500 unika uppmaningar skapades, var och en diversifierad efter struktur och vokabulär.
- 13 avsikter täcktes, allt från grundläggande betalningsförfrågningar till mer komplexa förfrågningar som transaktionshistorik och fakturabetalningar.
Ljudinspelning
- 200 timmar av ljudinspelningar genomfördes av 45 användare, vilket säkerställer mångfald mellan modersmål, miljöer och talardemografi.
- Både inomhus- och utomhusmiljöer användes för inspelning för att säkerställa naturlig ljudvariation.
- Talare representerade en rad regionala dialekter, vilket säkerställde korrekt språklig representation.
Intent | Skicka | Balansförfrågan | Fråga efter pengar | Transaktionshistorik |
---|---|---|---|---|
Prompt | Gör en betalning på tjugohundra till Sumatri för hushyra | Jag vill veta mitt nuvarande saldo på mitt sparkonto. | Kan du begära Raji, trehundra och arton rupier för en nödsituation? | Visa mig min transaktionshistorik för betalkort. |
gujarati | સુમાત્રીને ઘરના ભાડા પેટે એકવીસસફ ચસફ | હું મારા બચત ખાતામાં મારી વર્તમાન બઇ વા માંગુ છું. | શું તમે રાજી પાસેથી ઇમર્જન્સી માટઍ ત ર રૂપિયા માંગી શકો છો? | મને મારા ડેબિટ કાર્ડના વ્યવહાર દેફા. |
hindi | सुमात्री को मकान किराए के लिए इक्ॕरऌ ा भुगतान करें | | मैं अपने बचत खाते में वर्तमान शेष शान शान ाहता हूँ। | क्या आप राजी से किसी इमरजेंसी के लनऌ ल।त रह रुपये मांग सकते हैं? | मुझे मेरा डेबिट कार्ड का लेनदेन ब्रौ |
malayalam | വീട്ടുവാടകയായി സുമത്രിക്ക് രണ്ടിര്ടിരവ ന്നൂറ് നൽകൂ. | എൻ്റെ സേവിംഗ്സ് അക്കൗണ്ടിലെ നിലവിലയവില ാൻ ഞാൻ ആഗ്രഹിക്കുന്നു. | രാജിയോട് മുന്നൂറ്റി പതിനെട്ട ര്നടാൿയാ വശ്യത്തിന് ആവശ്യപ്പെടാമോ? | എൻ്റെ ഡെബിറ്റ് കാർഡ് ഇടപാട് വിവകകവകണി . |
telugu | ఇంటి అద్దె కోసం సుమత్రికి ఇరవై ఒక్క ఒకక ించండి | నేను నా సేవింగ్స్ అకౌంట్ లో నా ప్రత్రస్రస ెన్స్ ను తెలుసుకోవాలనుకుంటున్నాను. | ఎమర్జెన్సీ కోసం రాజిని మూడు వందల్রররর রর రూపాయలు అడగగలరా? | నా డెబిట్ కార్డ్ లావాదేవీ చరిత్రనన ంచండి. |
Bangla বাংলা | বাড়ি ভাড়ার জন্য সুমাত্রিকে ২১,০০র পির োধ করুন | আমি আমার সঞ্চয় অ্যাকাউন্টে বর্লমনন স জানতে চাই। | আপনি রাজির কাছে তাৎক্ষণিক অবস্থাননজননজষণিক আঠারো টাকাচেয়ে নিতে পারেন? | আমার ডেবিট কার্ডের লেনদেনের ইতিহনাই আমার ডেবিট |
marathi | सुमात्री ला घरा चे रेंट साठी दोन हकतरसरार ुपये चुकवा | मला माये बचत खाते मधी चालू बॅलन्स णाआ णाआ | काय तुम्ही राजी पासून तीन सो अठराँहर। शकते इमरजेंसी साठी ? | मला माझे डेबिट कार्ड चे लेन देन दाखव. |
Den Utfall
Den högkvalitativa, mångsidiga ljuddata som levererades av Shaip gjorde det möjligt för kunden att utveckla ett AI-drivet röstbaserat UPI-betalningssystem som kan känna igen kommandon i olika dialekter, miljöer och sammanhang. Uppgifterna hjälpte till att förbättra:
- Röstigenkänning i realtid i komplexa miljöer.
- Mer exakt UPI-transaktion hantering för ett bredare spektrum av användare.
- skalbarhet: Projektet lägger en stark grund för att expandera till andra indiska språk.
Deliverables
- 200 timmar av ljudfiler (8 kHz PCM WAV-format, mono)
- 87,000+ diversifierade uppmaningar kommenterade med unika avsikter
- metadata: Högtalarprofiler, miljödetaljer och transkriptionsnoggrannhet
Shaips förmåga att fånga Indiens mångfald genom unika uppmaningar och autentiska ljudinspelningar har förändrat vårt röstbaserade UPI-betalningssystem. Deras team såg till att varje aspekt av projektet – från snabbt skapande till inspelningskvalitet – hanterades med precision, vilket hjälpte oss att bygga en mer inkluderande, robust röstigenkänningsmodell.