Fallstudie: Moderering av innehåll

När användningen av sociala medier fortsätter att växa har problemet med nätmobbning dykt upp som ett betydande hinder för plattformar som strävar efter att säkerställa ett säkert onlineutrymme. Häpnadsväckande 38 % av individerna möter detta skadliga beteende dagligen, vilket understryker den akuta efterfrågan på innovativa metoder för moderering av innehåll. Organisationer idag förlitar sig på användningen av artificiell intelligens för att proaktivt ta itu med det bestående problemet med nätmobbning.
Cybersäkerhet:
Facebooks Q4 Community Standards Enforcement Report avslöjade – åtgärder mot 6.3 miljoner stycken av mobbning och trakasserier, med en proaktiv upptäcktsgrad på 49.9 %
Utbildning:
A 2021 studie fann det 36.5%% av eleverna i USA mellan åldrarna 12 & 17 år upplevt nätmobbning vid ett eller annat tillfälle under sin skolgång.
Enligt en rapport från 2020 värderades den globala marknaden för lösningar för innehållsmoderering till 4.07 miljarder USD 2019 och förväntades nå 11.94 miljarder USD 2027, med en CAGR på 14.7 %.
Verklig världslösning
Data som modererar globala konversationer
Klienten utvecklade en robust maskininlärningsmodell för automatiserad innehållsmoderering för sitt molnerbjudande, för vilket de letade efter en domänspecifik leverantör som kunde hjälpa dem med korrekt träningsdata.
Med hjälp av vår omfattande kunskap inom naturlig språkbehandling (NLP) hjälpte vi klienten att samla in, kategorisera och kommentera mer än 30,000 XNUMX dokument på både engelska och spanska för att bygga en automatiserad innehållsmoderering Machine Learning-modell uppdelad i giftigt, moget eller sexuellt explicit innehåll kategorier.
Problem
- Webbskrapar 30,000 XNUMX dokument på både spanska och engelska från prioriterade domäner
- Kategorisering av det insamlade innehållet i korta, medelstora och långa segment
- Märkning av den sammanställda informationen som giftigt, moget eller sexuellt explicit innehåll
- Säkerställer högkvalitativa annoteringar med minst 90 % noggrannhet.
Lösning
- Webben skrotade 30,000 XNUMX dokument vardera för spanska och engelska från BFSI, Healthcare, Manufacturing, Retail. Innehållet delades ytterligare upp i korta, medelstora och långa dokument
- Framgångsrik märkning av det klassificerade innehållet som giftigt, vuxet eller sexuellt explicit innehåll
- För att uppnå 90 % kvalitet implementerade Shaip en kvalitetskontrollprocess i två nivåer:
» Nivå 1: Kvalitetssäkringskontroll: 100 % av filerna ska valideras.
» Nivå 2: Kontroll av kritisk kvalitetsanalys: Shaips CQA-team för att bedöma 15–20 % av de retrospektiva proverna.
Resultat
Utbildningsdata hjälpte till att bygga en ML-modell för automatiserad innehållsmoderering som kan ge flera resultat som är fördelaktiga för att upprätthålla en säkrare onlinemiljö. Några av de viktigaste resultaten inkluderar:
- Effektivitet att bearbeta stora mängder data
- Konsekvens när det gäller att säkerställa enhetlig tillämpning av måttfullhetspolicyer
- Skalbarhet för att anpassa sig till växande användarbas och innehållsvolymer
- Realtidsmoderering kan identifiera och
ta bort potentiellt skadligt innehåll när det genereras - Kostnadseffektivitet genom att minska beroendet av mänskliga moderatorer
Accelerera din Conversational AI-applikationsutveckling med 100 %
Berätta hur vi kan hjälpa till med ditt nästa AI-initiativ.