Fallstudie: Moderering av innehåll
Mer än 30 XNUMX dokument har skrotats och kommenterats för innehållsmoderering
som strävar efter att säkra onlineutrymmet där vi ansluter och kommunicerar.
När användningen av sociala medier fortsätter att växa,
Problemet med nätmobbning har dykt upp som ett
betydande hinder för plattformar som strävar efter
säkerställa ett säkert onlineutrymme. En svindlande
38% av individerna stöter på detta
skadligt beteende på daglig basis,
betonar den akuta efterfrågan på uppfinningsrikedom
innehållsmodereringsmetoder.
Organisationer idag förlitar sig på användningen av
artificiell intelligens för att ta itu med det bestående
problem med nätmobbning proaktivt.
Cybersäkerhet:
Facebooks Q4 Community Standards Enforcement Report avslöjade – åtgärder mot 6.3 miljoner stycken av mobbning och trakasserier, med en proaktiv upptäcktsgrad på 49.9 %
Utbildning:
A 2021 studie fann det 36.5%% av eleverna i USA mellan åldrarna 12 & 17 år upplevt nätmobbning vid ett eller annat tillfälle under sin skolgång.
Enligt en rapport från 2020 värderades den globala marknaden för lösningar för innehållsmoderering till 4.07 miljarder USD 2019 och förväntades nå 11.94 miljarder USD 2027, med en CAGR på 14.7 %.
Verklig världslösning
Data som modererar globala konversationer
Kunden utvecklade en robust automatiserad
innehållsmoderering Machine Learning
modell för sitt molnerbjudande, för vilket de
letade efter en domänspecifik leverantör som
kan hjälpa dem med korrekt träningsdata.
Med hjälp av vår omfattande kunskap inom naturlig språkbehandling (NLP) hjälpte vi klienten att samla in, kategorisera och kommentera mer än 30,000 XNUMX dokument på både engelska och spanska för att bygga en automatiserad innehållsmoderering Machine Learning-modell uppdelad i giftigt, moget eller sexuellt explicit innehåll kategorier.
Problem
- Webbskrapar 30,000 XNUMX dokument på både spanska och engelska från prioriterade domäner
- Kategorisering av det insamlade innehållet i korta, medelstora och långa segment
- Märkning av den sammanställda informationen som giftigt, moget eller sexuellt explicit innehåll
- Säkerställer högkvalitativa annoteringar med minst 90 % noggrannhet.
Lösning
- Webben skrotade 30,000 XNUMX dokument vardera för spanska och engelska från BFSI, Healthcare, Manufacturing, Retail. Innehållet delades ytterligare upp i korta, medelstora och långa dokument
- Framgångsrik märkning av det klassificerade innehållet som giftigt, vuxet eller sexuellt explicit innehåll
- För att uppnå 90 % kvalitet implementerade Shaip en kvalitetskontrollprocess i två nivåer:
» Nivå 1: Kvalitetssäkringskontroll: 100 % av filerna ska valideras.
» Nivå 2: Kontroll av kritisk kvalitetsanalys: Shaips CQA-team för att bedöma 15–20 % av de retrospektiva proverna.
Resultat
Utbildningsdata hjälpte till att bygga en ML-modell för automatiserad innehållsmoderering som kan ge flera resultat som är fördelaktiga för att upprätthålla en säkrare onlinemiljö. Några av de viktigaste resultaten inkluderar:
- Effektivitet att bearbeta stora mängder data
- Konsekvens när det gäller att säkerställa enhetlig tillämpning av måttfullhetspolicyer
- Skalbarhet för att anpassa sig till växande användarbas och innehållsvolymer
- Realtidsmoderering kan identifiera och
ta bort potentiellt skadligt innehåll när det genereras - Kostnadseffektivitet genom att minska beroendet av mänskliga moderatorer
Exempel på innehållsmoderering
Berätta hur vi kan hjälpa till med ditt nästa AI-initiativ.