Fallstudie: Moderering av innehåll

Mer än 30 XNUMX dokument har skrotats och kommenterats för innehållsmoderering
Innehållsmoderering - banner
Det finns en ökande efterfrågan på AI-driven innehållsmoderering som strävar efter att säkra onlineutrymmet där vi ansluter och kommunicerar.

När användningen av sociala medier fortsätter att växa har problemet med nätmobbning dykt upp som ett betydande hinder för plattformar som strävar efter att säkerställa ett säkert onlineutrymme. Häpnadsväckande 38 % av individerna möter detta skadliga beteende dagligen, vilket understryker den akuta efterfrågan på innovativa metoder för moderering av innehåll. Organisationer idag förlitar sig på användningen av artificiell intelligens för att proaktivt ta itu med det bestående problemet med nätmobbning.

Cybersäkerhet:

Facebooks Q4 Community Standards Enforcement Report avslöjade – åtgärder mot 6.3 miljoner stycken av mobbning och trakasserier, med en proaktiv upptäcktsgrad på 49.9 %

Utbildning:

2021 studie fann det 36.5%% av eleverna i USA mellan åldrarna 12 & 17 år upplevt nätmobbning vid ett eller annat tillfälle under sin skolgång.

Enligt en rapport från 2020 värderades den globala marknaden för lösningar för innehållsmoderering till 4.07 miljarder USD 2019 och förväntades nå 11.94 miljarder USD 2027, med en CAGR på 14.7 %.

Verklig världslösning

Data som modererar globala konversationer

Klienten utvecklade en robust maskininlärningsmodell för automatiserad innehållsmoderering för sitt molnerbjudande, för vilket de letade efter en domänspecifik leverantör som kunde hjälpa dem med korrekt träningsdata.

Med hjälp av vår omfattande kunskap inom naturlig språkbehandling (NLP) hjälpte vi klienten att samla in, kategorisera och kommentera mer än 30,000 XNUMX dokument på både engelska och spanska för att bygga en automatiserad innehållsmoderering Machine Learning-modell uppdelad i giftigt, moget eller sexuellt explicit innehåll kategorier.

Verkliga lösningen

Problem

  • Webbskrapar 30,000 XNUMX dokument på både spanska och engelska från prioriterade domäner
  • Kategorisering av det insamlade innehållet i korta, medelstora och långa segment
  • Märkning av den sammanställda informationen som giftigt, moget eller sexuellt explicit innehåll
  • Säkerställer högkvalitativa annoteringar med minst 90 % noggrannhet.

Lösning

  • Webben skrotade 30,000 XNUMX dokument vardera för spanska och engelska från BFSI, Healthcare, Manufacturing, Retail. Innehållet delades ytterligare upp i korta, medelstora och långa dokument 
  • Framgångsrik märkning av det klassificerade innehållet som giftigt, vuxet eller sexuellt explicit innehåll
  • För att uppnå 90 % kvalitet implementerade Shaip en kvalitetskontrollprocess i två nivåer:
    » Nivå 1: Kvalitetssäkringskontroll: 100 % av filerna ska valideras.
    » Nivå 2: Kontroll av kritisk kvalitetsanalys: Shaips CQA-team för att bedöma 15–20 % av de retrospektiva proverna.

Resultat

Utbildningsdata hjälpte till att bygga en ML-modell för automatiserad innehållsmoderering som kan ge flera resultat som är fördelaktiga för att upprätthålla en säkrare onlinemiljö. Några av de viktigaste resultaten inkluderar:

  • Effektivitet att bearbeta stora mängder data
  • Konsekvens när det gäller att säkerställa enhetlig tillämpning av måttfullhetspolicyer
  • Skalbarhet för att anpassa sig till växande användarbas och innehållsvolymer
  • Realtidsmoderering kan identifiera och
    ta bort potentiellt skadligt innehåll när det genereras
  • Kostnadseffektivitet genom att minska beroendet av mänskliga moderatorer

Accelerera din Conversational AI-applikationsutveckling med 100 %

Berätta hur vi kan hjälpa till med ditt nästa AI-initiativ.