Bildklassificering

Bildklassificering

Definition

Bildklassificering är uppgiften att tilldela etiketter till en bild som helhet, till exempel "katt", "bil" eller "tumör". Det är ett av kärnproblemen inom datorseende.

Syfte

Syftet är att automatisera igenkänning av objekt eller kategorier i bilder för sökning, analys eller beslutsfattande.

Betydelse

  • Grundläggande uppgift inom datorseende.
  • Används inom hälso- och sjukvård, detaljhandel och säkerhetsövervakning.
  • Begränsad möjlighet att fånga flera objekt i en enda bild.
  • Relaterat till objektdetektering och segmentering.

Så fungerar det

  1. Samla in och märk en datauppsättning med bilder.
  2. Extrahera funktioner (traditionellt) eller använd CNN:er för representation.
  3. Träna klassificerare på märkta exempel.
  4. Utvärdera utifrån osedda testdata.
  5. Distribuera för att klassificera nya bilder i verkliga miljöer.

Exempel (verkliga världen)

  • ImageNet Challenge: riktmärke för forskning om bildklassificering.
  • Google Foto: klassificerar bilder för sökning och organisering.
  • Medicinsk AI: klassificerar röntgenstrålar i kategorier som "normal" eller "sjukdom".

Referenser / Vidare läsning

  • Krizhevsky et al. ”ImageNet-klassificering med djupa faltningsneurala nätverk.” NeurIPS 2012.
  • Stanford CS231n-kurs om CNN.
  • IEEE-transaktioner om mönsteranalys och maskinintelligens.

Berätta hur vi kan hjälpa till med ditt nästa AI-initiativ.