Syntetiska data

Syntetiska data

Definition

Syntetiska data är artificiellt genererad information som efterliknar verkliga data. Den kan skapas med hjälp av simuleringar, GAN eller andra generativa metoder.

Syfte

Syftet är att utöka eller ersätta verkliga data när de är knappa, känsliga eller dyra att samla in.

Betydelse

  • Skyddar integriteten genom att minska beroendet av personuppgifter.
  • Möjliggör träning för sällsynta eller edge-fall.
  • Kan sakna den fulla komplexiteten hos verkliga data.
  • Används alltmer inom säkerhetskritisk AI.

Så fungerar det

  1. Definiera de dataegenskaper som ska replikeras.
  2. Använd simulering eller generativa modeller för att skapa data.
  3. Validera syntetiska data mot verkliga fördelningar.
  4. Använd syntetiska data i träningspipelines.
  5. Övervaka brister i realismen.

Exempel (verkliga världen)

  • Waymo: använder syntetiska körscener för autonom träning.
  • NVIDIA Omniverse: genererar syntetisk 3D-data för robotik.
  • Hälso- och sjukvård: syntetiska patientdata för forskning.

Referenser / Vidare läsning

Berätta hur vi kan hjälpa till med ditt nästa AI-initiativ.