Keamanan AI

Proses pengujian model AI dengan mencoba mencari celah keamanan dan bias secara sengaja.

  • Red Teaming: Simulasi serangan untuk menemukan kerentanan pada sistem AI.
  • Jailbreaking: Teknik memanipulasi prompt agar AI melanggar aturan keamanannya.
  • Adversarial Attack: Input yang dirancang untuk mengelabui model pembelajaran mesin.
  • Safety Layer: Filter keamanan yang menyaring konten berbahaya sebelum sampai ke pengguna.
  • Model Robustness: Ketahanan model AI terhadap data yang tidak terduga atau rusak.