Keamanan AI
Proses pengujian model AI dengan mencoba mencari celah keamanan dan bias secara sengaja.
- Red Teaming: Simulasi serangan untuk menemukan kerentanan pada sistem AI.
- Jailbreaking: Teknik memanipulasi prompt agar AI melanggar aturan keamanannya.
- Adversarial Attack: Input yang dirancang untuk mengelabui model pembelajaran mesin.
- Safety Layer: Filter keamanan yang menyaring konten berbahaya sebelum sampai ke pengguna.
- Model Robustness: Ketahanan model AI terhadap data yang tidak terduga atau rusak.