Prompt Collision Analysis

rajaseo.web.id Prompt Collision Analysis

Prompt collision terjadi ketika dua instruksi sah menghasilkan respons yang saling bertentangan.

Menguji Cara AI Menyelesaikan Konflik Instruksi

Prompt Collision Analysis adalah metode pengujian untuk memahami bagaimana sistem AI merespons ketika menerima instruksi yang saling bertentangan, ambigu, atau berlapis konteks.

Metode ini tidak bertujuan “menjebak” AI, melainkan mengamati mekanisme prioritas, resolusi konflik, dan degradasi reasoning dalam kondisi tidak ideal.


Kenapa Prompt Collision Perlu Diuji?

Dalam penggunaan nyata, AI jarang menerima prompt yang bersih dan tunggal.
Sebaliknya, AI sering menghadapi:

  • Instruksi ganda dari satu pengguna
  • Konteks panjang dengan tujuan berbeda
  • Pertanyaan lanjutan yang bertentangan dengan perintah awal
  • Framing emosional yang mengganggu logika instruksi

Prompt Collision Analysis membantu mengidentifikasi di mana dan bagaimana AI mulai kehilangan konsistensi.


Apa yang Dimaksud dengan Prompt Collision?

Prompt collision terjadi ketika AI harus memproses:

  • Dua atau lebih instruksi dengan tujuan berbeda
  • Instruksi eksplisit vs implisit yang tidak selaras
  • Tujuan akhir yang berubah di tengah konteks
  • Konflik antara batasan etika, logika, dan permintaan pengguna

AI tidak “bingung” seperti manusia, tetapi memilih prioritas berdasarkan pola probabilistik, dan di situlah risiko muncul.


Fokus Pengujian Prompt Collision Analysis

1. Instruction Priority Resolution

Mengamati:

  • Instruksi mana yang diprioritaskan
  • Apakah AI konsisten memilih prioritas yang sama
  • Bagaimana AI menjelaskan keputusannya (jika ada)

2. Context Dominance Shift

Mengamati:

  • Apakah konteks awal masih memengaruhi jawaban akhir
  • Kapan konteks lama diabaikan
  • Apakah AI menyadari perubahan tujuan

3. Narrative Override

Mengamati kondisi ketika:

  • Narasi emosional mengalahkan logika instruksi
  • Framing tertentu menggeser objektivitas jawaban
  • AI mempertahankan cerita meski instruksi berubah

4. Safety vs Instruction Conflict

Mengamati bagaimana AI:

  • Menyeimbangkan batasan keamanan
  • Menghadapi instruksi yang “abu-abu”
  • Mengubah jawaban tanpa menjelaskan alasannya

Indikator Kegagalan yang Diamati

Dalam Prompt Collision Analysis, kegagalan bukan hanya jawaban salah.
Indikator yang diperhatikan meliputi:

  • Jawaban inkonsisten untuk prompt serupa
  • Perubahan posisi tanpa penjelasan
  • Pengabaian sebagian instruksi tanpa sinyal eksplisit
  • Jawaban kompromi yang tidak menyelesaikan konflik
  • Over-justification untuk menutupi ketidakpastian

Apa yang Tidak Dilakukan Metode Ini

Prompt Collision Analysis tidak digunakan untuk:

  • Menilai kecerdasan absolut AI
  • Membuktikan niat buruk sistem
  • Mencari celah eksploitasi
  • Membandingkan model secara kompetitif

Metode ini fokus pada pola perilaku, bukan skor.


Output yang Dihasilkan (Konseptual)

Hasil dari Prompt Collision Analysis berupa:

  • Pemetaan pola prioritas instruksi
  • Identifikasi titik rawan konflik konteks
  • Indikasi risiko interpretasi berlapis
  • Dasar untuk evaluasi integritas reasoning AI

Output ini bersifat interpretatif, bukan deterministik.


Posisi dalam Metodologi AI Integrity Testing

Prompt Collision Analysis adalah lapisan awal dalam pengujian integritas AI, karena:

  • Konflik instruksi sering menjadi sumber error lanjutan
  • Kesalahan awal memperbesar distorsi berikutnya
  • Banyak kegagalan AI berakar dari konteks yang tidak diselesaikan dengan jelas

Metode ini biasanya dikombinasikan dengan:

  • Context Window Exhaustion
  • Repetition Loop Breakdown
  • Multi-Step Reasoning Pressure Test

Penutup

AI tidak selalu gagal karena kurang data.
Sering kali AI gagal karena tidak tahu instruksi mana yang harus dipercaya.

Prompt Collision Analysis membantu kita memahami:

bukan apa jawaban AI,
tapi kenapa AI memilih jawaban itu saat diperintah hal yang saling bertabrakan.

Scroll to Top