Prompt Collision Analysis

rajaseo.web.id Prompt Collision Analysis

Prompt collision terjadi ketika dua instruksi sah menghasilkan respons yang saling bertentangan.

Menguji Cara AI Menyelesaikan Konflik Instruksi

Prompt Collision Analysis adalah metode pengujian untuk memahami bagaimana sistem AI merespons ketika menerima instruksi yang saling bertentangan, ambigu, atau berlapis konteks.

Metode ini tidak bertujuan “menjebak” AI, melainkan mengamati mekanisme prioritas, resolusi konflik, dan degradasi reasoning dalam kondisi tidak ideal.

Kenapa Prompt Collision Perlu Diuji?

Dalam penggunaan nyata, AI jarang menerima prompt yang bersih dan tunggal.
Sebaliknya, AI sering menghadapi:

Instruksi ganda dari satu pengguna
Konteks panjang dengan tujuan berbeda
Pertanyaan lanjutan yang bertentangan dengan perintah awal
Framing emosional yang mengganggu logika instruksi

Prompt Collision Analysis membantu mengidentifikasi di mana dan bagaimana AI mulai kehilangan konsistensi.

Apa yang Dimaksud dengan Prompt Collision?

Prompt collision terjadi ketika AI harus memproses:

Dua atau lebih instruksi dengan tujuan berbeda
Instruksi eksplisit vs implisit yang tidak selaras
Tujuan akhir yang berubah di tengah konteks
Konflik antara batasan etika, logika, dan permintaan pengguna

AI tidak “bingung” seperti manusia, tetapi memilih prioritas berdasarkan pola probabilistik, dan di situlah risiko muncul.

Fokus Pengujian Prompt Collision Analysis

1. Instruction Priority Resolution

Mengamati:

Instruksi mana yang diprioritaskan
Apakah AI konsisten memilih prioritas yang sama
Bagaimana AI menjelaskan keputusannya (jika ada)

2. Context Dominance Shift

Mengamati:

Apakah konteks awal masih memengaruhi jawaban akhir
Kapan konteks lama diabaikan
Apakah AI menyadari perubahan tujuan

3. Narrative Override

Mengamati kondisi ketika:

Narasi emosional mengalahkan logika instruksi
Framing tertentu menggeser objektivitas jawaban
AI mempertahankan cerita meski instruksi berubah

4. Safety vs Instruction Conflict

Mengamati bagaimana AI:

Menyeimbangkan batasan keamanan
Menghadapi instruksi yang “abu-abu”
Mengubah jawaban tanpa menjelaskan alasannya

Indikator Kegagalan yang Diamati

Dalam Prompt Collision Analysis, kegagalan bukan hanya jawaban salah.
Indikator yang diperhatikan meliputi:

Jawaban inkonsisten untuk prompt serupa
Perubahan posisi tanpa penjelasan
Pengabaian sebagian instruksi tanpa sinyal eksplisit
Jawaban kompromi yang tidak menyelesaikan konflik
Over-justification untuk menutupi ketidakpastian

Apa yang Tidak Dilakukan Metode Ini

Prompt Collision Analysis tidak digunakan untuk:

Menilai kecerdasan absolut AI
Membuktikan niat buruk sistem
Mencari celah eksploitasi
Membandingkan model secara kompetitif

Metode ini fokus pada pola perilaku, bukan skor.

Output yang Dihasilkan (Konseptual)

Hasil dari Prompt Collision Analysis berupa:

Pemetaan pola prioritas instruksi
Identifikasi titik rawan konflik konteks
Indikasi risiko interpretasi berlapis
Dasar untuk evaluasi integritas reasoning AI

Output ini bersifat interpretatif, bukan deterministik.

Posisi dalam Metodologi AI Integrity Testing

Prompt Collision Analysis adalah lapisan awal dalam pengujian integritas AI, karena:

Konflik instruksi sering menjadi sumber error lanjutan
Kesalahan awal memperbesar distorsi berikutnya
Banyak kegagalan AI berakar dari konteks yang tidak diselesaikan dengan jelas

Metode ini biasanya dikombinasikan dengan:

Context Window Exhaustion
Repetition Loop Breakdown
Multi-Step Reasoning Pressure Test

Penutup

AI tidak selalu gagal karena kurang data.
Sering kali AI gagal karena tidak tahu instruksi mana yang harus dipercaya.

Prompt Collision Analysis membantu kita memahami:

bukan apa jawaban AI,
tapi kenapa AI memilih jawaban itu saat diperintah hal yang saling bertabrakan.