Implementasi Bab 12 โ Giudici, Applied Data Mining for Business and Industry (2009)
๐ Apa itu Risiko Operasional?
Definisi Basel II: "The risk of loss resulting from inadequate or failed internal processes, people and systems or from external events."
โ Giudici (2009), Bab 12.1
Risiko operasional = risiko kerugian akibat proses internal yang gagal, kesalahan manusia, kegagalan sistem, atau kejadian eksternal (termasuk penipuan/fraud).
Contoh nyata: penipuan (fraud), kesalahan input data, sistem IT down, bencana alam, pencurian, pemalsuan dokumen.
๐ก Intinya: Semakin tinggi risiko operasional suatu bank, semakin buruk sistem kontrolnya. Mengukur risiko = mengukur seberapa efektif kontrol yang ada (Giudici, 2009, hlm. 227).
๐ฏ Dua Tujuan Pengukuran (Bab 12.1)
๐๏ธ Tujuan Prudensial
Menentukan berapa cadangan modal (capital reserve) yang harus disiapkan bank untuk menutup kerugian tak terduga.
โ Model 2 & 3: VaR
๐ Tujuan Manajerial
Membuat peringkat risiko agar manajemen tahu mana yang harus ditangani lebih dulu.
โ Model 1: Scorecard
๐ฅ Tiga Sumber Data (Bab 12.2)
๐ Data Internal
(Bab 12.2, hal. 221)
Buku mensyaratkan tabel riwayat kerugian bank sendiri: jumlah kerugian (amount), tanggal, unit organisasi, lini bisnis & jenis kejadian.
Backward-looking
Di proyek ini: Dataset PaySim (Kaggle) โ data bank asli bersifat rahasia.
๐ฅ Penilaian Ahli
(Bab 12.2, hal. 222โ224)
Kepala cabang, kepala area, dan manajer menilai frekuensi, severity, dan kontrol tiap risiko dalam skala ordinal. 8 BL ร 7 ET = 56 kategori.
Forward-looking
Di proyek ini: Data sintetis mengikuti struktur buku.
๐ข Data Eksternal
(Bab 12.2, hal. 221โ222)
Data konsorsium bank (DIPO). Karena gabungan banyak bank, di-scaling agar setara ukuran bank kita.
Perspektif industri
Di proyek ini: Data sintetis dengan proses scaling sesuai buku.
๐ฏ Mengapa Dataset PaySim?
โ Kenapa cocok sebagai data internal?
Syarat Buku
PaySim
Jumlah kerugian (amount)
โ Kolom amount
Tanggal/waktu kejadian
โ Kolom step (jam โ hari)
Label kejadian (fraud/tidak)
โ Kolom isFraud
Jenis transaksi
โ Kolom type
Identitas pelaku/korban
โ nameOrig, nameDest
Jumlah data besar
โ 6,3 juta transaksi
๐ Untuk apa dataset ini dipakai?
Transaksi fraud (isFraud=1) โ data kerugian internal bank, kolom amount = besarnya kerugian
Dari data ini dihitung frekuensi (berapa kali fraud per tahun) dan severity (distribusi besarnya kerugian)
Frekuensi & severity menjadi input utama model VaR Aktuaria dan VaR Integrasi Bayesian
๐ก Mengapa bukan data bank asli? โ Data kerugian operasional bank bersifat sangat rahasia. PaySim adalah alternatif terbaik karena sintetis tetapi realistis.
๐ง Tiga Model yang Dipakai (Bab 12.3โ12.4)
๐ 1. Scorecard
Apa: Sistem peringkat risiko berbasis warna ๐ข๐ก๐ด
Untuk apa: Tujuan manajerial โ prioritas risiko
Metode: Median + Indeks Gini โ Rating huruf
Pendekatan: Bottom-up, kualitatif
๐ 2. VaR Aktuaria
Apa: Estimasi cadangan modal dari simulasi
Untuk apa: Tujuan prudensial โ cadangan modal
Metode: Poisson ร Lognormal โ Monte Carlo โ VaR 99,9%
Pendekatan: Bottom-up, kuantitatif
๐งฎ 3. VaR Integrasi & BIA
Apa: Gabungan 3 sumber data + pembanding BIA
Untuk apa: Validasi silang (cross-check)
Metode: Integrasi Bayesian + BIA (15% GI)
Pendekatan: Bottom-up + Top-down
๐ Alur Keseluruhan Proyek
Langkah
Apa yang Dilakukan
Output
1. Kumpulkan Data
Ambil 3 sumber data (internal, ahli, eksternal)
Dataset siap pakai
2. Scorecard
Ahli menilai 56 kategori risiko โ rating & prioritas
Peringkat risiko ๐ข๐ก๐ด
3. VaR Aktuaria
Simulasi Monte Carlo dari data fraud โ distribusi kerugian
Cadangan modal (VaR)
4. VaR Integrasi
Gabungkan 3 sumber + bandingkan dengan BIA
7 estimasi VaR (Gambar 12.2)
5. Kesimpulan
Bandingkan semua metode โ validasi silang
Estimasi yang bisa dipercaya
๐ Referensi Buku
Bagian Buku
Model
Halaman
Bab 12.1 โ Kerangka Basel II
Dasar semua model
225โ227
Bab 12.2 โ Sumber Data
Data internal, ahli, eksternal
228โ231
Bab 12.3 โ Model Aktuaria
VaR Aktuaria (Model 2)
231โ234
Bab 12.4 โ Self-Assessment
Scorecard (Model 1) + Integrasi (Model 3)
234โ240
Bab 12.5 โ Kesimpulan
Perbandingan 7 metrik VaR
240โ241
๐ Data Lengkap โ Semua Dataset
Seluruh data yang dipakai proyek, sesuai Bab 12.2 buku Giudici (2009)
๐ Model 1 โ Scorecard (Self-Assessment)
Lis Indriani ยท Giudici (2009) Bab 12.4 ยท analog Gambar 12.1
๐ Halaman ini menjawab: Dari 56 kategori risiko bank,
mana yang paling berbahaya dan harus ditangani lebih dulu?
Model ini menggunakan pendapat ahli untuk membuat peringkat risiko
dengan sistem warna ๐ข๐ก๐ด.
1๏ธโฃ Rumusan Masalah
Dari banyak jenis risiko operasional yang bisa terjadi di sebuah bank, mana yang paling berbahaya dan harus ditangani lebih dulu?
Sebuah bank menghadapi puluhan jenis risiko. Tidak mungkin menangani semua sekaligus. Kita perlu cara untuk memberi peringkat risiko mana yang paling mendesak.
2๏ธโฃ Metode (dari buku)
Scorecard / Self-Assessment โ seperti membuat rapor untuk tiap risiko.
Para ahli menilai tiap risiko dari 3 sisi: frekuensi, severity, dan kontrol.
Penilaian digabung memakai median + indeks Gini (tingkat kesepakatan).
Hasilnya: rating huruf (A = paling aman) + lampu lalu lintas ๐ข๐ก๐ด.
๐งฉ Perumpamaan: Seperti dokter UGD yang melakukan triase. Pasien paling kritis didahulukan. Scorecard melakukan hal sama untuk risiko.
G = 1 โ ฮฃ pkยฒ โ Gnorm = G ร K/(Kโ1)
Perceived Loss = frekuensi/tahun ร nilai severity ร faktor kontrol
๐ Istilah, Rumus, & Kenapa Dipakai
Daftar Istilah
Median (nilai tengah)
Nilai yang persis di tengah setelah data diurutkan. Tahan terhadap nilai ekstrem.
Ordinal
Skala berjenjang (rendah/sedang/tinggi) tanpa jarak pasti antar tingkat.
Indeks Gini
Ukuran seberapa beragam jawaban para ahli: 0 = semua sama, 1 = sangat beragam.
Konsensus
Tingkat kesepakatan antar ahli.
Rating huruf (A/AA/AAA)
Seperti peringkat kredit. A = paling aman; makin banyak huruf = makin kuat keyakinannya.
Perceived loss
Perkiraan kerugian = seberapa sering ร seberapa besar ร faktor kontrol.
Rumus yang Dipakai
G = 1 โ ฮฃ pkยฒ โ Gnorm = G ร K/(Kโ1)
Indeks Gini ternormalisasi โ mengukur keberagaman jawaban ahli (pk = proporsi ahli yang memilih kelas ke-k, K = jumlah kelas).
Perceived Loss = frekuensi/tahun ร nilai severity ร faktor kontrol
Skor Prioritas = rfreq ร rsev ร rctrl
r = peringkat kelas median tiap dimensi (makin tinggi = makin berisiko).
Kenapa Rumus Ini Dipakai?
Median (bukan rata-rata) โ penilaian ahli bersifat ordinal, dan median tahan terhadap 1 ahli yang menjawab ekstrem.
Indeks Gini โ mengubah seberapa kompak pendapat ahli menjadi angka. Kalau ahli kompak (Gini kecil), kita lebih percaya โ rating diperkuat (AAA). Inilah cara buku menilai kualitas konsensus.
Frekuensi ร Severity ร Kontrol โ definisi baku risiko: Risiko = Peluang ร Dampak, lalu disesuaikan oleh kualitas kontrol.
3๏ธโฃ & 4๏ธโฃ Dataset & Proses
5๏ธโฃ Hasil & Kesimpulan
Tabel Scorecard (diurutkan: paling atas = paling prioritas)
๐ Grafik 15 Risiko Prioritas Tertinggi
๐บ๏ธ Peta Risiko (Heatmap)
๐ก Kotak paling merah = area yang harus mendapat perhatian utama.
๐ Model 2 โ VaR Aktuaria
Ana Sulistiana Alwi ยท Giudici (2009) Bab 12.3 ยท analog Gambar 12.2
๐ Halaman ini menjawab: Berapa cadangan modal minimum yang harus disiapkan bank untuk menutup kerugian fraud? Model ini mensimulasikan ribuan skenario lalu mencari batas kerugian terburuk (VaR 99,9%).
1๏ธโฃ Rumusan Masalah
Seberapa besar total kerugian terburuk yang mungkin kita alami akibat penipuan (fraud), dan berapa "modal cadangan" yang harus disiapkan?
2๏ธโฃ Metode (dari buku)
Model Aktuaria โ menggabungkan:
Frekuensi โ distribusi Poisson (berapa kali fraud terjadi)
Severity โ distribusi Lognormal (berapa besar tiap kerugian)
Simulasi Monte Carlo โ komputer mengarang ribuan skenario masa depan
VaR 99,9% = batas kerugian pada tingkat keyakinan sangat tinggi
๐งฉ Perumpamaan: Seperti perusahaan asuransi menghitung premi. Dengan ribuan simulasi, mereka tahu skenario terburuk. VaR 99,9% = "dana darurat" untuk 999 dari 1.000 kemungkinan.
L = ฮฃi=1N Xi โ N ~ Poisson(ฮป), X ~ Lognormal(ฮผ, ฯ)
VaRq = persentil ke-q dari distribusi L
๐ Istilah, Rumus, & Kenapa Dipakai
Daftar Istilah
Frekuensi (N)
Berapa kali kejadian terjadi dalam satu periode.
Severity (X)
Besar kerugian setiap kejadian.
Distribusi Poisson
Model peluang untuk MENGHITUNG JUMLAH kejadian acak yang langka per periode (mis. jumlah klaim per hari).
Distribusi Lognormal
Model untuk BESARAN yang selalu positif & condong ke kanan: banyak kerugian kecil, sesekali sangat besar.
Monte Carlo
Teknik 'mengarang' ribuan skenario acak lalu meninjau hasil keseluruhannya.
VaR (Value at Risk)
Batas kerugian pada tingkat keyakinan tertentu.
Persentil
Nilai yang di bawahnya terdapat sekian persen data (P99,9 = 99,9% data di bawahnya).
ฮผ dan ฯ
Rata-rata & simpangan dari logaritma kerugian (parameter lognormal).
Rumus yang Dipakai
L = ฮฃi=1N Xi
Total kerugian = menjumlahkan N kerugian individual (N pun acak).
N ~ Poisson(ฮป) X ~ Lognormal(ฮผ, ฯ)
VaRq = persentil ke-q dari distribusi L xq = eฮผ + ฯzq
zq = nilai-z normal baku untuk peluang q.
Kenapa Rumus Ini Dipakai?
Poisson untuk frekuensi โ paling cocok menghitung jumlah kejadian langka & acak yang saling bebas per periode (standar di aktuaria/asuransi).
Lognormal untuk severity โ kerugian tidak pernah negatif dan punya ekor panjang (sesekali kerugian sangat besar), persis pola data fraud.
Monte Carlo โ menjumlahkan N (acak) kerugian (acak) sulit dihitung dengan satu rumus; menyimulasikan ribuan kali memberi gambaran utuh.
VaR 99,9% โ regulator Basel mewajibkan modal yang cukup menutup kerugian pada tingkat keyakinan sangat tinggi (hanya 0,1% boleh meleset).
3๏ธโฃ Dataset
4๏ธโฃ & 5๏ธโฃ Hasil
Distribusi Total Kerugian (dari ribuan skenario Monte Carlo)
๐ก Sebagian besar skenario ada di kiri (kerugian kecil). Garis merah menandai batas VaR โ hanya 0,1% skenario melampaui garis ini.
๐งฎ Model 3 โ VaR Integrasi & BIA
Andi Agung Dwi Arya B ยท Giudici (2009) Bab 12.4 ยท analog Gambar 12.2
๐ Halaman ini menjawab: Jika kita gabungkan semua sumber data (internal + ahli + bank lain), berapa estimasi VaR-nya? Dan apakah hasilnya konsisten dengan cara sederhana (BIA = 15% pendapatan)?
1๏ธโฃ Rumusan Masalah
Kalau kerugian dihitung dengan beberapa metode berbeda, berapa hasilnya dan apakah saling konsisten?
Mengandalkan satu metode saja berisiko. Lebih aman bila kita menghitung dengan beberapa cara lalu membandingkannya.
2๏ธโฃ Metode (dari buku)
Integrasi Bayesian (bottom-up) โ menggabungkan 3 sumber data menjadi satu estimasi
c = ฮฃ kerugian eksternal / ฮฃ kerugian internal Sscaled = Seksternal / c
Konstanta scaling c menyetarakan ukuran data eksternal terhadap internal.
VaRq = persentil ke-q dari Sgabungan
BIA = ฮฑ ร Gross Income, ฮฑ = 15%
Kenapa Rumus Ini Dipakai?
Menggabungkan 3 sumber โ tiap sumber punya kelemahan: internal (terbatas pengalaman sendiri), expert (subjektif), eksternal (beda konteks). Gabungan lebih lengkap dan tahan.
Scaling โ agar kerugian bank besar tidak 'membanjiri' estimasi bank kita; disesuaikan secara proporsional dulu.
BIA (15% gross income) โ pembanding sederhana yang diakui regulator. Kalau metode canggih (Bayesian) hasilnya dekat dengan BIA, itu memberi keyakinan silang bahwa angkanya masuk akal.
3๏ธโฃ Dataset
Data yang Digunakan (3 sumber)
โ Internal (PaySim)
โก Expert (ahli)
โข Eksternal (bank lain)
4๏ธโฃ & 5๏ธโฃ Hasil
๐ Perbandingan VaR antar-metode (analog Gambar 12.2 di buku)
๐ก Jika batang-batang berdekatan, berarti metode-metode saling sepakat โ hasil lebih dapat dipercaya.
๐ Ringkasan Eksekutif
Semua hasil dari 3 model dalam satu halaman โ siap untuk presentasi
๐ฏ Angka Kunci
๐ก Temuan Utama: Ketiga pendekatan (bottom-up via aktuaria, gabungan Bayesian, dan top-down BIA) menghasilkan estimasi yang saling berdekatan โ menunjukkan bahwa model ini saling memvalidasi, sesuai Gambar 12.2 di buku Giudici.
๐ Model 1 โ Hasil Scorecard
๐บ๏ธ Peta Risiko โ Perceived Loss per Kategori Basel II
๐ Model 2 & 3 โ Perbandingan 7 Metode VaR
๐ Ringkasan per Model
๐ Detail Kesesuaian dengan Buku (11/12 aspek โ )