Bank dan insurans semakin bergantung pada ejen AI, tapi kos compute mudah meletup. Google perkenal Budget Tracker dan BATS untuk jadikan AI lebih cermat berbelanja.
![]()
Mengapa bajet AI jadi isu besar untuk bank sekarang
Dalam beberapa bank besar di Asia, kos pemprosesan model AI untuk analitik dan pematuhan sudah mencecah jutaan ringgit setahun. Bukan sebab model terlalu mahal semata-mata, tapi kerana cara ia digunakan tidak terkawal: terlalu banyak panggilan API, terlalu banyak carian web, terlalu banyak ejen AI yang “berfikir” tanpa had.
Dalam konteks perkhidmatan kewangan Malaysia — bank, insurans dan fintech — situasi ini makin ketara hujung tahun bila pasukan risiko, pematuhan dan pengurusan kekayaan mengejar tarikh audit, semakan portfolio dan laporan tahun penuh. Semua mahu guna AI, semua mahu keputusan lebih cepat, tapi bajet IT dan risiko operasi tetap ada had.
Kajian terbaru oleh Google dan UC Santa Barbara memperkenalkan dua pendekatan baharu yang terus menyentuh isu ini: Budget Tracker dan kerangka Budget Aware Test-time Scaling (BATS). Kedua-duanya pada asasnya mengajar ejen AI untuk “berbelanja” compute dan panggilan tool dengan lebih bijak. Untuk sektor kewangan, ini bukan sekadar inovasi teknikal — ini cara praktikal untuk mengawal kos AI sambil kekalkan ketepatan dan pematuhan.
Artikel ini kupas apa sebenarnya Budget Tracker dan BATS, dan lebih penting, bagaimana bank dan syarikat insurans boleh guna konsep sama untuk pemarkahan kredit, pengesanan penipuan, pematuhan, dan personalisasi pelanggan.
Inti masalah: ejen AI kuat, tapi boros
Ejen AI moden jarang bekerja bersendirian. Untuk tugas dunia sebenar, ia sentiasa:
- memanggil API dalaman (contoh: sistem core banking, sistem kad kredit)
- menyemak dokumen (PDF polisi, kontrak, laporan audit)
- menjalankan carian web (berita pasaran, senarai sekatan, maklumat syarikat)
Setiap tool call ini menggunakan token, masa, dan wang.
Dalam kajian Google, penyelidik tunjuk satu corak yang sangat biasa: bila ejen tak sedar bajet, ia akan ikut satu “lead” yang nampak menarik, kemudian habiskan 10–20 panggilan tool untuk gali lebih dalam, dan akhirnya sedar laluan itu buntu. Dari sudut CFO bank, itu sama seperti bayar satu pasukan audit luar untuk siasat fail yang salah selama dua minggu.
Inilah cabaran utama untuk perkhidmatan kewangan:
- Proses panjang dan kompleks – due diligence pelanggan korporat, penyiasatan AML, semakan pematuhan Basel/BNM, semua melibatkan dokumen dan data berlapis-lapis.
- Kos API dan infrastruktur – Panggilan ke model besar (LLM premium), carian dokumen skala besar, dan integrasi dengan sistem legacy bukan murah.
- Risiko SLA dan masa tindak balas – Chatbot perbankan runcit tak boleh ambil masa 30 saat hanya kerana ejen AI “berfikir” terlalu lama.
Realitinya, menambah lebih banyak compute dan panggilan tool tak semestinya meningkatkan prestasi. Selepas satu tahap, prestasi mula mendatar, tetapi bil cloud terus naik.
Budget Tracker: cara mudah ajar ejen AI jaga bajet
Budget Tracker ialah pendekatan paling ringan yang diperkenalkan Google. Ideanya sangat mudah tapi berkesan: beritahu ejen AI secara jelas berapa banyak bajet reasoning dan panggilan tool yang masih tinggal, dan kemas kini maklumat itu pada setiap langkah.
Secara praktikal, Budget Tracker:
- wujud hanya di peringkat prompt (tak perlu latih model baru)
- bertindak seperti “dashboard bajet” dalam kepala ejen AI
- beritahu: berapa banyak tool call dah guna, berapa yang tinggal, dan garis panduan apa bila bajet hampir habis
Dalam eksperimen Google ke atas agen carian dan pelayaran web:
Menambah Budget Tracker mencapai ketepatan setanding sambil mengurangkan 40.4% panggilan carian, 19.9% panggilan “browse”, dan menurunkan kos keseluruhan kira-kira 31.3%.
Dari perspektif bank, ini terus terjemah kepada:
- kurang panggilan ke model premium
- kurang bacaan ulang dokumen yang sama
- masa tindak balas lebih stabil
![]()
Aplikasi praktikal Budget Tracker dalam perkhidmatan kewangan
Beberapa contoh guna terus:
-
Penyiasatan AML / pemantauan transaksi
Ejen AI yang menyaring transaksi mencurigakan sering:- rujuk pangkalan data dalaman (profil pelanggan, sejarah akaun)
- semak berita dan sumber open-source (adverse media)
- analisis dokumen sokongan (invoice, kontrak)
Dengan Budget Tracker, kita boleh tetapkan, contohnya:
- maksimum 5 panggilan carian luaran
- maksimum 10 dokumen untuk satu kes
- dasar: bila tinggal 20% bajet, fokus kepada pengesahan bukti paling kritikal sahaja
-
Penilaian kredit SME
Ejen AI yang bantu pegawai kredit:- menganalisis penyata kewangan 3 tahun
- menyemak rekod CCRIS / CTOS
- membaca laporan pasaran dan berita industri
Budget Tracker boleh memaksa ejen:
- buat pelan dulu: dokumen mana paling penting
- kurangkan “lompat” antara terlalu banyak sumber
- elak membaca dokumen sampingan berkali-kali
-
Chatbot perbankan runcit mesra bajet
Untuk soalan pelanggan kompleks (“saya nak restructure hutang + pelaburan + takaful”), chatbot boleh:- hadkan berapa kali ia panggil engine pengiraan dalaman
- pilih hanya dokumen polisi paling relevan
supaya masa jawapan kekal dalam SLA, dan kos per sesi terkawal.
Kelebihan besar Budget Tracker ialah ia boleh dilaksana hari ini hanya dengan reka bentuk prompt yang betul. Tiada penukaran besar pada seni bina sistem.
BATS: kerangka penuh untuk prestasi maksima di bawah bajet terhad
Jika Budget Tracker ialah “speedometer”, Budget Aware Test-time Scaling (BATS) pula seperti sistem cruise control adaptif untuk ejen AI. Ia bukan sahaja memaparkan bajet, tapi mengubah strategi ejen berdasarkan baki bajet secara dinamik.
Dalam BATS, terdapat beberapa modul utama:
- Modul perancangan – merancang langkah dan tool apa untuk digunakan berdasarkan bajet semasa.
- Modul verifikasi – menilai jawapan sementara: patutkah “gali lebih dalam” atau “pusing ke laluan lain” dengan baki bajet.
- Budget Tracker berterusan – mengemas kini penggunaan dan baki sumber setiap iterasi.
- LLM sebagai hakim – di hujung proses, memilih jawapan terbaik daripada beberapa percubaan yang telah disahkan.
Dalam ujian Google menggunakan Gemini 2.5 Pro:
- Pada dataset BrowseComp, BATS capai 24.6% ketepatan berbanding 12.6% untuk ReAct biasa.
- Pada HLE-Search, BATS capai 27.0% berbanding 20.5% untuk ReAct.
- Untuk ketepatan setara, BATS hanya perlukan kira-kira USD0.23 berbanding lebih USD0.50 untuk baseline parallel scaling.
Jelas: lebih tepat, dengan kos lebih rendah.
Bagaimana konsep BATS boleh diterjemahkan untuk bank
Walaupun BATS dibina dan diuji pada ejen carian umum, struktur fikirannya sangat sesuai untuk perkhidmatan kewangan.
1. Proses due diligence pelanggan korporat (KYC & onboarding)
Bayangkan ejen AI untuk onboarding korporat yang:
- Merancang:
- langkah semakan (profil syarikat, pemilik manfaat, struktur pegangan)
- tool untuk dipanggil (pangkalan data dalaman, senarai sekatan, laporan kredit, berita)
- Mengumpul bukti secara bertahap, bukan “semak semua benda sekaligus”.
- Menilai setiap hipotesis risiko:
- jika bukti cukup jelas, hentikan dan cadangkan keputusan
- jika ragu, gunakan baki bajet untuk semak laluan lain
Hasilnya:
- Senior compliance officer terima ringkasan risiko yang padat, bukannya long report 50 muka surat yang dihasilkan AI.
- Kos untuk setiap fail onboarding lebih konsisten dan boleh diramal.

2. Semakan pematuhan dan audit dalaman
BATS sangat sesuai untuk kerja panjang berjela seperti:
- semakan pematuhan terhadap polisi dalaman & garis panduan BNM
- pemantauan model risk (model kredit, model insurans)
Kerangka BATS boleh diarahkan:
- Modul perancangan: pilih subset polisi dan dokumen kawal selia yang paling relevan dulu.
- Modul verifikasi: bila jumpa isu berpotensi pelanggaran, tentukan sama ada guna baki bajet untuk:
- semak lebih mendalam kes itu, atau
- imbas fail atau polisi lain untuk lihat sama ada isu itu terpencil atau sistematik.
3. Analitik kekayaan & cadangan pelaburan berbilang langkah
Untuk pengurusan kekayaan runcit atau HNWI, ejen AI lazimnya akan:
- baca profil risiko pelanggan
- analisis portfolio sedia ada
- rujuk data pasaran dan penyelidikan dalaman
- jana beberapa senario strategi
Dengan gaya BATS:
- modul perancangan boleh mengehadkan berapa banyak data pasaran real-time yang diambil (mahal) dan utamakan sumber dalaman terlebih dahulu;
- modul verifikasi boleh menguji beberapa cadangan dan berhenti selepas satu cadangan melepasi ambang kualiti tertentu, bukan terus menjana 10–20 senario yang tak digunakan.
Ini penting jika anda mahu skala khidmat “AI wealth assistant” kepada ratusan ribu pelanggan runcit tanpa kos meledak.
Menghubungkan bajet AI dengan ekonomi perbankan
Penyelidik Google merumuskan satu perkara yang saya rasa sangat relevan untuk semua CIO dan Chief Risk Officer di Malaysia:
Hubungan antara reasoning dan ekonomi akan jadi tak terpisah. Model masa depan perlu berfikir tentang nilai, bukan hanya kebenaran.
Dalam konteks bank dan insurans, itu bermaksud:
-
Setiap langkah reasoning ejen AI mesti ada justifikasi ekonomi.
Contoh: jika satu panggilan API kos RM0.05, adakah ia menaikkan kebarangkalian keputusan yang betul cukup banyak untuk layak dibayar? -
Keputusan reka bentuk ejen AI perlu dinilai seperti produk kewangan.
Kita patut lihat expected value setiap strategi:
lebih banyak tool call ≠lebih banyak nilai; ada titik ketepuan. -
Bajet AI patut diurus seperti bajet risiko kredit.
Anda tetapkan had, monitor pendedahan, dan pelarasan dibuat bila metrik prestasi menyimpang.
Model seperti Budget Tracker dan BATS ialah langkah pertama ke arah ejen AI yang faham “kos peluang” dan bukan hanya “cari jawapan paling lengkap”.
Bagaimana organisasi kewangan boleh bermula
Anda tak perlu tunggu Google keluarkan produk rasmi untuk manfaatkan idea ini. Beberapa langkah praktikal yang saya cadangkan:

1. Wujudkan metrik kos-prestasi yang jelas
Jangan hanya kira “kos bulanan LLM”. Pecahkan mengikut jenis use case:
- kos per kes AML yang disiasat
- kos per pelanggan yang di-onboard
- kos per laporan pematuhan
- kos per perbualan chatbot
Kemudian ukur:
- ketepatan atau kualiti (misalnya, kadar false positive AML, masa onboarding, NPS pelanggan)
- bagaimana ia berubah bila anda naik/turun had tool call dan panjang reasoning
2. Tambah “isyarat bajet” dalam prompt hari ini
Untuk banyak senario, anda boleh:
- Nyatakan dalam prompt: had bilangan panggilan tool, had panjang jawapan, keutamaan bila bajet hampir habis.
- Minta model melaporkan di penghujung: berapa banyak tool digunakan, dan apa yang akan dibuat jika diberi 20% bajet tambahan.
Ini meniru sebahagian tingkah laku Budget Tracker tanpa infrastruktur kompleks.
3. Reka bentuk ejen dengan fasa perancangan dan verifikasi
Walaupun bukan BATS penuh, cuba pisahkan aliran kerja ejen AI kepada:
- Fasa pelan – ejen menjelaskan langkah yang akan diambil dan tool yang akan digunakan.
- Fasa pelaksanaan – hanya jalankan beberapa langkah pertama, kemudian semak sama ada hala tuju masih masuk akal.
- Fasa semak / pivot – sebelum habiskan bajet, tanya semula: adakah patut teruskan laluan ini atau cuba laluan lain?
Pemisahan ini sahaja selalunya cukup untuk kurangkan “pembaziran reasoning” dan panggilan tool yang tak perlu.
4. Libatkan pasukan risiko & pematuhan dari awal
Dalam perkhidmatan kewangan, constraint bukan hanya bajet teknologi — ia juga bajet risiko:
- berapa banyak anda sanggup kurangkan false positive AML untuk jimat kos?
- berapa banyak automasi pemarkahan kredit yang boleh diterima tanpa menjejaskan fairness atau pematuhan?
Pasukan risiko patut menjadi rakan kongsi untuk menentukan bajet reasoning per kes yang selari dengan polisi risiko bank, bukan hanya angka rawak yang IT rasa munasabah.
Penutup: AI yang berfikir seperti pengurus risiko kewangan
Siri “AI dalam Perkhidmatan Kewangan” selalu kembali kepada satu tema: teknologi hanya berguna bila ia serasi dengan realiti regulatori dan ekonomi bank. Kerangka seperti Budget Tracker dan BATS menunjukkan arah masa depan — ejen AI yang bukan sahaja pintar, tetapi juga cermat berbelanja.
Bagi bank, insurans dan fintech di Malaysia yang sedang menggandakan pelaburan AI untuk 2026, ini masa yang tepat untuk semak semula:
adakah ejen AI anda hari ini berfikir tentang kos seperti mana anda berfikir tentang kos dana, kos kredit dan kos risiko?
Organisasi yang berjaya nanti bukan hanya yang ada model paling besar, tapi yang mengurus bajet AI seperti mereka mengurus modal kewangan — disiplin, berdata, dan sentiasa sedar pulangan marginal untuk setiap ringgit compute yang dibelanjakan.