AI sudah pandai, tapi boros. Google perkenal cara buat ejen AI sedar bajet. Relevan untuk bank, insurans dan e-dagang yang mahu jimat jutaan kos cloud.
![]()
AI yang bijak bajet: daripada pusat panggilan ke gudang Shopee
Satu trend jelas pada 2025: syarikat besar memang dah guna AI, tapi bil cloud makin menakutkan. Ada bank di rantau ini yang melaporkan kos model bahasa besar (LLM) melonjak lebih 30% dalam masa kurang setahun bila projek chatbot, scoring kredit dan automasi dokumen jalan serentak.
Dalam runcit dan e-dagang pula, pemain besar seperti pasar raya rangkaian, platform gaya Shopee dan Lazada, serta bank yang mengurus jutaan transaksi sehari, berdepan isu sama: AI makin pandai, tapi dompet infrastruktur makin nipis.
Google dan UC Santa Barbara baru sahaja bentang satu rangka kerja penting: Budget Tracker dan Budget Aware Test-time Scaling (BATS). Ia kedengaran teknikal, tapi implikasinya sangat praktikal: AI perlu pandai berfikir tentang bajet sendiri — bukan hanya bagi sektor teknologi, tapi untuk perbankan, insurans, fintek, runcit dan e-dagang yang obses dengan ROI dan margin operasi.
Artikel ini terangkan apa sebenarnya rangka kerja bajet-pintar Google ini, dan bagaimana bank, insurans dan pemain e-dagang besar boleh guna prinsip sama untuk jimat juta ringgit tanpa mengorbankan prestasi AI.
Kenapa bajet AI makin kritikal untuk runcit & kewangan
Isu utama bukan lagi “bolehkah AI buat kerja ini?”, tapi “berapa kos setiap jawapan yang AI beri?”.
Dalam operasi sebenar:
- Chatbot bank guna
toolsemak baki, transaksi, status pinjaman. - Ejen AI e-dagang guna
toolcari stok, semak harga pembekal, jejak penghantaran. - Sistem analitik risiko guna
toolakses data transaksi, laporan kewangan, dokumen pematuhan.
Setiap panggilan tool ini:
- Menambah token (panjang konteks, bil model).
- Menambah latency (masa respon pelanggan lambat).
- Menambah kos API (lebih banyak panggilan, lebih tinggi bil bulanan).
Google tunjuk satu realiti yang ramai organisasi dah rasa:
Bagi ejen AI lebih banyak
computedantooltidak semestinya meningkatkan ketepatan. Kadang-kadang, ia cuma meningkatkan bil.
Dalam tugas penyelidikan mendalam, kalau ejen AI tak faham bajet, ia akan:
- Ikut satu
leadyang kurang relevan, - Guna 10–20 panggilan
search/browse, - Akhirnya sedar laluan tu jalan mati.
Bayangkan senario serupa dalam kewangan dan runcit:
- Chatbot bank asyik panggil sistem core banking berkali-kali hanya untuk sahkan maklumat yang sama.
- Ejen harga dinamik e-dagang memukul API pembekal dan logistik terlalu kerap untuk produk yang sebenarnya jualan perlahan.
Ini pembaziran compute dan masa. Di sinilah konsep AI bajet-pintar yang Google cadangkan jadi sangat relevan.
Budget Tracker: cara paling ringkas untuk buat AI sedar bajet
Budget Tracker ialah modul ringkas di peringkat prompt yang buat satu perkara penting: sentiasa beritahu ejen AI,
“Berapa banyak bajet reasoning dan panggilan tool yang masih tinggal sekarang?”
![]()
Bukan perlu model baru, bukan perlu latihan semula. Ia hanya:
- Tambah polisi bajet dalam prompt (contoh: tinggi / sederhana / rendah).
- Kemas kini status bajet pada setiap langkah reasoning.
- Minta model sesuaikan strategi bergantung pada baki bajet.
Bagaimana konsep ini terpakai untuk bank & e-dagang?
Bayangkan beberapa aplikasi tipikal di Malaysia:
-
Chatbot bank / insurans
- Bila bajet masih tinggi: ejen boleh guna lebih banyak panggilan ke sistem dalaman (transaksi terperinci, rekod polisi) untuk berikan jawapan lebih lengkap.
- Bila bajet mula rendah: ejen kurangkan panggilan, guna ringkasan, dan cadang pelanggan ke saluran lain (contohnya callback manusia untuk kes kompleks).
-
Ejen inventori runcit & e-dagang
- Bajet tinggi: buat carian mendalam – semak pelbagai gudang, pembekal, dan ramalan permintaan.
- Bajet rendah: fokus hanya pada SKU bernilai tinggi, margin tebal, atau kawasan yang paling banyak aduan stok.
-
Ejen pematuhan (compliance) di bank / fintek
- Bajet tinggi: baca banyak dokumen sokongan, cross-check beberapa sumber dalaman.
- Bajet rendah: fokus kepada dokumen dan medan yang paling “material” kepada keputusan risiko.
Apa kata data kajian Google?
Dalam ujian Google terhadap ejen carian yang guna alat search dan browse:
- Budget Tracker capai ketepatan setara atau lebih baik dengan:
- 40.4% kurang panggilan search,
- 19.9% kurang panggilan browse,
- 31.3% pengurangan kos keseluruhan.
- Prestasi ejen biasa (ReAct tanpa bajet) mula plateau selepas satu tahap bajet, tetapi Budget Tracker terus meningkat apabila bajet dinaikkan.
Maksudnya, ejen yang tahu bajet sendiri bukan saja murah, malah skalanya lebih baik bila bajet bertambah.
Untuk CIO bank atau ketua digital e-dagang, angka sebegini terus terjemah kepada:
- Penjimatan ratus ribu atau juta ringgit setahun dalam kos infrastruktur.
- Kebenaran untuk luaskan projek AI tanpa takut bil meletup tak terkawal.
BATS: rangka kerja bajet-pintar yang lebih menyeluruh
Kalau Budget Tracker ialah “speedometer bajet”, BATS (Budget Aware Test-time Scaling) ialah sistem cruise control penuh yang rancang perjalanan ejen AI dari mula sampai habis.
BATS buat dua perkara besar:
- Rancang cara guna bajet sepanjang proses reasoning.
- Tentukan bila patut “gali lebih dalam” atau “ubah haluan” berdasarkan bajet yang tinggal.
Komponen utama BATS
-
Modul Perancangan (Planning)
- Merangka pelan tindakan: alat mana nak guna, berapa dalam nak kaji, urutan langkah.
- Laras intensiti usaha mengikut tahap bajet (contoh: aggressive exploration bila bajet tinggi, fokus kepada laluan paling menjanjikan bila bajet rendah).
-
Modul Verifikasi (Verification)
- Menilai sama ada jawapan calon cukup kuat.
- Keputusan: teruskan gali laluan sama, atau hentikan dan cuba laluan lain dengan baki bajet.
-
LLM-as-a-Judge
- Bila bajet habis, model lain pilih jawapan terbaik antara semua percubaan yang telah diverifikasi.
Sepanjang proses, Budget Tracker kekal mengemaskini:
- Bajet yang sudah digunakan,
- Baki bajet yang tinggal,
- Panduan polisi alat yang sesuai untuk setiap fasa.

Prestasi BATS dalam kajian Google
Dalam ujian ke atas beberapa benchmark carian maklumat, menggunakan Gemini 2.5 Pro sebagai model asas:
- Pada dataset BrowseComp:
- ReAct biasa: 12.6% ketepatan.
- BATS: 24.6% ketepatan.
- Pada HLE-Search:
- ReAct biasa: 20.5%.
- BATS: 27.0%.
- Pada BrowseComp, BATS capai ketepatan lebih tinggi dengan kos sekitar USD0.23, berbanding pendekatan parallel scaling yang perlukan >USD0.50 untuk hasil setara.
Ini bukan peningkatan kecil. Ia hampir dua kali ganda ketepatan dalam sesetengah kes dengan kos yang lebih rendah.
Bayangkan analoginya dalam sektor kewangan dan runcit:
- Skor risiko kredit yang lebih tepat dengan bil komputasi lebih rendah.
- Pengesanan penipuan yang kurang false positive, sambil kekalkan kos infrastruktur terkawal.
- Cadangan produk runcit yang lebih relevan, tanpa AI mengorek data secara berlebihan di setiap sesi.
Di mana bajet-pintar paling masuk akal dalam runcit & kewangan
Ada tiga domain utama di mana pendekatan gaya Budget Tracker dan BATS boleh beri impak segera.
1. Khidmat pelanggan omnichannel (bank & e-dagang)
Masalah biasa:
Chatbot nampak hebat dalam demo, tapi dalam dunia sebenar:
- Respon lambat sebab terlalu banyak panggilan ke sistem dalaman.
- Bil API naik mendadak setiap kali kempen besar atau musim perayaan.
- Sukar kawal kualiti jawapan bila trafik tinggi.
Apa yang bajet-pintar boleh buat:
- Tetapkan bajet per sesi pelanggan (contoh: maksimum X panggilan ke sistem core + Y panggilan ke
search). - Gaya Budget Tracker: bot sentiasa sedar “bajet tinggal 30%” dan mula:
- Ringkaskan jawapan,
- Beri pilihan untuk disambung kepada ejen manusia,
- Kurangkan
tool callyang berulang.
- Gaya BATS: untuk isu kompleks (dispute kad kredit, tuntutan insurans), ejen AI rancang awal modul mana nak guna, dokumen mana paling penting untuk dibaca terlebih dahulu.
Hasilnya: pengalaman pelanggan lebih konsisten, kos per sesi terkawal, dan mudah untuk CFO faham dinamika kos vs kualiti.
2. Pengurusan inventori & logistik runcit besar
Untuk rangkaian pasar raya, farmasi, atau pemain e-dagang:
- Ejen AI perlu akses banyak sistem: WMS, sistem pembekal, data penghantaran, jualan POS, promosi, dan ramalan cuaca/perayaan.
- Tanpa bajet, ejen akan “semak semua benda”, setiap masa.
Dengan pendekatan bajet-pintar:
- Bajet tinggi (contoh: perancangan sebelum musim Raya):
- Ejen buat analisis mendalam merentasi semua gudang dan cawangan.
- Guna lebih banyak panggilan ke alat ramalan permintaan.
- Bajet rendah (operasi harian biasa):
- Fokus hanya pada SKU kritikal dan lokasi panas (high volume / high margin).
- Kurangkan refresh frekuensi untuk produk slow-moving.
Ini sejajar dengan cara pasukan operasi sebenar berfikir – cuma kini, ejen AI pun diajar untuk berfikir dalam bahasa bajet dan impak kos.
3. Analitik risiko, pematuhan & audit di perbankan/fintek
Proses seperti audit dalaman, semakan pematuhan, atau due diligence pelanggan korporat biasanya:
- Sangat dokumen-intensif,
- Melibatkan banyak panggilan ke sistem data dalaman dan luaran,
- Berisiko tinggi dari sudut kos dan masa.
Menggunakan konsep BATS:
- Modul perancangan tetapkan urutan:
- baca ringkasan profil,
- semak medan paling kritikal (KYC, beneficial ownership, sejarah penalti),
- hanya jika perlu, pergi kepada dokumen tambahan.
- Modul verifikasi menilai bila jawapan analitik risiko sudah “cukup baik” untuk tahap pendedahan tertentu, sebelum bazirkan bajet pada butiran yang kurang material.
Kesan sampingan positif: pasukan risiko dan pematuhan dapat jejak dengan jelas di mana bajet digunakan dan rasional strategi ejen AI, sesuatu yang penting untuk keyakinan pengawal selia.

Cara praktikal mula bina ejen AI bajet-pintar
Bukan semua organisasi perlu terus bina BATS penuh. Tetapi ada beberapa langkah rendah risiko yang boleh diambil dalam 3–6 bulan akan datang.
1. Ukur kos per kes penggunaan AI
Ramai pasukan hanya lihat bil agregat bulanan. Itu tak cukup. Mulakan dengan:
- Kos purata per sesi chatbot pelanggan,
- Kos purata per laporan analitik risiko,
- Kos purata per cadangan inventori.
Bila angka ini jelas, lebih senang tentukan di mana bajet perlu diketatkan.
2. Tambah “mini Budget Tracker” dalam prompt
Walaupun tanpa replikasi penuh kajian Google, anda boleh:
- Tetapkan had bilangan
tool callsper sesi. - Nyatakan secara eksplisit dalam prompt:
- “Awak mempunyai maksimum 8 panggilan ke sistem X dan 5 ke sistem Y. Laporkan berapa yang telah digunakan dan sesuaikan strategi bila baki rendah.”
- Log bilangan panggilan sebenar dan pantau impak ke atas kualiti jawapan.
Selalunya, hanya dengan buat AI sedar bajet, penggunaan tool yang tidak perlu akan berkurang.
3. Kategori kes guna: ‘High-Value’ vs ‘Low-Value’
Jangan layan semua permintaan sama. Bina kelas bajet:
- High-value: pelanggan bernilai tinggi, kes risiko tinggi, transaksi besar.
- Bajet lebih besar, AI dibenarkan berfikir dan menyemak lebih dalam.
- Low-value: pertanyaan rutin, transaksi kecil.
- Bajet lebih rendah, jawapan lebih ringkas dan standard.
Ini seiring dengan prinsip asas kewangan: alokasi modal berdasarkan nilai. Sekarang, kita cuma terjemahkan prinsip yang sama kepada compute dan panggilan tool AI.
Masa depan AI dalam kewangan & runcit: dari “pandai” ke “bijak berbelanja”
Dalam siri AI dalam Perkhidmatan Kewangan (Bank, Insurans, Fintek), satu corak sentiasa berulang:
- Bank dan insurans agresif labur dalam AI,
- Fintek cepat mencuba model baru,
- Tapi semua akhirnya kembali kepada satu soalan: berapa kos untuk mengekalkan skala ini?
Kerja Google tentang Budget Tracker dan BATS menunjukkan hala tuju yang saya rasa akan jadi standard industri:
Ejen AI masa depan bukan sahaja perlu bagus membuat reasoning, tetapi mesti pandai mengira nilai vs kos untuk setiap langkah yang diambil.
Bagi bank, insurans, fintek, dan gergasi runcit/e-dagang di Malaysia,
- Ini peluang untuk menstruktur semula projek AI dengan disiplin bajet yang jelas.
- Ini juga masa yang tepat untuk bertanya:
- “Di mana ejen AI kami sedang guna 20 panggilan tool untuk masalah yang patut selesai dalam 5?”
Kalau anda sedang merancang 2026 budget cycle, soalan paling praktikal ialah:
“Bagaimana kami boleh jadikan setiap ringgit compute lebih bijak digunakan daripada tahun ini?”
Jawapannya bermula dengan satu langkah mudah — ajar ejen AI anda sedar bajet, dan bina dari situ.