Olmo 3.1: ā€˜Otak’ AI Terbuka Untuk Bank & E-Dagang

AI dalam Perkhidmatan Kewangan (Bank, Insurans, Fintek)••By 3L3C

Olmo 3.1 bawa penaakulan lebih kuat, RL lanjutan dan ketelusan penuh. Inilah asas baharu AI untuk bank, insurans dan e‑dagang yang serius tentang risiko & harga.

Olmo 3.1AI perkhidmatan kewanganAI e-dagangreinforcement learningbank dan insuransLLM terbuka perusahaan
Share:

Featured image for Olmo 3.1: ā€˜Otak’ AI Terbuka Untuk Bank & E-Dagang

Olmo 3.1: ā€˜Otak’ AI Terbuka Untuk Bank, Insurans & E‑Dagang

Pada 2025, beberapa bank besar di Asia melaporkan penurunan kerugian penipuan kad sehingga hampir 40% selepas menggabungkan model AI generatif yang lebih kuat ke dalam sistem pemantauan mereka. Angka seperti ini bukan lagi luar biasa — asalkan anda guna model yang betul, dengan kawalan yang betul.

Di sinilah keluarga model Olmo 3.1 daripada Allen Institute for AI (Ai2) jadi menarik. Ia bukan sekadar model bahasa besar (LLM) baharu; fokusnya jelas pada kecekapan, ketelusan dan kawalan perusahaan. Tiga perkara yang amat sensitif untuk sektor kewangan dan runcit/e‑dagang di Malaysia.

Dalam siri ā€œAI dalam Perkhidmatan Kewangan (Bank, Insurans, Fintek)ā€ ini, saya nak tunjukkan bagaimana kemajuan teknikal dalam Olmo 3.1 — terutama dari sudut reinforcement learning (RL) dan keupayaan penaakulan — boleh diterjemahkan kepada:

  • Pemarkahan kredit yang lebih tepat
  • Pengesanan penipuan masa nyata yang lebih pintar
  • Ramalan permintaan dan pengurusan stok untuk e‑dagang
  • Penentuan harga dinamik untuk bank, insurans dan marketplace

Bukan teori kosong, tetapi cara praktikal bagaimana pasukan data dan risiko di organisasi anda boleh memanfaatkan model seperti ini.


Apa Sebenarnya Baharu Dalam Olmo 3.1?

Jawapannya: Ai2 mengambil Olmo 3, kemudian memanjangkan latihan reinforcement learning untuk mengasah lagi kemahiran penaakulan, matematik dan pematuhan arahan.

Tiga varian utama yang relevan untuk kewangan & runcit

Ai2 memfokuskan pada dua varian 32B parameter yang penting untuk perusahaan:

  1. Olmo 3.1 Think 32B

    • Dioptimumkan untuk penyelidikan lanjutan, penaakulan kompleks dan tugas multi-langkah.
    • Sangat berguna untuk pasukan risiko, kuantitatif dan sains data bank atau insurans.
  2. Olmo 3.1 Instruct 32B

    • Ditala untuk chat, penggunaan alat (tool use) dan dialog berbilang giliran.
    • Sangat sesuai untuk chatbot pelanggan, pembantu dalaman pegawai bank, dan automasi proses operasi.
  3. Olmo 3-Base (tidak dikemas kini ke 3.1 tetapi masih relevan)

    • Sesuai untuk pengaturcaraan, kefahaman teks dan matematik.
    • Berguna jika pasukan anda mahu further fine-tune untuk domain khusus seperti insurans motor, pembiayaan perumahan, atau kategori produk runcit tertentu.

Nombor yang penting: peningkatan benchmark

Ai2 melanjutkan latihan RL untuk Olmo 3 Think 32B selama 21 hari tambahan di atas 224 GPU, menggunakan set data Dolci-Think-RL. Hasilnya:

  • +5 mata pada AIME (ujian matematik/penaakulan tahap tinggi)
  • +4 mata pada ZebraLogic (logik)
  • +4 mata pada IFEval (pematuhan arahan)
  • +20 mata pada IFBench (ujian berasaskan arahan yang lebih sukar)

Dan prestasi yang lebih baik untuk tugasan pengaturcaraan dan tugas multi-langkah yang kompleks.

Untuk konteks perbankan dan e‑dagang, apa-apa peningkatan pada ujian logik dan arahan ini bermaksud:

Model lebih konsisten mengikuti polisi, lebih tepat mengira, dan kurang ā€˜mengada-adakan’ jawapan apabila berhadapan senario rumit.

Dalam bahasa operasi: kurang kesilapan dalam cadangan had kredit, kurang false positive dalam pengesanan penipuan, dan kurang keputusan pelik dalam penentuan harga.


Mengapa Reinforcement Learning Penting Untuk Bank & E‑Dagang

Reinforcement learning (RL) sesuai untuk dunia kewangan dan runcit kerana ia meniru cara manusia belajar daripada ganjaran dan penalti — sama seperti anda melaras polisi risiko dan harga berdasarkan hasil sebenar di pasaran.

Dari eksperimen makmal ke polisi harga & risiko

Dalam Olmo 3.1, RL digunakan untuk mengasah penaakulan dan pematuhan arahan. Kalau kita bawa ke konteks kewangan dan e‑dagang, pendekatan sama boleh digunakan untuk:

  1. Penentuan harga dinamik (dynamic pricing)
    Model RL boleh dilatih untuk memaksimumkan margin atau volume dengan memerhati:

    • Permintaan masa nyata
    • Inventori semasa
    • Tingkah laku pesaing
    • Faktor luaran (musim perayaan, jualan 11.11, gaji hujung bulan)

    Setiap kombinasi harga akan dinilai berdasarkan ā€œganjaranā€ seperti jualan, margin, atau kadar churn pelanggan. Sama konsep seperti RL dalam Olmo 3.1, cuma ganjaran di sini bersifat kewangan.

  2. Ramalan permintaan & stok (inventory forecasting)
    RL boleh menguji pelbagai polisi pesanan stok: order lebih awal vs lebih lewat, buffer stok tinggi vs rendah, dan melihat kesannya kepada:

    • Kehabisan stok (lost sales)
    • Kos penyimpanan
    • Kos logistik tergesa-gesa (urgent shipping)
  3. Pengesanan penipuan & pemarkahan risiko
    Model yang semakin ā€œtajamā€ dari sudut penaakulan boleh:

    • Faham pola penggunaan kad yang kompleks
    • Bezakan pelancong yang aktif membeli-belah dari pelbagai negara vs aktiviti penggodam
    • Menyesuaikan ambang (threshold) amaran berdasarkan kerugian sebenar dan aduan pelanggan.

Bank dan fintek Malaysia yang serius tentang AI risiko patut mula lihat RL bukan sekadar topik akademik, tapi sebagai asas generasi seterusnya sistem pemarkahan kredit dan pemantauan AML.


Ketelusan & Kawalan: Isu Besar Dalam Perkhidmatan Kewangan

Kebanyakan organisasi kewangan bimbang dengan dua perkara bila menyentuh AI generatif:

  1. ā€œSaya tak tahu model ini belajar daripada data apa.ā€
  2. ā€œSaya tak boleh jelaskan kenapa model pilih jawapan itu kepada pengawal selia.ā€

Ai2 cuba jawab isu ini melalui pendekatan model terbuka (open) dan alat seperti OlmoTrace yang boleh menjejak bagaimana output model berkait dengan data latihan.

Apa maksud ketelusan praktikal untuk bank dan insurans?

Untuk bank, insurans dan fintek, ketelusan Olmo 3.1 membawa beberapa kelebihan nyata:

  • Jejak audit (audit trail)
    Pasukan risiko model boleh menilai semula data latihan, menambah atau membuang subset data, dan melatih semula untuk patuh garis panduan BNM atau syarat dalaman.

  • Pengawalan domain
    Anda boleh:

    • Fine-tune Olmo 3.1 dengan data dalaman yang dipseudonimkan (contoh: log tuntutan insurans, data permohonan pinjaman)
    • Hadkan model supaya tidak menjawab di luar domain (contoh: elakkan nasihat pelaburan yang melanggar polisi bank)
  • Kebolehurus (controllability)
    Dengan peningkatan skor pada IFEval dan IFBench, model menjadi lebih baik dalam:
    • Mengikut arahan pematuhan seperti: ā€œjawab dalam Bahasa Melayu formalā€, ā€œjangan sebut produk pesaingā€, atau ā€œrujuk hanya garis panduan dalaman Xā€.
    • Berurusan dengan guardrails bagi mengelak pelanggaran kerahsiaan.

Dalam konteks pengawalseliaan Malaysia yang semakin ketat terhadap AI dan data, model terbuka dengan laluan kawalan seperti ini jauh lebih selesa untuk pasukan pematuhan berbanding model tertutup sepenuhnya.


Dari Model Umum Ke Kes Penggunaan Nyata Di Bank & Marketplace

Model umum seperti Olmo 3.1 hanya jadi berbaloi bila diterjemah kepada kes penggunaan yang jelas. Berikut beberapa corak yang saya nampak sangat realistik untuk pasukan di Malaysia mula uji pada 2026:

Article image 2

1. Co‑pilot untuk pegawai kredit & underwriter insurans

Guna Olmo 3.1 Think 32B sebagai ā€œotak penaakulanā€ di belakang sistem dalaman:

  • Ringkaskan laporan kewangan syarikat peminjam dengan menekankan metrik risiko utama
  • Menjana senarai soalan susulan yang wajar ditanya kepada pelanggan korporat
  • Menguji pelbagai senario (ā€œkalau kadar OPR naik 50 bps, apa kesan pada DSCR?ā€)

Penting: biar manusia buat keputusan akhir. Model berfungsi sebagai pembantu analitik pantas, bukan pengganti kredit komiti.

2. Chatbot pelanggan yang benar-benar faham produk kompleks

Dengan Olmo 3.1 Instruct 32B yang dioptimumkan untuk multi-turn dialogue dan tool use, bank dan insurans boleh:

  • Bangunkan chatbot yang boleh:

    • Terangkan struktur takaful keluarga dengan jelas
    • Bandingkan dua produk pembiayaan berdasarkan profil pelanggan
    • Tarik data sebenar akaun pelanggan melalui integrasi API dalaman dan melaksana tindakan (contoh: buat penjadualan semula bayaran)
  • Kekalkan nada bahasa Melayu/Inggeris yang konsisten dengan brand voice bank

  • Pastikan jawapan mematuhi skrip pematuhan yang diluluskan.

3. Pengurusan stok dan harga di marketplace & rantaian runcit besar

Untuk pemain e‑dagang dan rangkaian pasar raya besar:

  • Gabungkan Olmo 3.1 Think dengan model peramalan permintaan sedia ada.
  • Biarkan model cadangkan polisi:
    • Berapa banyak stok untuk kempen Ramadhan dan Aidilfitri
    • Produk mana yang wajar diberi diskaun awal, mana yang perlu dilindungi margin

Pasukan komersial boleh tanya soalan bahasa biasa seperti:

ā€œApa risiko jika saya kurangkan stok beras premium 20% di Lembah Klang sepanjang minggu gaji?ā€

Model boleh menghurai kesan berdasarkan data sejarah, logistik, dan tingkah laku pelanggan — sesuatu yang memerlukan penaakulan bertingkat yang Olmo 3.1 memang ditala untuknya.

4. Automasi analitik pematuhan dan dokumen

Perbankan dan insurans penuh dengan dokumen panjang: garis panduan BNM, polisi dalaman, kontrak, terma produk.

Olmo 3.1 boleh membantu:

  • Menyusun checklist pematuhan bagi produk baharu
  • Mengimbas dokumen produk sedia ada dan menandakan potensi konflik dengan pekeliling baharu
  • Menjana ringkasan polisi dalam bahasa mudah untuk pelanggan runcit.

Dengan ketelusan model dan keupayaan fine-tune, pasukan undang-undang dan pematuhan boleh kawal bagaimana model membuat rujukan dan apa yang tidak dibenarkan disebut.


Cara Praktikal Mula Menguji Olmo 3.1 Dalam Organisasi Anda

Untuk bank, insurans, fintek dan pemain e‑dagang besar, langkah permulaan yang munasabah bukan terus ganti sistem sedia ada, tetapi projek rintis (pilot) yang terkawal.

Langkah 1: Pilih satu kes penggunaan bernilai tinggi tetapi risiko rendah

Contoh yang sesuai:

  • Pembantu dalaman untuk staf pusat panggilan (bukan terus chatbot untuk pelanggan)
  • Analisis asas dokumen dalaman (bukan dokumen pelanggan)
  • Analisis permintaan dan stok bagi 2–3 kategori produk sahaja.

Langkah 2: Bentuk pasukan kecil silang fungsi

Libatkan:

  • Sains data / AI
  • Risiko model & pematuhan
  • Perniagaan (produk / komersial)
  • IT & keselamatan

Pastikan semua sepakat tentang objektif, metrik kejayaan, dan sempadan risiko.

Langkah 3: Kawal data & jejak audit

Dengan model terbuka seperti Olmo 3.1:

  • Jalankan di persekitaran yang dikawal (on-prem atau VPC) jika data sensitif
  • Log semua prom dan respons yang digunakan untuk membuat keputusan
  • Bentuk garis panduan dalaman tentang apa yang boleh dan tak boleh diberikan kepada model.

Langkah 4: Ukur, banding dan ulang

Bandingkan prestasi:

  • Masa yang dijimatkan pegawai
  • Ketepatan cadangan berbanding garis dasar
  • Jumlah kesalahan yang memerlukan pembetulan manusia

Jika hasil memuaskan, barulah fikir untuk perluas ke lebih banyak produk, cawangan atau negara.


Ke Mana Arah Seterusnya Untuk AI Terbuka Dalam Kewangan?

Olmo 3.1 menunjukkan satu perkara penting: model terbuka tidak lagi sekadar alternatif murah, tetapi sudah mula rapatkan jurang prestasi dengan model proprietari besar, sambil menawarkan tahap kawalan dan ketelusan yang bank dan insurans perlukan.

Untuk organisasi kewangan dan e‑dagang di Malaysia, ini bermaksud:

  • Anda boleh bina keupayaan AI dalaman tanpa bergantung sepenuhnya pada ā€œkotak hitamā€ luar.
  • Pasukan risiko model ada ruang untuk menyemak dan menyesuaikan data latihan.
  • Gabungan RL, penaakulan kuat dan ketelusan memberi asas kukuh untuk sistem harga, stok, dan risiko generasi baharu.

Jika organisasi anda sedang menyusun pelan AI 2026–2028, pertimbangkan soalan ini:

Adakah anda mahu hanya menjadi pengguna produk AI tertutup, atau mahu bina keupayaan strategik sendiri di atas model terbuka yang anda benar-benar faham?

Olmo 3.1 bukan satu-satunya pilihan di pasaran, tetapi ia tanda jelas bahawa arah industri bergerak ke kombinasi prestasi tinggi + ketelusan penuh. Untuk bank, insurans, fintek dan pemain e‑dagang yang serius tentang masa depan, ini masa yang sesuai untuk mula bereksperimen secara terkawal — sebelum pesaing anda yang buat dulu.