AI matematik terbuka seperti Nomos 1 menunjukkan bagaimana model cekap boleh kuasai penaakulan kompleks – dari harga dinamik hingga risiko kredit dan penipuan.

AI Matematik & Strategi Harga untuk Bank, Insurans dan E-Dagang
Pada pertandingan matematik Putnam tahun 2024, skor sempurna ialah 120. Median peserta manusia? Hanya 2 markah. Model AI terbuka baharu, Nomos 1, mencatat 87 markah – cukup tinggi untuk tempat kedua daripada 3,988 peserta. Dan model ini bukan pun gergasi trilion parameter; ia hanya 30B parameter dengan kira-kira 3B aktif pada satu masa.
Untuk dunia perbankan, insurans, fintek dan e-dagang, angka-angka ini bukan sekadar cerita “wow, AI pandai matematik”. Ia petunjuk jelas: kalau AI boleh kalahkan ribuan ahli matematik terbaik dengan sumber perkakasan yang sederhana, AI yang sama jenis ini boleh mengurus risiko, harga, dan tingkah laku pelanggan dengan jauh lebih bijak.
Dalam siri AI dalam Perkhidmatan Kewangan (Bank, Insurans, Fintek) ini, artikel ini meneliti apa yang dibuat oleh Nomos 1, mengapa ia penting, dan bagaimana pendekatan yang sama boleh digunakan untuk:
- pengurusan harga dinamik di platform e-dagang
- pemodelan risiko kredit dan insurans
- ramalan inventori dan permintaan
- pengesanan penipuan yang lebih tepat dan cepat
Apa Sebenarnya Pencapaian Nomos 1 – dan Kenapa Sektor Kewangan Patut Ambil Peduli
Nomos 1 ialah model AI matematik terbuka yang hampir menyaingi elit manusia pada pertandingan Putnam. Dengan skor 87/120, ia hanya ketinggalan sedikit di belakang juara manusia (90/120), dan jauh di depan kebanyakan peserta.
Beberapa fakta penting:
- Model asas (Qwen3-30B) tanpa latihan khas hanya skor 24/120.
- Selepas latihan khusus dan sistem penaakulan dua fasa, skor melonjak ke 87/120.
- Saiz: 30B parameter, kira-kira 3B aktif pada satu masa (mixture-of-experts).
- Terbuka sumber, boleh dijalankan pada perkakasan pengguna berkuasa tinggi, bukan hanya pusat data gergasi.
Ini memberi tiga mesej penting untuk bank, insurans, fintek dan pemain e-dagang besar:
- Kualiti latihan & reka bentuk proses lebih penting berbanding saiz model semata-mata.
- Penaakulan kompleks boleh dihasilkan pada kos perkakasan yang masih praktikal untuk enterprise.
- Model terbuka sumber mula mendekati prestasi model tertutup besar seperti daripada Google atau OpenAI.
Dalam erti kata lain, anda tak perlu bajet setaraf Big Tech untuk mendapatkan AI yang cukup pintar menilai risiko portfolio, mengoptimum harga, atau mengesan pola penipuan yang halus.
Di Sebalik Tabir: Bagaimana Nomos 1 “Berfikir” dan Apa Kaitannya dengan Harga Dinamik
Rahsia Nomos 1 bukan hanya pada model, tetapi pada cara ia diorkestrasi – satu “reasoning harness” dua fasa. Struktur ini sangat selari dengan cara kita patut bina sistem AI untuk kewangan dan e-dagang.
Fasa 1: Fasa Penyelesaian (Solving Phase)
Dalam fasa ini, beberapa “pekerja selari” (parallel workers):
- memilih soalan yang paling sedikit mendapat skor sempurna
- menjana cadangan jawapan/penyelesaian
- memberi skor sendiri (self-assessment) pada skala 1–7
- terus mengulang sehingga cukup banyak penyelesaian “sempurna” atau masa tamat
Analogi untuk e-dagang dan perbankan:
Bayangkan sistem harga dinamik:
- Setiap “pekerja AI” mencuba strategi harga berbeza untuk satu segmen produk / pelanggan.
- Mereka menilai kesan jangka pendek dan jangka panjang (margin, volum, churn, sensitiviti harga).
- Sistem memberi keutamaan kepada produk/segmen yang paling sukar dioptimumkan (contohnya, kategori dengan permintaan sangat volatile).
Atau dalam pemodelan risiko kredit:
- Setiap pekerja AI mecuba struktur skor kredit berbeza untuk segmen pelanggan berisiko sederhana.
- Ia menilai semula ramalan
PD/LGD(probability of default / loss given default) dan kesan modal kawal selia. - Data paling “sukar dijelaskan” diberi keutamaan pemprosesan.
Kuncinya: AI tak hanya keluarkan satu jawapan, tetapi menjana banyak hipotesis dan menilai sendiri kualitinya. Ini jauh lebih dekat dengan cara pasukan risiko atau pasukan harga manusia bekerja.
Fasa 2: Fasa Pemuktamadan (Finalization Phase)
15 minit sebelum masa tamat, Nomos 1 masuk fasa pemuktamadan dua peringkat:
- Konsolidasi – mengelompokkan penyelesaian mengikut kesimpulan, dan cuba mengenal pasti kumpulan yang betul (bukan semestinya kumpulan majoriti).
- “Tournament” berpasangan – perbandingan satu-lawan-satu di antara penyelesaian untuk memilih yang paling kukuh bagi setiap soalan.
Bagaimana ini boleh diterjemah ke dunia sebenar?
- Dalam pengurusan harga dinamik, AI boleh menghasilkan pelbagai senario harga, kemudian mengadakan “tournament” dalaman untuk memilih strategi yang paling stabil dari segi margin, risiko stok mati, dan sensitiviti pelanggan.
- Dalam pengurusan risiko pasaran, model boleh menghasilkan pelbagai simulasi tekanan (stress scenarios), kemudian memilih set senario yang paling “mencabar tapi realistik” untuk laporan risiko lembaga.
Cara Nomos 1 berfungsi mengajar satu pelajaran jelas: jangan hanya guna model untuk satu jawapan titik (point estimate). Paksa model berfikir, mencuba dan menilai pelbagai pilihan sebelum memuktamadkan keputusan.
Dari Putnam ke Pasaran: Aplikasi Terus dalam Kewangan & E-Dagang
Keupayaan AI menyelesaikan soalan matematik peringkat tinggi secara konsisten sangat berdekatan dengan apa yang kita perlukan untuk pemodelan kewangan dan tingkah laku pelanggan. Beberapa aplikasi praktikal:
1. Harga Dinamik & Promosi Pintar
AI ala Nomos 1 boleh membantu:
- menala harga mengikut masa (jam, hari minggu, musim) dan segmen pelanggan
- mensimulasikan kesan diskaun terhadap margin dan kadar penukaran (conversion rate)
- menyelaraskan harga antara saluran: aplikasi mudah alih, web, marketplace pihak ketiga
Contoh senario untuk platform e-dagang besar di Malaysia:
- Menggunakan model berpenaakulan tinggi untuk menguji ratusan kombinasi harga + kos penghantaran + baucar untuk kategori elektronik.
- Setiap kombinasi diuji terhadap:
- elastisiti harga sejarah
- tingkah laku pesaing
- had psikologi harga pengguna tempatan (cth, RM99 vs RM101).
- Sistem kemudian memuktamadkan struktur harga yang memaksimumkan keuntungan mingguan, bukan sekadar jualan harian.
2. Pemodelan Risiko Kredit & Skor Pelanggan
Bagi bank dan fintek:
- Model bersifat matematik kuat boleh membina fungsi risiko bukan linear yang sukar dijangka oleh model tradisional.
- Ia boleh menilai puluhan ribu kombinasi ciri (features) – pendapatan, tingkah laku transaksi, corak bayaran bil utiliti, data e-dagang – dan menulis “hujah” dalam bahasa semula jadi mengapa satu profil diklasifikasikan sebagai risiko tertentu.
Hasilnya:
- Penjelasan risiko yang lebih telus kepada peminjam dan regulator.
- Penentukuran modal yang lebih tepat, mengurangkan kos modal untuk pinjaman berkualiti baik.
3. Pengurusan Inventori & Ramalan Permintaan
Keupayaan menyelesaikan “puzzle” matematik kompleks juga berguna untuk:
- merancang stok berbilang gudang (multi-warehouse)
- menyelaras antara channel online dan cawangan fizikal
- mengoptimumkan “reorder point” mengikut musim, kempen dan trend sosial
Model dengan struktur reasoning seperti Nomos 1 boleh:
- menjana beberapa dasar pesanan semula (order policies)
- menjalankan simulasi permintaan hadapan dengan ratusan senario
- memilih dasar yang mengimbangi kos pegangan inventori dan risiko kehabisan stok (OOS).
4. Pematuhan & Pengesanan Penipuan
Dalam konteks AML, KYC dan pengesanan penipuan kad/kewangan:
- AI boleh merangka “teorem” tentang tingkah laku transaksi normal dan anomali.
- Ia boleh menulis penjelasan berbentuk hujah (proof-style) untuk setiap bendera merah, memudahkan kerja pegawai pematuhan.
Daripada sekadar menandakan transaksi sebagai “mencurigakan”, model boleh menghasilkan naratif seperti:
“Pelanggan ini biasanya berbelanja bawah RM500 sehari di sekitar Lembah Klang. Ada siri transaksi RM10,000–RM15,000 dalam masa 90 minit dari tiga negara berbeza. Corak ini sepadan dengan kluster penipuan X, Y, Z dengan kebarangkalian tinggi.”
Ini jenis reasoning yang sama diperlukan untuk lulus pertandingan matematik keras – cuma konteksnya berubah daripada nombor abstrak kepada pola transaksi sebenar.
Saiz Kecil, Otak Besar: Kenapa Model Cekap Penting untuk Operasi Skala Besar
Trend besar yang disahkan oleh Nomos 1 dan Hermes 4.3 ialah: model lebih kecil dengan latihan pintar semakin mengejar model raksasa trilion parameter.
Beberapa poin yang kritikal untuk CIO dan Ketua Data di bank, insurans dan e-dagang:
- Model frontier seperti o1-pro dianggarkan >1.8 trilion parameter; Gemini 2.5 Pro >400B.
- Nomos 1: 30B, dengan hanya 3B aktif – jauh lebih murah dari segi kos GPU dan tenaga.
- Hermes 4.3 pula menunjukkan latihan teragih atas rangkaian desentralisasi boleh menandingi latihan terpusat tradisional.
Apa maksudnya untuk strategi AI anda?
-
Total Cost of Ownership (TCO) lebih terkawal
Anda boleh membina dan menjalankan model reasoning kuat sendiri, on-premise atau di awan tempatan, tanpa kebergantungan penuh pada API luar negara. -
Privasi data pelanggan lebih terjaga
Untuk data kewangan sensitif, mempunyai model yang boleh berjalan di dalam sempadan negara atau pusat data sendiri adalah kelebihan besar dari sudut pematuhan dan kepercayaan pelanggan. -
Eksperimen lebih pantas
Model yang lebih kecil tetapi cekap memudahkan pasukan data menjalankan eksperimen – daripada algoritma harga dinamik, ke model risiko mikrosegmen, hingga enjin cadangan produk.
Pendek kata: anda boleh dapat “otak” yang cukup hebat tanpa perlu “badan” yang sebesar Big Tech.
Apa Langkah Praktikal untuk Bank, Insurans, Fintek dan E-Dagang Malaysia?
Untuk organisasi yang serius tentang AI dalam perkhidmatan kewangan dan runcit digital, kisah Nomos 1 memberi beberapa langkah strategik yang jelas.
1. Ubah Fokus daripada “Model Mana Paling Besar?” kepada “Proses Penaakulan Mana Paling Baik?”
- Reka reasoning harness sendiri untuk kes penggunaan kritikal: penetapan harga, skor kredit, pemodelan risiko pasaran, fraud.
- Pastikan model:
- menjana beberapa hipotesis, bukan satu jawapan tunggal
- menilai sendiri kualiti jawapan
- menjalankan “tournament” dalaman untuk pemilihan keputusan akhir.
2. Labur pada Latihan Khusus, Bukan Sekadar Plug-and-Play
Ingat jurang: 24/120 (model asas) vs 87/120 (Nomos 1 dilatih khusus).
Dalam konteks anda:
- Latih model pada data kewangan dan tingkah laku pelanggan anda sendiri
- Bentuk dataset yang menekankan penaakulan, bukan hanya ramalan mudah.
Contoh:
- Bukan sekadar “siapa akan beli produk X?”, tetapi:
- “bagaimana corak pembelian akan berubah jika harga naik 5% dan pesaing melancar promosi?”
- “kombinasi diskaun dan penghantaran apa yang mengekalkan margin tetapi meningkatkan CLV (customer lifetime value)?”
3. Bentuk Pasukan Silang Fungsi: Data + Risiko + Bisnes
Model seperti Nomos 1 dibina dengan kolaborasi rapat antara jurutera, ahli matematik dan pakar domain. Di organisasi kewangan dan e-dagang, anda perlukan:
- saintis data dan jurutera ML
- pakar risiko kredit/pasaran/operasi
- pakar harga dan pemasaran
- pakar pematuhan dan undang-undang
Tumpuan mereka: membina pipeline penaakulan end-to-end yang bukan saja tepat, tapi juga boleh dijelaskan dan diterima regulator.
4. Rancang untuk Dunia AI Hibrid: Tertutup + Terbuka
- Guna model tertutup besar untuk kes penggunaan tertentu (contohnya, chatbot pelanggan umum).
- Guna model terbuka berkeupayaan matematik tinggi untuk modul yang perlu lebih terkawal dan disesuaikan: risiko, harga, inventori.
Kedua-duanya saling melengkapi. Strategi menang bukan “pilih satu”, tetapi “gabungkan mengikut kekuatan masing-masing”.
Menyahut Gelombang Baharu AI dalam Kewangan & E-Dagang
Pencapaian Nomos 1 pada Putnam hanyalah satu tanda pada graf yang lebih besar: AI sedang bergerak daripada sekadar alat ramalan kepada “rakan sekumpulan” yang mampu berfikir secara struktur dan menulis hujah matematik yang kukuh.
Bagi bank, insurans, fintek dan gergasi e-dagang di Malaysia, ini membawa beberapa implikasi jelas:
- harga dinamik dan promosi tak lagi perlu bergantung pada peraturan statik dan tekaan kasar
- skor kredit dan pemodelan risiko boleh jadi lebih adil, lebih tepat dan lebih telus
- pengurusan inventori dan perancangan permintaan boleh menyaingi keupayaan gergasi global tanpa menyalin buta-buta
Realitinya: jurang antara model terbuka cekap dan model tertutup gergasi sudah cukup mengecil untuk mula memberi kesan pada strategi anda tahun 2026.
Soalannya sekarang bukan lagi “AI cukup matang atau tidak?”, tetapi:
Adakah organisasi anda sudah sedia menstrukturkan semula cara ia membuat keputusan – harga, risiko, dan pengalaman pelanggan – di sekeliling AI yang benar-benar mampu berfikir?
Kalau jawapannya belum, ini masa yang baik untuk memulakan pelan AI matematik pertama anda, sebelum pesaing yang lebih berani menjadikan penaakulan mesin sebagai kelebihan utama dalam pasaran.