AI mengubah penilaian: bukan lagi hasil akhir, tetapi dialog dan bukti proses. Ketahui cara menilai soft skills dan kompetensi dengan pendekatan EdTech.

Penilaian Era AI: Dialog, Soft Skills & Bukti Belajar
43% pelajar dilaporkan sudah menggunakan AI untuk menyiapkan tugasan. Nombor itu bukan sekadar “trend”—ia isyarat bahawa banyak kaedah penilaian tradisional (esei, kuiz, projek) makin mudah ditiru, digilap, dan disiapkan tanpa benar-benar menunjukkan apa yang pelajar faham.
Dalam siri “AI dalam Pendidikan dan EdTech”, saya melihat ini sebagai titik perubahan paling besar untuk universiti, kolej, dan penyedia latihan korporat: krisis penilaian sebenarnya peluang untuk membina semula cara kita mengajar, memantau kemajuan, dan membuktikan kompetensi. Kuncinya bukan melarang AI semata-mata, tetapi menukar “artifak” penilaian—daripada hasil akhir kepada proses berfikir yang boleh diaudit.
Penyelesaiannya ada satu perkataan yang nampak klasik, tapi kini boleh diskalakan: dialog.
Krisis penilaian bukan soal menipu—ia soal bukti
Jawapan paling tepat: AI menjadikan hasil kerja (jawapan, karangan, kod) kurang boleh dipercayai sebagai bukti pembelajaran, jadi institusi perlu menilai pemikiran, pertimbangan, dan proses.
Ramai pensyarah cenderung memilih jalan “ketat”: kembali kepada peperiksaan bertulis di atas kertas, larang penggunaan AI, atau tambah lapisan pemantauan. Saya faham keresahan itu. Tapi ada dua masalah besar:
- Dunia kerja takkan melarang AI. Graduan akan masuk ke organisasi yang menganggap AI sebagai rakan sekerja (dan kadang-kadang pesaing).
- Penilaian lama memang rapuh sejak dulu. Banyak sistem penilaian sebenarnya mengukur kebolehan “mencari format jawapan yang betul”, bukan kebolehan berfikir secara mendalam.
AI cuma mendedahkan realiti yang kita dah lama tangguh: bila ganjaran utama ialah gred, pelajar akan optimakan untuk gred—bukan untuk pembelajaran.
“Bila AI boleh hasilkan karangan dalam minit, yang tinggal untuk dinilai ialah bagaimana pelajar sampai ke kesimpulan.”
Di sinilah EdTech dan analitik pembelajaran jadi relevan: kita perlukan mekanisme penilaian yang mengumpul bukti sepanjang proses, bukan hanya di hujung.
Dialog pada skala besar: viva voce versi 2025
Jawapan ringkasnya: AI membolehkan dialog seperti peperiksaan lisan (viva voce) berlaku untuk ramai pelajar, bukan hanya segelintir.
Sebelum sistem kuliah besar dan peperiksaan piawai, universiti elit menggunakan peperiksaan lisan: pelajar mempertahankan idea, menjawab bantahan, menerangkan rasional. Itu berkesan kerana ia “menampakkan pemikiran”. Tapi ia susah diskalakan.
Model bahasa besar (LLM) membuka ruang baharu: dialog boleh direka bentuk sebagai aktiviti pembelajaran dan pada masa yang sama menjadi artifak penilaian—dalam bentuk transkrip perbualan, justifikasi langkah demi langkah, dan refleksi pelajar.
Bagaimana “transkrip dialog” jadi bukti yang lebih kuat
Bila pelajar berbual dengan tutor AI yang direka khas (bukan sekadar chatbot umum), sistem boleh merekod:
- soalan susulan yang menguji kefahaman
- cara pelajar membetulkan salah faham
- bagaimana pelajar memilih bukti
- kemampuan menilai alternatif
- keupayaan menerangkan kepada “orang lain” (agent yang pura-pura tak faham)
Pensyarah tak perlu membaca 150 esei dari awal sampai akhir untuk kesan ketulenan. Mereka boleh menilai petikan transkrip yang paling diagnostik: titik buntu, pusingan pemikiran, dan cara pelajar mempertahankan keputusan.
“Bukan ganti pensyarah”—tapi ubah fokus pensyarah
Saya tegas tentang ini: AI tak patut mengambil alih peranan manusia sebagai pembimbing nilai, etika, dan konteks. Namun AI boleh mengambil alih kerja berulang yang memenatkan:
- ulang penerangan konsep asas
- latihan tubi adaptif
- semakan awal hujah
- simulasi perbualan yang memerlukan banyak masa
Hasilnya, masa pensyarah boleh dialihkan kepada penilaian aras tinggi: mentoring, maklum balas formatif yang bermakna, dan reka bentuk pengalaman pembelajaran.
Tutor AI 24/7 dan “masalah 2 sigma” yang akhirnya praktikal
Jawapan paling terus: tutoran individu memang terbukti meningkatkan prestasi, tetapi mahal—AI menjadikannya mampu milik dan tersedia 24/7.
Kajian klasik Bloom (1984) menunjukkan pelajar dengan tutor seorang-ke-seorang mengatasi rakan sekelas sehingga dua sisihan piawai—seolah-olah pelajar “biasa” melonjak ke kelompok teratas. Itu sebabnya bidang pendidikan lama terperangkap dengan “2 sigma problem”: kita tahu tutoran berkesan, tetapi sukar diberi kepada semua.
Kini, LLM membolehkan tutoran yang lebih semula jadi melalui agen AI dengan peranan khusus—contohnya:
- Agen penilai: menguji kefahaman, meminta rasional, memberi soalan susulan
- Agen rakan latihan: role-play situasi sebenar (temu duga, pembentangan, rundingan)
- Agen pengajar: memandu langkah demi langkah ikut tahap pelajar
- Agen pengkritik: mencabar hujah dan mengesan lompong logik
Bayangkan pelajar perniagaan menganalisis kajian kes:
- satu agen bertindak sebagai pelabur skeptikal,
- satu lagi sebagai pengawal selia yang berhati-hati,
- satu lagi sebagai penganalisis data yang “keras”.
Pelajar bukan saja belajar kandungan—mereka belajar menimbang pelbagai perspektif. Ini kemahiran kerja sebenar.
Jurang soft skills: AI boleh jadi “rakan dialog” yang konsisten
Jawapan paling penting: soft skills berkembang melalui latihan dialog yang berulang, dan AI boleh menyediakan latihan itu secara konsisten serta boleh diaudit.
Majikan sejak beberapa tahun kebelakangan ini semakin lantang tentang kemahiran seperti komunikasi, kolaborasi, daya tahan, dan adaptasi. Laporan Future of Jobs 2025 menyenaraikan pemikiran analitik, ketahanan, kolaborasi, dan komunikasi sebagai kemahiran paling diperlukan. Malah ada dapatan bahawa kemahiran kognitif aras tinggi serta kemahiran sosial-emosi membentuk bahagian besar pertumbuhan pekerjaan hingga 2030.
Masalah di kampus? Banyak soft skills masih dirawat sebagai “harap-harap jadi”:
- sertai persatuan,
- buat kerja kumpulan,
- jadi fasilitator,
- pergi program mobiliti.
Itu bagus—tetapi jarang ada jejak bukti yang jelas: kemahiran apa meningkat, melalui aktiviti apa, dan sejauh mana.
Soft skills patut dinilai bersama kandungan, bukan aktiviti sampingan
AI membolehkan simulasi dialog yang realistik:
- pelajar kejururawatan berlatih temu bual pesakit yang sukar
- pelajar statistik menerangkan model kepada “klien” yang keliru
- pelajar pendidikan melatih cara memberi maklum balas kepada murid
- pelajar IT mempertahankan keputusan seni bina sistem di hadapan “CTO” maya
Setiap sesi boleh menghasilkan:
- transkrip,
- rubrik penilaian komunikasi,
- refleksi pelajar,
- metrik perkembangan (contoh: kejelasan hujah, empati, struktur penerangan).
Ini selari dengan arah EdTech moden: analisis prestasi pelajar bukan semata-mata markah, tetapi trajektori kemahiran.
Aktiviti pembelajaran lama masih relevan—tetapi bentuknya berubah
Jawapan ringkas: AI tak memadam membaca, menulis, memodel, dan mengkod; AI mengubahnya menjadi aktiviti yang lebih interaktif.
Membaca → inkuiri interaktif
Daripada membaca dan berharap “faham”, pelajar membaca sambil:
- ditanya soalan kefahaman,
- diminta membandingkan hujah,
- dicabar terhadap andaian tersirat.
Dalam amalan, kemahiran paling bernilai ialah kebolehan bertanya soalan yang tepat—literasi soalan.
Menulis → penaakulan interaktif
AI yang dikonfigurasi sebagai pengkritik boleh menyergah dengan sopan:
- “Bukti ini tak menyokong tuntutan kamu.”
- “Apa hujah balas paling kuat, dan bagaimana kamu jawab?”
- “Dalam keadaan apa hujah kamu gagal?”
Menulis jadi proses membina hujah, bukan kerja “menghias ayat”.
Pemodelan → inferens interaktif
AI boleh memaksa pelajar menyatakan andaian:
- “Jika pemboleh ubah ini berubah, apa implikasi fungsinya?”
- “Adakah ini sebab-akibat atau sekadar korelasi?”
Ini yang membezakan pelajar yang hafal teknik dengan pelajar yang benar-benar boleh membuat keputusan.
Pengkodan → reka bentuk algoritma interaktif
Dengan pembantu kod, peranan manusia naik taraf:
- menjelaskan masalah,
- memilih kekangan,
- menguji pilihan seni bina,
- menilai trade-off prestasi dan keselamatan.
Kod bukan lagi “siapa paling laju taip”, tetapi “siapa paling jelas berfikir”.
Infrastruktur yang hilang: LMS dialogik, bukan “kabinet fail”
Jawapan terus: LMS tradisional direka untuk mengumpul fail, bukan membina dialog; pendidikan era AI perlukan sistem pembelajaran dialogik.
Realitinya, banyak LMS hari ini kuat pada logistik—muat naik nota, kutip tugasan, bagi markah. Tetapi lemah pada pembelajaran aktif yang berterusan.
Ciri yang patut ada pada dialogic learning system:
- Keagenan & adaptif: laluan belajar berbeza ikut pelajar, bukan satu trek untuk semua.
- Interaksi berterusan: bukti pembelajaran terkumpul dari minggu ke minggu.
- Maklum balas proaktif: sistem mengesan kekeliruan dan mencadangkan latihan.
- Ketelusan & kepercayaan: pelajar dan pensyarah nampak mengapa AI memberi maklum balas tertentu.
Bila ini wujud, penilaian boleh beralih kepada model kompetensi: pelajar lulus bila mereka menunjukkan kebolehan melalui bukti dialog + aplikasi, bukan semata-mata skor peperiksaan.
Risiko sebenar (dan cara menguruskannya tanpa panik)
Jawapan paling jujur: AI dalam pendidikan ada risiko besar—tetapi semuanya boleh dikurangkan melalui reka bentuk, polisi, dan latihan.
1) Kebergantungan berlebihan
Kajian 2025 (MIT) melaporkan pelajar yang menggunakan AI hanya untuk menjana esei menyimpan 40% kurang pengetahuan berbanding pelajar yang menggunakan AI sebagai rakan sparring. Prinsip praktikal saya:
- Benarkan AI, tetapi wajibkan jejak penaakulan (rasional, pilihan, bukti).
- Gunakan tugasan yang memerlukan pertahanan lisan atau dialog reflektif.
2) Bias & ketaksamaan
LLM boleh memantulkan bias budaya dan bahasa, atau memberi kelebihan kepada pelajar yang lebih mahir “prompt”. Mitigasi yang realistik:
- sediakan prompt template untuk semua
- latih literasi AI dalam kurikulum (bukan bengkel sekali lalu)
- audit contoh maklum balas AI dengan rubrik yang sama
3) Hakisan hubungan manusia
Jika semua interaksi jadi dengan mesin, pelajar boleh rasa terasing. Cara elak:
- jadikan AI sebagai persediaan untuk perbincangan manusia (kelas, tutorial)
- gunakan data dialog untuk mencetus sesi bimbingan yang lebih tepat
4) Kos, rintangan, dan politik kampus
Perubahan penilaian dan kurikulum memang memakan masa. Strategi yang saya lihat paling menjadi:
- mula dengan 1–2 kursus “pilot”
- bina rubrik dan polisi penggunaan AI yang jelas
- ukur impak (masa pensyarah, kualiti maklum balas, kadar lulus kompetensi)
- skala berperingkat
Pelan 30 hari untuk mula “penilaian dialogik” di organisasi anda
Jawapan praktikal: anda boleh bermula tanpa merombak semuanya—cukup dengan menukar satu komponen penilaian kepada format dialog.
Minggu 1: Pilih hasil pembelajaran yang sesuai
- Pilih 1 topik yang biasanya diuji melalui esei/kuiz.
- Tetapkan 3 kriteria: ketepatan, rasional, komunikasi.
Minggu 2: Reka tugasan dialog + rubrik
- Tugasan: 15–20 minit dialog dengan tutor AI + refleksi 200–300 patah perkataan.
- Rubrik: 4 tahap (lemah → cemerlang) untuk rasional & kejelasan.
Minggu 3: Jalankan “viva mini” manusia
- 5 minit semakan rawak untuk 20–30% pelajar.
- Fokus pada: “Terangkan semula keputusan kamu.”
Minggu 4: Analisis bukti dan kemas kini polisi
- Kenal pasti soalan AI yang paling diagnostik.
- Kemas kini arahan: apa yang dibenarkan, apa yang wajib dilapor.
Ini selari dengan matlamat EdTech: pembelajaran diperibadikan, analitik prestasi, dan bukti kompetensi yang lebih kukuh.
Penilaian era AI: pilih pembaharuan, bukan nostalgia
Penilaian yang bergantung pada artifak statik sedang kehilangan nilai, dan itu takkan berpatah balik. Jalan yang paling sihat untuk institusi ialah membina semula penilaian berasaskan dialog, bukti proses, dan kemahiran manusia—termasuk soft skills.
Bagi saya, ini masa terbaik untuk EdTech berkembang dengan cara yang betul: bukan menambah “alat AI” atas sistem lama, tetapi membina pengalaman pembelajaran yang memang direka untuk AI—telus, adaptif, dan fokus pada manusia.
Kalau organisasi anda mula menguji penilaian dialogik pada awal 2026, apakah satu kursus atau modul yang paling sesuai dijadikan projek perintis—dan bukti apa yang anda mahu lihat untuk yakin pelajar benar-benar belajar?