Mengurus Haba 3D‑IC Untuk Kilang Pintar Berkuasa AI

AI dalam Pembuatan (Elektronik, Automotif, Semikonduktor)••By 3L3C

3D‑IC berkuasa AI mengubah kilang pintar, tapi hanya jika haba dikawal. Fahami pemodelan terma, bahan dan strategi penyejukan yang betul untuk produksi 24/7.

3D-ICpengurusan habaAI dalam pembuatankilang pintarsemikonduktorthermal modelingmultiphysics
Share:

Mengurus Haba 3D‑IC Untuk Kilang Pintar Berkuasa AI

Purata satu pusat data AI berskala besar hari ini boleh menelan sehingga ratusan megawatt. Di sebalik nombor itu, ada satu isu senyap yang sedang menghantui pengeluar elektronik dan semikonduktor di Malaysia: haba dalam cip 3D yang memacu sistem AI kilang pintar.

Dalam rangkaian kilang elektronik, automotif, dan semikonduktor — dari Penang ke Kulim dan Melaka — pengawal robot, sistem visi AI, dan peralatan wafer inspection semuanya bergantung kepada 3D‑IC berprestasi tinggi. Jika pengurusan haba 3D‑IC longgar, bukan sahaja OEE jatuh, malah kadar reject naik, downtime meningkat dan ROI projek AI kilang pintar pun lari jauh dari sasaran.

Artikel ini menghuraikan apa yang sebenarnya berlaku di dalam timbunan 3D‑IC, kenapa ia kritikal untuk AI dalam pembuatan, dan bagaimana pendekatan pemodelan terma, pemilihan bahan dan strategi penyejukan yang betul boleh memberi kelebihan kompetitif kepada kilang pintar anda.


Kenapa Terma 3D‑IC Jadi Penentu Prestasi AI Di Kilang Pintar

Dalam 3D‑IC, logik, memori dan akselerator AI disusun secara menegak. Prestasi melonjak, tetapi ketumpatan kuasa juga naik mendadak. Di sinilah masalah bermula.

Bagi sistem AI kilang pintar — contohnya:

  • penglihatan mesin untuk pemeriksaan kualiti wafer,
  • pengoptimuman masa nyata untuk line balancing di kilang automotif,
  • analitik ramalan (predictive maintenance) pada motor, pam dan oven —

semua ini bergantung pada pemproses AI berkuasa tinggi. Apabila cip-cip ini dipacu hampir maksimum 24/7, haba tertumpu akan mencipta hotspot mikro dengan fluks haba yang kadang-kadang diukur sebanding dengan zon pelancaran roket (pada skala kecil dalam silikon).

Kesan terus kepada operasi kilang:

  • throttling prestasi AI (latency naik, throughput turun),
  • drift bacaan sensor dan kamera akibat pemanasan berlebihan,
  • kadar kerosakan komponen yang lebih tinggi, sekali gus menjejaskan KPI kualiti.

Realitinya, pengurusan haba bukan lagi isu “packaging di hujung projek”. Ia sudah jadi pemandu seni bina untuk 3D‑IC, dan secara tak langsung, pemandu kebolehpercayaan sistem AI kilang pintar.


Sumber Haba Dalam 3D‑IC: Apa Yang Sebenarnya Panas?

Untuk faham bagaimana nak kawal, kita perlu jelas dulu apa yang menjana dan memerangkap haba dalam timbunan 3D.

1. Ketumpatan kuasa menegak

Apabila logik, DRAM/HBM dan akselerator AI disusun bertingkat:

  • jumlah kuasa per unit kawasan meningkat,
  • die bahagian atas paling jauh dari heatsink, jadi rintangan terma lebih tinggi,
  • walaupun kuasa setiap die nampak sederhana, gabungan keseluruhan menjadikan hotspot sukar sejuk.

Dalam aplikasi AI kilang pintar, timbunan ini lazimnya:

  • die logik/AI di tengah atau bawah,
  • memori HBM bertingkat di atas,
  • interposer silikon atau organik di bawah sebagai laluan isyarat dan haba.

Jika perletakan (stacking) ini tak dioptimumkan secara terma, modul AI boleh panas hingga memaksa penurunan frekuensi — dan tiba-tiba sistem visi tidak lagi mampu periksa 100% produk pada kadar line sebenar.

2. TSV, micro‑bump dan struktur interconnect

Elemen seperti through-silicon via (TSV), micro‑bump dan tiang interconnect:

  • berfungsi sebagai laluan elektrik dan juga laluan haba,
  • kepadatan dan bahan (contoh: kuprum vs bahan lain) menentukan seberapa baik haba boleh mengalir ke bawah atau ke sisi,
  • susunan yang kurang seimbang boleh menyebabkan zon tertentu terlalu panas, zon lain terlalu sejuk — mewujudkan kecerunan suhu yang tinggi.

Kecerunan suhu ini dalam masa panjang boleh menyebabkan tekanan mekanikal, retak mikro, dan isu kebolehpercayaan yang hanya kelihatan bila modul sudah berada di line produksi.

3. Antara muka die-ke-die dan bonding layer

Lapisan bonding, underfill dan bahan penyambung lain sering menjadi bottleneck terma:

  • jika kekonduksian terma rendah atau ketebalan tak seragam, haba “terperangkap” di die atas,
  • variasi kecil dalam kualiti TIM (thermal interface material) pun boleh menyebabkan perbezaan suhu beberapa darjah, cukup untuk memacu akselerasi electromigration dan penuaan komponen.

Dalam konteks kilang yang mensasarkan masa operasi 5–7 tahun atau lebih, kesan ini tak boleh dipandang ringan.


Pemodelan Awal: Cara Bijak Elak Terperangkap Hotspot

Cara paling murah untuk menyelesaikan masalah haba ialah sebelum masalah itu wujud secara fizikal. Di sinilah pemodelan terma dan compact thermal model (CTM) bermain peranan.

Mengapa pemodelan perlu bermula di peringkat seni bina

Saya selalu nampak syarikat yang tunggu sehingga peringkat layout akhir baru mula risau pasal haba. Kebiasaannya, itu sudah terlambat dan mahal. Pendekatan yang lebih matang ialah:

  1. Semasa definisi seni bina:

    • gunakan anggaran bajet kuasa setiap die / blok,
    • bina model ringkas geometri timbunan (ketebalan die, bahan, interposer, TIM, package),
    • jalankan simulasi terma 3D peringkat awal.
  2. Guna hasil simulasi untuk:

    • semak sama ada ketumpatan kuasa yang dirancang munasabah secara terma,
    • ubah suai partition fungsi (contoh: pindahkan akselerator AI ke die lebih hampir dengan heatsink),
    • beri input kepada pasukan sistem kilang tentang had prestasi sebenar modul AI di persekitaran operasi 40–50°C di lantai produksi Malaysia.

Menariknya, anda tak perlu data aktiviti penuh RTL pada tahap ini. Profil beban kerja kasar sudah cukup untuk menghasilkan power map awal yang mendedahkan kawasan berisiko hotspot.

Peranan multiphysics untuk kilang pintar

Dalam dunia kilang pintar, pemodelan terma jarang berdiri sendiri. Ia berkait rapat dengan:

  • integriti kuasa (PDN, IR drop, joule heating),
  • integriti isyarat (signal integrity pada kelajuan tinggi antara chiplet),
  • elektromagnetik (EM coupling pada modul komunikasi industri).

Pendekatan multiphysics system analysis membenarkan jurutera:

  • melihat interaksi sebenar elektro‑terma pada 3D‑IC,
  • menyelaras pelarasan PDN, penempatan blok, dan penyejukan mekanikal,
  • memadankan hasil simulasi dengan model AI untuk predictive maintenance modul di lapangan.

Bagi pengeluar di Malaysia yang sedang membina kilang pintar berskala besar, keupayaan ini berhubung terus dengan matlamat mengurangkan downtime tak dirancang.


Laluan Haba: Dari Die Ke Interposer, Dari Modul Ke Kabinet

Haba dalam 3D‑IC tidak keluar melalui satu jalan sahaja. Ia menyebar secara menegak dan lateral melalui die, interposer, substrate dan akhirnya ke heatsink, penyejukan cecair atau udara.

Peranan interposer dan substrate

Ada beberapa pilihan biasa:

  • Interposer silikon
    Kekonduksian terma tinggi, bagus untuk menyebar haba tetapi juga boleh memusatkan beban haba di kawasan chiplet berkumpul. Sesuai untuk modul AI dengan HBM berkuasa tinggi, asalkan pemodelan terma paket dibuat dengan teliti.

  • Interposer organik
    Lebih murah dan fleksibel, tetapi rintangan terma lebih tinggi. Sesuai untuk modul kuasa sederhana, atau bila bajet kos ketat. Namun untuk sistem AI kilang yang beroperasi 24/7, ia mungkin memerlukan strategi penyejukan tambahan.

  • Substrate & heat spreader
    Bahan penutup (lid), heat spreader dan lapisan substrate lain membentuk sebahagian besar laluan haba ke luar modul. Jika anda mengabaikan kesan paket dalam simulasi awal, suhu yang diramal selalunya terlalu optimistik berbanding realiti di rak kawalan.

Dari modul ke rak kilang

Dalam aplikasi kilang pintar:

  • modul AI boleh dipasang dalam kabinet industri IP‑rated,
  • aliran udara mungkin terhad,
  • persekitaran ambien di Malaysia boleh mencecah 35°C dengan kelembapan tinggi.

Jadi, apa yang nampak stabil di bilik makmal 22°C mungkin gagal bila dipasang di lantai produksi. Sebab itu pengeluar yang serius akan menggabungkan data simulasi terma 3D‑IC dengan model termal sistem peringkat rak atau kabinet.


Bahan, TIM & Strategi Penyejukan Untuk Timbunan 3D

Struktur dan bahan sebenarnya adalah “perisian terma” bagi produk anda. Ia menentukan cara haba mengalir dan berapa tinggi suhu operasi stabil.

Memilih bahan yang betul

Beberapa tuil kejuruteraan yang penting:

  • Silikon kekonduksian tinggi dan proses thinning die yang optimum untuk mengurangkan rintangan terma menegak.
  • Bahan interconnect (contoh: kuprum) dan susunan TSV yang dibentuk bukan sahaja untuk isyarat, tetapi juga sebagai penyebar haba tambahan.
  • Underfill dan bonding layer dengan pekali kekonduksian terma yang konsisten, dan proses pempadanan yang mengurangkan void.

Untuk kilang yang mengutamakan kebolehpercayaan jangka panjang, pelaburan di peringkat bahan biasanya jauh lebih murah berbanding kos downtime line produksi selama beberapa jam akibat modul AI yang gagal.

Kualiti TIM bukan isu kosmetik

Thermal Interface Material (TIM) nampak seperti detail kecil, tetapi:

  • perbezaan ketebalan 10–20 µm atau liputan tidak penuh boleh menyebabkan perbezaan suhu sehingga beberapa °C,
  • variasi ini, digandakan dengan kitaran termal harian di kilang, mempercepatkan penuaan sambungan.

Dalam sistem AI berkuasa tinggi, saya cenderung melihat TIM sebagai komponen kritikal, bukan aksesori. Proses kawalan kualiti pemasangan TIM patut digabungkan dengan sistem AI vision kilang untuk memantau konsistensi.

Air, cecair, atau sesuatu di antaranya?

Untuk 3D‑IC yang memacu AI kilang pintar, tiga kelas penyejukan utama biasanya relevan:

  1. Penyejukan udara (heatsink + kipas)
    Sesuai untuk modul AI kuasa sederhana, atau nod edge di lantai kilang. Kos lebih rendah, penyelenggaraan mudah, tetapi had kemampuan pelesapan haba lebih rendah.

  2. Penyejukan cecair langsung
    Digunakan bila kepadatan kuasa sangat tinggi (contoh rak GPU/ASIC AI untuk analitik kilang pusat data). Memberi margin terma lebih selesa, tetapi memerlukan reka bentuk manifold, pam dan kawalan kebocoran yang teliti.

  3. Vapor chamber / heat pipe
    Sering menjadi kompromi praktikal: penyebaran haba lateral yang baik tanpa kompleksiti penuh sistem cecair.

Poin penting: pilihan penyejukan mesti seiring dengan roadmap kuasa modul, bukan hanya generasi pertama. Jika anda rancang menggandakan throughput AI dalam dua tahun, reka bentuk terma sekarang perlu sudah “ada ruang” untuk peningkatan itu.


Ko‑Reka Terma Dengan Penempatan & PDN: Dari EDA Ke OEE

Dalam 3D‑IC, susun atur lantai (floorplan), penempatan makro dan rekabentuk rangkaian penghantaran kuasa (PDN) tidak boleh dilihat berasingan daripada haba.

Penempatan blok berkuasa tinggi

Prinsip asas yang saya suka guna:

  • letakkan blok kuasa tinggi berhampiran laluan konduksi terma utama (contoh: TSV besar, kawasan bawah heatsink),
  • elakkan menumpuk beberapa blok panas di lapisan paling jauh dari laluan penyejukan,
  • gunakan logam peringkat atas sebagai "heat spreader" lateral tambahan.

Dalam konteks kilang, ini terus mempengaruhi:

  • kestabilan kadar frame kamera AI inspection,
  • masa respons pengawal robot,
  • kestabilan inferens model AI yang berjalan hampir masa nyata.

PDN sebagai sumber haba dan sebahagian penyelesaiannya

Struktur PDN — TSV kuasa, bump, RDL interposer — menghasilkan pemanasan resistif (joule heating). Tanpa analisis elektro‑terma bersama:

  • anda mungkin menyelesaikan isu IR drop, tetapi secara tak sengaja mewujudkan jalur panas di dalam timbunan,
  • atau sebaliknya, merendahkan ketumpatan PDN untuk mengurangkan haba tetapi mengorbankan integriti kuasa.

Pendekatan yang lebih matang ialah co‑optimization:

  • laksanakan kitaran reka bentuk berulang antara pasukan EDA, packaging dan thermal,
  • gunakan hasil simulasi untuk melatih model AI dalaman yang meramal risiko hotspot dan IR drop berdasarkan variasi susun atur.

Bagi pengeluar yang serius tentang AI dalam reka bentuk serta AI dalam pembuatan, inilah tempat kedua dunia itu bertemu.


Signoff Elektro‑Terma & Kesediaan Untuk Pembuatan Massa

Sebelum menekan butang untuk produksi besar-besaran, reka bentuk 3D‑IC perlu melalui signoff elektro‑terma yang realistik.

Beberapa soalan penting yang perlu dijawab:

  1. Adakah profil kuasa sebenar sepadan dengan apa yang disimulasi?
    Uji dengan beban kerja AI yang sama seperti yang akan digunakan dalam kilang — bukan hanya micro‑benchmark di makmal.

  2. Adakah suhu puncak berada dalam julat selamat di semua mod operasi?
    Termasuk mod burst, start‑up, dan senario ambient tinggi (contoh 40°C di lantai kilang pada waktu tengah hari).

  3. Bagaimana suhu mempengaruhi kebolehpercayaan jangka panjang?
    Pertimbangkan:

    • electromigration dalam interconnect,
    • fatigue pada micro‑bump dan TSV,
    • drift prestasi transistor dan memori sepanjang bertahun operasi.
  4. Adakah ketidakpadanan terma antara die menyebabkan tekanan mekanikal berlebihan?
    Kecil di atas kertas, tetapi cukup untuk menyebabkan kegagalan awal bila modul dikerah 24/7.

Signoff elektro‑terma yang kukuh bermaksud bila modul 3D‑IC sampai ke kilang — sama ada di Bayan Lepas, Kulim atau Pasir Gudang — ia benar‑benar bersedia untuk kitaran operasi industri, bukan sekadar demonstrasi di lab.


Dari Hotspot Ke Kilang Pintar: Langkah Praktikal Untuk Pemain Malaysia

3D‑IC memberi asas prestasi yang diperlukan oleh AI dalam pembuatan moden, tetapi hanya jika haba diurus sebagai pembolehubah reka bentuk utama. Untuk pemain E&E dan semikonduktor di Malaysia, beberapa langkah praktikal yang patut dipertimbangkan:

  • Jadikan pemodelan terma awal sebahagian wajib dalam flow seni bina 3D‑IC, bukan aktiviti opsyenal.
  • Bentuk pasukan silang (device, packaging, sistem, AI/ML) yang berkongsi model multiphysics yang sama.
  • Integrasikan keputusan reka bentuk terma dengan perancangan kilang pintar anda: daripada pilihan penyejukan rak, susun atur kabinet, sehingga algoritma AI untuk pemantauan suhu masa nyata.
  • Gunakan data terma operasi sebenar untuk melatih model AI predictive maintenance, supaya anda tahu modul mana yang bakal gagal sebelum ia menjejaskan OEE.

Jika haba diurus dengan cara yang disiplin, 3D‑IC bukan sekadar teknologi cip baharu — ia menjadi enabler senyap di belakang kilang pintar yang lebih pantas, lebih cekap tenaga dan lebih boleh dipercayai.

Soalannya sekarang: adakah strategi terma reka bentuk 3D‑IC dan infrastruktur kilang anda sudah sehaluan dengan ambisi AI yang anda sasarkan untuk 2026 dan seterusnya?