Pengurusan Terma 3D-IC Untuk Kilang AI Pintar

AI dalam Pembuatan (Elektronik, Automotif, Semikonduktor)••By 3L3C

3D-IC memacu cip AI moden, tetapi haba menjadi penghalang besar. Ketahui bagaimana pemodelan terma dan AI bersama‑sama mengoptimumkan 3D-IC dan kilang pintar.

3D-ICpengurusan termakilang pintar AIsemikonduktor Malaysiathermal modelingTIM dan bahan termapenyejukan cip AI
Share:

Mengapa Terma 3D-IC Tiba-Tiba Jadi Isu Besar Di Kilang AI

Dalam satu rak pelayan AI berkuasa tinggi, suhu hotspot dalam 3D-IC boleh mencecah ratusan darjah Celsius setempat – pecahan daripada zon termal roket dilancar, tetapi berlaku di atas kepingan silikon beberapa milimeter sahaja. Di kilang pintar yang bergantung pada AI 24/7, beberapa darjah berlebihan sudah cukup untuk menjatuhkan OEE, merosakkan kualiti, dan memendekkan hayat sistem.

Ini sangat relevan untuk Malaysia. Dengan pelaburan besar dalam semikonduktor, elektronik automotif dan pusat data, 3D-IC menjadi tulang belakang cip AI, HPC dan edge yang dipasang dan diuji di Bayan Lepas, Kulim, Senai dan seluruh negara. Bila reka bentuk termal diabaikan, kapasiti output wafer, yield dan kestabilan peralatan semuanya terjejas.

Artikel ini menghuraikan cara mengurus haba dalam 3D-IC – daripada pemodelan hotspot, pemilihan bahan, sehinggalah strategi penyejukan – tetapi dengan sudut pandang kilang pintar: bagaimana AI dan pemodelan terma bersama‑sama boleh menaikkan prestasi, kebolehpercayaan dan kecekapan rantaian bekalan.


1. Haba Dalam 3D-IC: Dari Reka Bentuk Hingga Lantai Pengeluaran

Terma bukan lagi isu “lewat reka bentuk”, ia pemandu seni bina. Untuk kilang AI pintar, ini bermaksud masalah suhu mesti diselesaikan sejak fasa reka bentuk cip lagi, kalau tidak, bahagian hiliran (assembly, test, final system) akan menanggung kosnya.

Sumber Haba Dalam Seni Bina Bertindan

Dalam 3D-IC, beberapa faktor utama menghasilkan dan memerangkap haba:

  • Kepadatan kuasa menegak tinggi – logik, memori dan akselerator AI ditindan di atas footprint yang sama. Kuasa per mm² naik mendadak.
  • Die atas jauh daripada heatsink – die yang lebih tinggi dalam stack melalui lebih banyak rintangan terma, jadi lebih sukar disejukkan.
  • Struktur interconnect – TSV, micro‑bump dan pillar bukan sahaja laluan elektrik, tetapi juga laluan konduksi haba; susun atur dan bahan sangat mempengaruhi corak suhu.
  • Lapisan pengikat & bonding – jika TIM atau bonding layer kurang konduktif, ia bertindak sebagai “penebat”, mencipta bottleneck haba.

Di kilang:

  • Hotspot yang tak dijangka boleh menyebabkan modul ujian cip AI perlu dikurangkan kekerapan (under-clocking) semasa burn‑in.
  • Peralatan pengendalian (handler, tester, sistem vision AI) terdedah kepada drift prestasi apabila suhu bilik ujian naik akibat cip yang terlalu panas.

Ringkasnya, bila reka bentuk 3D-IC mengabaikan haba, kilang terpaksa “membayar hutang” melalui cycle time lebih panjang, scrap lebih tinggi dan downtime mesin lebih kerap.


2. Pemodelan Terma Awal: Senjata Sulit Kilang Pintar

Jawapan paling kos efektif untuk isu terma ialah pemodelan awal yang ringkas tapi tepat. Bukan tunggu sehingga layout siap baru jalankan simulasi penuh.

Compact Model & Peta Kuasa Kasar

Pereka boleh membina compact thermal model (CTM) pada peringkat seni bina dengan input berikut:

  • anggaran kuasa mengikut die / blok (bukan RTL terperinci pun tak mengapa),
  • ketebalan die dan susunan bahan (silicon, interposer, underfill, TIM),
  • konfigurasi stack (2.5D, 3D bertindan, HBM + logic, dan lain‑lain),
  • jenis interposer (silicon, kaca, organik) dan kekonduksian terma.

Daripada situ, mereka menjana peta kuasa kasar untuk:

  • mengenal pasti zon berisiko hotspot,
  • menguji sama ada densiti kuasa yang dirancang realistik,
  • menilai sama ada susunan die perlu dirombak awal.

Ini terus mengubah hala tuju:

  • Floorplan: blok AI dengan kuasa tinggi dialih ke posisi yang lebih dekat dengan laluan konduksi haba.
  • Pembahagian fungsi: kerja inference berat mungkin diagihkan ke die yang lebih hampir dengan heatsink.

Di Mana AI Masuk?

Dalam konteks kilang pintar, AI boleh membantu dengan dua cara:

  1. AI untuk reka bentuk (AI in EDA)
    Model ML dilatih menggunakan ribuan konfigurasi 3D-IC untuk meramal suhu maksimum, hotspot dan gradien terma dalam beberapa saat, jauh lebih pantas berbanding solver tradisional. Ini mempercepat iterasi reka bentuk dan mengurangkan risiko kejutan terma di hujung.

  2. AI untuk operasi (AI di kilang)
    Data suhu dari ujian haba, burn‑in dan sistem pemantauan peralatan disuap ke model AI bagi:

    • mengesan drift terma sebelum berlaku kegagalan,
    • mencadangkan pelarasan parameter ujian atau penyejukan peralatan,
    • menghubungkan corak kegagalan di kilang dengan hotspot reka bentuk di tahap die.

Kilang yang menyatukan dua aliran data ini – reka bentuk dan pengeluaran – mendapat “loop pembelajaran” terma berterusan yang sangat kuat.


3. Laluan Haba: Dari Die Ke Interposer, Substrat & Sistem

Haba dalam 3D-IC mengalir dalam rangkaian laluan menegak dan mendatar yang kompleks. Kalau model hanya melihat die dan heatsink, hasilnya selalunya terlalu optimistik.

Peranan Interposer & Substrat

  • Interposer silikon

    • Kekonduksian terma tinggi, bagus untuk menyebar haba.
    • Tetapi boleh memusatkan beban haba di kawasan kluster chiplet.
  • Interposer organik / kaca

    • Rintangan terma lebih tinggi, kurang efektif menyebar haba.
    • Kadang sesuai untuk produk kuasa lebih rendah atau kos sensitif.

Substrat, heat spreader dan lid juga perlu dimodel sebagai sebahagian sistem, bukan “kotak hitam mekanikal”. Tanpa itu, ramalan suhu mudah tersasar 5–15°C, cukup untuk membezakan antara produk yang lulus dan gagal stress test di kilang.

Implikasi Untuk Pengilangan & Rantaian Bekalan

Bila pasukan reka bentuk faham laluan haba sebenar:

  • spesifikasi penyejuk, heat sink dan thermal solution di peringkat sistem boleh dibekukan lebih awal,
  • pembekal bahan (TIM, underfill, substrat) boleh disatukan dalam pelan kapasiti,
  • kilang boleh merancang susun atur line ujian dan chamber suhu mengikut profil haba sebenar produk.

Ini mengurangkan risiko:

  • perlu tukar vendor bahan saat akhir kerana isu termal,
  • bottleneck di stesen ujian suhu tinggi bila volume meningkat,
  • ketidakpadanan antara expectation pelanggan dan kemampuan sebenar produk di lapangan.

4. Bahan, TIM & Strategi Penyejukan Untuk Stack 3D-IC

Pemilihan bahan dan strategi penyejukan menentukan sama ada 3D-IC boleh diskalakan dari generasi ke generasi.

Bahan & TIM: Perkara “Kecil” Yang Ubah Suhu Besar

Perkara yang kerap diremehkan:

  • Perbezaan kekonduksian terma TIM boleh mengubah suhu die sehingga 5–10°C.
  • Ketebalan TIM berbeza beberapa micron pun boleh mengubah rintangan terma dengan ketara.
  • Underfill dan bonding layer yang lebih baik menurunkan rintangan terma menegak.

Bagi pengeluar di Malaysia, ini kritikal kerana:

  • banyak produk automotif dan perindustrian perlu lulus AEC-Q100 dan ujian suhu/kejutan terma yang keras;
  • suhu ambien tropika sudah tinggi, jadi margin termal operasi di lapangan lebih ketat.

Strategi Penyejukan: Dari Udara ke Cecair

Pendekatan tipikal:

  • Penyejukan udara
    Sesuai untuk kuasa sederhana, sistem edge, dan sebahagian aplikasi automotif.

  • Vapor chamber & heat pipe
    Menyebar haba dengan lebih homogen, berguna untuk modul AI di server rack.

  • Penyejukan cecair langsung
    Semakin biasa untuk kluster AI dan HPC yang menggunakan 3D-IC berkuasa tinggi.

Pandangan saya: kilang yang hanya merancang penyejukan untuk generasi produk semasa akan ketinggalan. Bila roadmap kuasa naik 30–50% dalam 2–3 tahun, susunan stack dan penyejukan mesti dirancang dengan “buffer” masa depan.

Di sinilah AI boleh membantu:

  • mengoptimumkan reka bentuk manifold cecair dan aliran untuk mengekalkan suhu seragam;
  • mensimulasikan senario kerosakan kipas / pam dan kesan kepada suhu die;
  • menghubungkan penggunaan tenaga sistem penyejukan dengan sasaran hijau (ESG) syarikat.

5. Ko-Optimum Terma Dengan Floorplan & PDN

Mengurus haba tanpa menyentuh floorplan dan rangkaian penghantaran kuasa (PDN) hampir mustahil. Dalam 3D-IC, tiga perkara ini berkait rapat: lokasi blok, laluan haba, dan laluan kuasa.

Floorplanning Berorientasikan Haba

Beberapa prinsip praktikal:

  • Letak blok kuasa tinggi berhampiran laluan konduksi haba utama (TSV besar, metal plane tebal, contact ke heatsink).
  • Elak menindih dua blok kuasa tinggi pada die berbeza betul-betul di atas satu sama lain tanpa laluan haba yang jelas.
  • Gunakan lapisan metal atas sebagai “heat spreader” sampingan, bukan hanya untuk signal/kuasa.

Dalam kilang, reka bentuk yang lebih “mesra haba” ini menghasilkan:

  • suhu lebih terkawal semasa ujian fungsi di kekerapan maksimum,
  • variasi suhu lebih rendah antara unit, jadi tingkap binning kuasa/prestasi boleh diperketat (lebih banyak unit masuk bin premium).

PDN & Kesan Elektro‑Terma

Struktur PDN juga menjana haba:

  • TSV kuasa, bump dan redistribusi interposer mempunyai rintangan – arus tinggi bermakna I²R heating.
  • Bila dianalisis bersama, kita melihat interaksi drop voltan + kenaikan suhu.

Pendekatan terbaik ialah analisis elektro‑terma bersepadu:

  • simulasi kuasa, IR drop dan suhu dijalankan secara iteratif,
  • perubahan pada PDN (contoh tambah TSV kuasa) dinilai dari sudut kuasa dan suhu,
  • hasilnya floorplan, PDN dan terma dioptimumkan serentak.

Kilang mendapat manfaat kerana:

  • kegagalan akibat electromigration dan fatigue termal berkurang,
  • masa “burn‑in” boleh dipendekkan apabila model kebolehpercayaan lebih yakin,
  • kadar RMA di lapangan menurun, menguatkan reputasi jenama.

6. Dari Signoff Elektro‑Terma Ke Kilang AI Pintar

Signoff terma yang serius ialah insurans paling murah sebelum masuk pengeluaran besar-besaran.

Sebelum tape‑out dan pelaburan capex di line pengeluaran, pasukan reka bentuk perlu mengesahkan bahawa:

  • profil kuasa yang dianggarkan sejajar dengan corak aktiviti sebenar (khususnya beban AI),
  • suhu puncak semua die kekal dalam lingkungan yang selamat sepanjang julat keadaan operasi,
  • tiada lapisan atau interface (bump, TSV, bonding) melebihi had kebolehpercayaan termanya.

Untuk kilang AI pintar, langkah seterusnya ialah menyambung data signoff ini ke sistem MES, SCADA dan platform analitik AI:

  • resepi ujian suhu, masa soak dan kekerapan ditetapkan berdasarkan hotspot sebenar pada cip,
  • peralatan ujian dipantau terhadap profil suhu sasaran yang datang terus daripada model reka bentuk,
  • bila ada lot yang menunjukkan pola suhu luar biasa, sistem boleh menjejak semula ke variasi proses, bahan atau wafer tertentu.

Saya pernah lihat kilang yang menggabungkan model signoff elektro‑terma dengan data real‑time kilang berjaya mengurangkan kadar kegagalan ujian suhu tinggi lebih 30% dalam satu tahun, hanya dengan pelarasan prosedur dan parameter – tanpa menukar reka bentuk cip.


7. Membina Keupayaan Terma Sebagai Teras Daya Saing

3D-IC membuka jalan kepada prestasi AI dan HPC yang sukar dicapai dengan cip 2D biasa. Tetapi harganya ialah disiplin terma yang jauh lebih ketat. Bagi ekosistem E&E Malaysia yang sedang bergerak ke arah kilang pintar bertenaga AI, ini bukan topik sampingan; ia faktor penentu daya saing.

Beberapa mesej penting:

  • Haba ialah pemboleh ubah reka bentuk peringkat seni bina, bukan isu penampal saat akhir.
  • AI dan pemodelan terma perlu berjalan seiring – dari reka bentuk hingga operasi kilang.
  • Bahan, TIM dan penyejukan ialah keputusan strategik, bukan sekadar komponen yang dibeli paling murah.
  • Ko‑optimum floorplan, PDN dan terma memberikan produk yang lebih pantas, lebih jimat tenaga dan lebih tahan lama.

Bagi syarikat di Malaysia yang membina kilang AI pintar untuk elektronik, automotif dan semikonduktor, soalan sebenar sekarang bukan lagi “perlukah kita fokus pada terma 3D-IC?”, tetapi berapa cepat kita boleh membina keupayaan elektro‑terma dan AI analytics sebagai kompetensi teras organisasi.