додому Різне Dorongan Infrastruktur AI Google: Chip Baru, Penawaran Besar-besaran, dan Tantangan bagi Nvidia

Dorongan Infrastruktur AI Google: Chip Baru, Penawaran Besar-besaran, dan Tantangan bagi Nvidia

Google secara agresif memperluas infrastruktur kecerdasan buatannya, meluncurkan chip baru yang kuat, dan mendapatkan kesepakatan bernilai miliaran dolar dengan Anthropic, sekaligus menantang dominasi Nvidia di pasar akselerator AI. Pengumuman tersebut berpusat pada Tensor Processing Unit (TPU) generasi ketujuh yang baru dan perluasan opsi untuk prosesor Axion berbasis Arm, yang mencerminkan pergeseran dalam industri untuk menyajikan model AI yang sudah terlatih kepada miliaran pengguna, dan bukan hanya melatih mereka.

Chip Terbaru Google: Kayu Besi

Inti dari ekspansi ini adalah chip Ironwood, akselerator AI khusus terbaru Google. Teknologi ini memiliki kinerja empat kali lipat lebih baik dibandingkan pendahulunya untuk beban kerja pelatihan dan inferensi. Satu “pod” chip Ironwood dapat menghubungkan hingga 9.216 chip melalui Inter-Chip Interconnect milik Google, sehingga menciptakan superkomputer yang mampu berbagi 1,77 petabyte Memori Bandwidth Tinggi—kira-kira setara dengan 40.000 film Blu-ray. Fitur utamanya mencakup Optical Circuit Switching (OCS), yang secara otomatis mengubah rute lalu lintas data di sekitar kegagalan dengan gangguan minimal, dan pendekatan desain bersama tingkat sistem yang mengoptimalkan perangkat keras dan perangkat lunak secara bersamaan.

Komitmen Miliaran Dolar Anthropic

Validasi paling signifikan atas kemampuan Ironwood datang dari Anthropic, perusahaan keamanan AI di balik rangkaian model Claude. Mereka telah berkomitmen untuk mengakses hingga satu juta chip TPU, sebuah kesepakatan yang diperkirakan bernilai puluhan miliar dolar— salah satu komitmen infrastruktur cloud terbesar yang diketahui dalam sejarah. Investasi ini akan memungkinkan Anthropic meningkatkan kapasitas komputasinya dan mempertahankan kecepatan serta keandalan yang diharapkan pelanggan.

Prosesor Axion: Melengkapi AI Khusus

Bersamaan dengan Ironwood, Google memperkenalkan opsi yang diperluas untuk rangkaian prosesor Axion, CPU berbasis Arm khusus yang dirancang untuk beban kerja tujuan umum yang mendukung aplikasi AI. Jenis instans N4A menargetkan layanan mikro dan beban kerja lain yang penting untuk aplikasi AI, memberikan kinerja harga hingga 2X lebih baik dibandingkan mesin virtual x86 yang sebanding. Mesin virtual logam C4A baru menyediakan server fisik khusus untuk beban kerja khusus.

AI Hypercomputer: Perangkat Lunak dan Integrasi

Google menekankan bahwa kinerja perangkat keras saja tidak cukup; itu membutuhkan perangkat lunak yang dioptimalkan. Mereka menawarkan “AI Hypercomputer,” sebuah sistem terintegrasi yang menyatukan komputasi, jaringan, penyimpanan, dan perangkat lunak. Sistem ini dilaporkan telah menghasilkan laba atas investasi tiga tahun sebesar 353% bagi pelanggan. Peningkatan perangkat lunak utama mencakup pemeliharaan tingkat lanjut untuk kluster TPU, dukungan kerangka kerja MaxText sumber terbuka untuk teknik pelatihan tingkat lanjut, dan Gerbang Inferensi yang secara cerdas menyeimbangkan beban permintaan untuk mengurangi latensi dan biaya penyajian.

Mengatasi Tantangan Infrastruktur: Listrik dan Pendinginan

Google menyadari besarnya tantangan infrastruktur fisik yang ditimbulkan oleh perluasan ini. Mereka menerapkan pengiriman daya arus searah +/-400 volt yang mampu mendukung hingga satu megawatt per rak dan menyumbangkan desain unit distribusi pendingin generasi kelima ke Proyek Open Compute. Hal ini termasuk memanfaatkan pendinginan cair, yang dapat mengangkut panas 4.000 kali lebih banyak daripada udara, yang merupakan hal penting untuk chip AI yang semakin intensif daya.

Menantang Dominasi Nvidia

Pengumuman Google merupakan tantangan besar terhadap dominasi Nvidia yang luar biasa (diperkirakan memiliki pangsa pasar 80-95%) di pasar akselerator AI. Meskipun pengembangan silikon khusus memerlukan investasi besar dan menghadapi tantangan ekosistem perangkat lunak, Google berpendapat bahwa integrasi yang erat dari penelitian model hingga desain chip memungkinkan pengoptimalan yang unik.

Poin Penting

Langkah terbaru Google menyoroti perubahan penting dalam lanskap AI, dimana penyedia cloud semakin fokus pada penerapan model AI terlatih secara efisien dalam skala besar. Chip baru perusahaan, kesepakatan besar-besaran dengan Anthropic, dan fokus pada perangkat keras dan perangkat lunak terintegrasi bertujuan untuk membentuk kembali dinamika kompetitif pasar infrastruktur AI dan memberikan alternatif yang layak untuk GPU Nvidia. Kemampuan industri untuk mempertahankan tingkat investasi dan laju inovasi arsitektur akan sangat penting untuk diperhatikan dalam beberapa bulan mendatang.

Exit mobile version