Seiring AI yang terus merevolusi industri, perusahaan pun makin membutuhkan infrastruktur yang hemat biaya dan dapat melakukan pengembangan dan deployment yang cepat. Untuk memenuhi permintaan ini secara langsung, Intel meluncurkan Xeon 6 dengan Performance-cores (P-cores) dan AI accelerator Gaudi 3, yang memperkuat komitmen perusahaan untuk menyediakan sistem AI yang kuat dengan performa per watt yang optimal dan total biaya kepemilikan (total cost of ownership/TCO) yang lebih rendah.
“Permintaan AI mengakibatkan transformasi besar-besaran di pusat data, dan industri ini menginginkan pilihan untuk hardware, software dan tool pengembang,” kata Justin Hotard, executive vice president dan general manager Data Center and Artificial Intelligence Group, Intel, hari ini (25/9/2024).
“Dengan peluncuran Xeon 6 dengan P-cores dan AI accelerator Gaudi 3, Intel menghadirkan ekosistem terbuka yang memungkinkan para pelanggan kami mengimplementasikan semua beban kerja mereka dengan performa, efisiensi dan keamanan yang lebih besar,” sambungnya.
Intel Xeon 6 dengan P-cores dan AI accelerator Gaudi 3
Kemajuan terkini Intel dalam infrastruktur AI di antaranya adalah hadirnya dua update besar dalam portofolio pusat data, yaitu:
• Intel® Xeon® 6 dengan P-cores: Didesain untuk menangani beban kerja yang butuh daya komputasi tinggi dengan efisiensi yang luar biasa, Xeon 6 memberikan performa dua kali lipat dibandingkan generasi sebelumnya2. Ia menghadirkan fitur core count yang lebih besar, menggandakan bandwidth memory, dan disertakannya kemampuan AI acceleration pada setiap core. Prosesor ini dirancang untuk memenuhi tuntutan performa AI, dari lingkungan edge hingga pusat data dan cloud.
• Intel® Gaudi® 3 AI Accelerator: Dioptimalkan secara khusus untuk AI generatif berskala besar, Gaudi 3 dilengkapi dengan 64 Tensor processor core (TPC) dan 8 matrix multiplication engine (MME) untuk mengakselerasi komputasi deep neural network. Ia meliputi memori HBM2e 128 gigabyte (GB) untuk pelatihan dan inferensi, dan port Ethernet 24 200 Gigabit (Gb) untuk jaringan yang skalabel. Gaudi 3 juga menawarkan kompatibilitas tanpa hambatan dengan framework PyTorch, dan transformer Hugging Face mutakhir dan model diffuser. Baru-baru ini, Intel berkolaborasi dengan IBM untuk menjalankan AI accelerator Intel Gaudi 3 sebagai layanan di IBM Cloud.
Melalui kolaborasi ini, Intel dan IBM menargetkan untuk mengurangi total biaya kepemilikan dalam memanfaatkan dan menskalakan AI, sekaligus meningkatkan performa.
Tingkatkan Sistem AI dengan Manfaat TCO
Menjalankan AI pada skala besar harus mempertimbangkan sejumlah hal, seperti opsi pengaplikasian yang fleksibel, rasio harga-performa yang kompetitif dan teknologi AI yang mudah diakses. Infrastruktur Intel x86 yang kuat dan ekosistem terbuka yang ekstensif membuatnya dapat mendukung enterprise dalam membangun sistem AI yang bernilai tinggi dengan TCO dan performa per watt yang optimal. Perlu diperhatikan bahwa 73% dari server yang GPU-accelerated menggunakan Intel Xeon sebagai host CPU.3
Intel bermitra dengan OEM terkemuka, meliputi Dell Technologies dan Supermicro untuk sama-sama mengembangkan sistem yang khusus dirancang untuk kebutuhan pelanggan yang spesifik supaya penerapan AI-nya menjadi lebih efektif. Dell Technologies saat ini sama-sama merancang solusi berbasis RAG dengan memanfaatkan Gaudi 3 dan Xeon 6.
Jembatani Kesenjangan dari Prototipe ke Produksi dengan Co-engineering
Transisi solusi AI generatif (Gen AI) dari prototipe ke sistem yang siap produksi memiliki beberapa tantangan dalam monitoring secara real-time, penanganan error, logging, keamanan dan skalabilitas. Intel mengatasi tantangan tersebut melalui upaya co-engineering dengan OEM dan para mitra untuk menyediakan solusi retrieval-augmented generation (RAG) yang siap produksi.
Solusi yang dikembangkan di platform Open Platform Enterprise AI (OPEA) ini, mengintegrasikan layanan mikro berbasis OPEA ke dalam sistem RAG yang skalabel, yang dioptimalkan untuk Xeon dan sistem AI Gaudi, didesain supaya pelanggan dapat dengan mudah mengintegrasikan aplikasi dari Kubernetes, Red Hat OpenShift AI, dan Red Hat Enterprise Linux AI.
Perluas Akses ke Aplikasi Enterprise AI
Portofolio Intel Tiber menawarkan solusi bisnis untuk mengatasi tantangan seperti akses, biaya, kompleksitas, keamanan, efisiensi dan skalabilitas di seluruh lingkungan AI, cloud dan edge. Intel® Tiber™ Developer Cloud kini menyediakan sistem pratinjau Intel Xeon 6 untuk evaluasi dan pengujian teknologi. Selain itu, pelanggan terpilih juga akan mendapatkan akses awal ke Intel Gaudi untuk memvalidasi penerapan model AI, dengan cluster Gaudi 3 yang mulai diluncurkan kuartal depan untuk dijalankan dalam produksi skala besar.
Penawaran layanan baru termasuk SeekrFlow, platform AI end-to-end dari Seekr untuk mengembangkan aplikasi AI tepercaya. Update terbaru meliputi perilisan software Intel Gaudi terbaru dan notebook Jupyter yang sudah diperkuat dengan PyTorch 2.4 dan Intel oneAPI dan tool AI 2024.2, yang meliputi kemampuan akselerasi AI terbaru dan dukungan untuk prosesor Xeon 6.