ItWorks
  • Home
  • TOP Digital Awards
  • Business Solution
  • Telco
  • Digital
  • E-Gov
  • Product
  • Forti
  • TIK Talks
  • More
    • Expert
    • ICT Profile
    • Fintech
    • Research
    • Tips & Trick
    • Event
    • Foto
No Result
View All Result
  • Home
  • TOP Digital Awards
  • Business Solution
  • Telco
  • Digital
  • E-Gov
  • Product
  • Forti
  • TIK Talks
  • More
    • Expert
    • ICT Profile
    • Fintech
    • Research
    • Tips & Trick
    • Event
    • Foto
No Result
View All Result
ItWorks
No Result
View All Result

Tingkatkan Ekonomi AI Factory, F5 dan NVIDIA Tawarkan Kemampuan Baru untuk Akselerasi Inferensi AI

Fauzi
4 May 2026 | 10:36
rubrik: Business Solution
Tingkatkan Ekonomi AI Factory, F5 dan NVIDIA Tawarkan Kemampuan Baru untuk Akselerasi Inferensi AI
Share on FacebookShare on Twitter

F5, perusahaan global dalam delivery dan pengamanan setiap aplikasi dan API, baru-baru ini mengumumkan perluasan kemampuan untuk mempercepat dan mengoptimalkan infrastruktur inferensi AI, melalui kolaborasi berkelanjutannya dengan NVIDIA.

Integrasi yang makin luas ini mengombinasikan F5 BIG-IP Next for Kubernetes dengan NVIDIA BlueField-3 DPU, untuk menciptakan lapisan infrastruktur cerdas berbasis telemetri yang mampu meningkatkan token throughput melalui pemanfaatan GPU yang lebih optimal, mengurangi latensi, serta memungkinkan platform AI multi-tenant yang aman dalam skala besar.

Dalam sistem AI, token merupakan unit output yang terukur, berupa kata, simbol, atau fragmen data yang dihasilkan dan diproses selama inferensi. Volume dan kecepatan produksi token pada akhirnya menentukan pengalaman pengguna, efisiensi infrastruktur, hingga potensi pendapatan dari setiap akselerator.

Seiring perusahaan dan penyedia GPU-as-a-Service berlomba-lomba untuk memonetisasi AI dan beralih dari fase eksperimen AI ke fase penyediaan layanan yang menghasilkan pendapatan, efisiensi infrastruktur telah menjadi metrik yang menentukan. Keberhasilan kini tidak lagi diukur dari kapasitas GPU yang tersedia, namun dari ‘ekonomi’ token, throughput token yang berkelanjutan, time to first token (TTFT), biaya per token, hingga pendapatan per akselerator GPU. Solusi gabungan F5 dan NVIDIA ini dirancang untuk menjawab langsung metrik-metrik tersebut.

Optimalkan tokenomics melalui infrastruktur AI cerdas
Peralihan dari inferensi berbasis aplikasi ke alur kerja AI berbasis agen menuntut pendekatan arsitektur baru untuk mengoptimalkan token throughput dan mengurangi biaya. BIG-IP Next for Kubernetes kini memanfaatkan statistik NVIDIA NIM, sinyal runtime Dynamo, serta data telemetri GPU untuk membuat keputusan routing berbasis inferensi sebelum eksekusi. Dengan mencocokkan beban kerja ke akselerator yang paling tepat secara real time, solusi tersebut meningkatkan utilisasi GPU secara berkelanjutan sekaligus menurunkan latensi dan kebutuhan komputasi ulang.

BACA JUGA:  AMD Luncurkan Arsitektur AMD RDNA™ 4 dan Kartu Grafis AMD Radeon™ RX 9000 Series

“Infrastruktur AI bukan hanya tentang akses ke GPU atau peningkatan skala implementasinya. Ia telah berevolusi menjadi upaya memaksimalkan output ekonomi per akselerator,” kata Kunal Anand, Chief Product Officer, F5, hari ini (4/5/2026).

“Bersama dengan NVIDIA, kami membuat AI factory memperlakukan produksi token sebagai metrik bisnis yang terukur. BIG-IP Next for Kubernetes menyediakan intelligence dan tata kelola yang dibutuhkan untuk meningkatkan GPU yield, mengurangi biaya per token dan mengembangkan platform AI bersama dengan lebih percaya diri,” lanjutnya.

Efisiensi infrastruktur yang telah tervalidasi: Peningkatan struktural
Dalam pengujian yang divalidasi oleh The Tolly Group, BIG-IP Next for Kubernetes yang dipercepat oleh NVIDIA BlueField-3 DPU mampu menghadirkan hingga 40% peningkatan dalam token throughput, 61% lebih cepat dalam time to first token (TTFT), dan penurunan latensi permintaan secara keseluruhan hingga 34%. Dengan ini, hasil akhir dari pengujian menekankan pembuktian akan kemampuan yang ditingkatkan.

Ini bukan sekadar peningkatan bertahap. Dengan mengalihkan fungsi seperti networking, TLS/encryption, load balancing berbasis AI, dan manajemen trafik ke NVIDIA BlueField-3 DPU, BIG-IP Next for Kubernetes mampu mempertahankan kapasitas host CPU dan membebaskan GPU untuk menjalankan fungsi utamanya yaitu: inferensi berkelanjutan dengan throughput tinggi dalam skala besar.

Hasilnya adalah peningkatan utilisasi GPU, berkurangnya antrian dalam pengaksesan data, serta meningkatnya token yield, yang pada akhirnya menurunkan biaya per token dalam jejak infrastruktur yang sama. Yang krusial, semua peningkatan ini tidak memerlukan modifikasi model, sehingga dapat langsung diterapkan pada seluruh infrastruktur AI factory yang sudah ada. Bagi perusahaan dan penyedia NeoCloud yang bersaing dalam ekonomi token, ini menjadi pembeda antara infrastruktur yang membatasi output AI dan infrastruktur yang benar-benar mampu mempercepatnya.

BACA JUGA:  Rilis Red Hat AI Inference Server, Red Hat Hadirkan Gen AI untuk Berbagai Model dan Akselerator di Seluruh Hybrid Cloud

“Infrastruktur komputasi terakselerasi dari NVIDIA yang dipadukan dengan Application Delivery and Security Platform berbasis AI dari F5 membuka potensi ‘tokenomics’ AI factory, yakni menghadirkan inferensi yang skalabel dan hemat biaya tanpa perlu melakukan perubahan apa pun pada model,” kata Kevin Deierling, SVP, Networking, NVIDIA. “F5 dan NVIDIA bersama-sama memberdayakan perusahaan untuk meningkatkan skala inferensi pada AI factory secara efisien dan ekonomis.”

Siap untuk AI berbasis agen dan platform AI multi-tenant
Beban kerja AI modern kini semakin berbasis agen, persisten, dan sadar konteks. Mereka membutuhkan kontrol trafik yang lebih cerdas dibandingkan load balancing tradisional. Solusi BIG-IP Next for Kubernetes yang ditingkatkan tersebut kini dapat mendukung:

  • Routing berbasis inferensi untuk alur kerja agentic AI
  • Integrasi dengan NVIDIA DOCA Platform Framework (DPF) untuk memudahkan implementasi dan manajemen lifecycle NVIDIA BlueField DPU
  • EVPN-VXLAN dengan VRF yang dinamis untuk mengamankan multi tenancy di level jaringan
  • Keamanan, tata kelola token, dan kemampuan observability yang terintegrasi dalam lingkungan Kubernetes AI.

Kemampuan ini memungkinkan perusahaan dan penyedia NeoCloud berbagi infrastruktur GPU secara aman antar unit bisnis ataupun pelanggan eksternal, tanpa mengorbankan isolasi performa serta tingkat layanan yang terprediksi.

Control plane untuk ekonomi AI factory
F5 dan NVIDIA menyediakan berbagai tools yang telah tervalidasi serta praktik terbaik bagi perusahaan untuk mengoptimalkan arsitektur inferensi. Dengan berbagai peningkatan tersebut, BIG-IP Next for Kubernetes diposisikan sebagai control plane yang strategis bagi ekonomi AI factory, mengelola konsumsi token, mengoptimalkan alur trafik, dan memaksimalkan return on investment infrastruktur.

Alih-alih melakukan overprovisioning untuk menutupi inefisiensi, organisasi kini dapat meraih value ekonomi yang lebih besar dari setiap GPU yang sudah berada dalam proses produksi. Hasilnya adalah peningkatan pendapatan per GPU, penurunan biaya operasional, serta layanan AI yang skalabel untuk mendukung pertumbuhan jangka panjang. Dengan menggabungkan data telemetri infrastruktur dan akselerasi DPU dari NVIDIA dengan traffic intelligence dan kemampuan keamanan dari F5, kedua perusahaan membantu organisasi mentransformasi AI factory menjadi platform yang efisien, dapat dimonetisasi, dan siap menghadapi era agentic AI.

BACA JUGA:  Pacu Kinerja di Tahun 2025, TMI Hadirkan 3 Inovasi Digital
Tags: Agentic AIAIAI FactoryF5NVIDIA
Previous Post

IWCS Dorong Perempuan Jadi Garda Depan Ketahanan Digital di Era Siber

Next Post

Usung Konsep ‘Aman Ajaaa’, Ini Keunggulan realme C100

Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

TOP DIGITAL AWARDS

hanwha-life-top-digital-awards-2025-level-stars-5

Hanwha Life Raih TOP Digital Awards 2025 Level Stars 5

Teguh Imam Suyudi
23 December 2025 | 16:00

Rumah Pendidikan Kemendikdasmen TOP Digital Awards 2025

Rumah Pendidikan Kemendikdasmen Raih Penghargaan Bergengsi TOP Digital Awards 2025

Teguh Imam Suyudi
7 December 2025 | 09:00

Moratelindo TOP Digital Awards

Moratelindo Perkuat Kepemimpinan Transformasi Digital Lewat Dua Penghargaan Nasional TOP Digital Awards 2025

Teguh Imam Suyudi
6 December 2025 | 09:00

Ilham Habibie: Digital adalah Instrumen Strategis Daya Saing Global, Kedaulatan, dan Ketahanan Ekonomi Bangsa

Ilham Habibie: Digital adalah Instrumen Strategis Daya Saing Global, Kedaulatan, dan Ketahanan Ekonomi Bangsa

Fauzi
5 December 2025 | 13:58

PT Pertamina International Shipping (PIS) Raih Penghargaan TOP Digital Awards 2025 Bintang 5

PT Pertamina International Shipping (PIS) Raih Penghargaan TOP Digital Awards 2025 Bintang 5

Ahmad Churi
5 December 2025 | 11:14

Load More

TERPOPULER

  • Amar Bank: “Layanan Bank Digital Bukan Hanya untuk Menambah Jumlah Nasabah, yang Terpenting untuk Edukasi Keuangan”

    Amar Bank: “Layanan Bank Digital Bukan Hanya untuk Menambah Jumlah Nasabah, yang Terpenting untuk Edukasi Keuangan”

    1 shares
    Share 0 Tweet 0
  • Menjaga Jarak dan Memakai Masker Mengurangi Risiko Covid-19

    0 shares
    Share 0 Tweet 0
  • Dari Sekedar Token Menuju Kepercayaan: Momen Pembuktian AI Senilai US$2,5 Triliun

    0 shares
    Share 0 Tweet 0
  • Ramaikan PRJ, AQUA Elektronik Hadirkan Inovasi Produk Home Appliance

    0 shares
    Share 0 Tweet 0
  • Ensign InfoSecurity Luncurkan Pelatihan Simulasi Krisis Siber

    0 shares
    Share 0 Tweet 0
iklan bni
cover it works
cover it works

ICT PROFILE

Transformasi Digital Kian Gencar, Akamai Luncurkan Akamai Connected Cloud dan Layanan Baru

Tunjuk Fiona Zhang, Akamai Perkuat Strategi Channel-First Kawasan APJ

Fauzi
8 April 2026 | 16:26

Akamai menunjuk Fiona Zhang sebagai Wakil Presiden Regional Bidang Penjualan dan Program Saluran untuk kawasan Asia-Pasifik dan Jepang. Penunjukan Fiona...

Intel Tunjuk Pimpinan Baru untuk Kawasan APJ

Intel Tunjuk Pimpinan Baru untuk Kawasan APJ

Fauzi
7 April 2026 | 11:46

Intel Corporation mengumumkan penunjukan Santhosh Viswanathan sebagai Vice President and Managing Director untuk kawasan Asia Pasifik dan Jepang (APJ). Dengan...

EXPERT

Dari Sekedar Token Menuju Kepercayaan: Momen Pembuktian AI Senilai US$2,5 Triliun

Fauzi
18 June 2026 | 12:58

Oleh: Abhas Ricky, Chief Business Officer and GM of Applied AI Era kecepatan dan akses sedang berakhir. Apa yang menggantikan...

Red Hat Berambisi Capai Target Net Zero Emisi Gas Rumah Kaca di 2030

Titik Infleksi AI Selanjutnya: Mengubah Agen AI Menjadi ‘Superusers’ di Enterprise

Fauzi
21 May 2026 | 14:39

Oleh: Matt Hicks, President and CEO, Red Hat Jika Anda menyaksikan keynote di hari pertama Red Hat Summit 2026, Anda...

TIK TALKS

Stephanus Oscar – Data Center dengan Kapasitas 6 Megawatt di Jakarta | It Works Podcast #5

Stephanus Oscar – Data Center dengan Kapasitas 6 Megawatt di Jakarta | It Works Podcast #5

redaksi
16 August 2022 | 15:30

Di masa akan datang banyak aplikasi yang akan membutuhkan low latency connectivity. Lalu apa kaitannya dengan Edge DC yang hadir...

Edward Samual – Memproses Data dari Hulu Sampai Hilir | It Works Podcast #4

Edward Samual – Memproses Data dari Hulu Sampai Hilir | It Works Podcast #4

redaksi
15 August 2022 | 12:30

Bagaimana cara mengolah Big Data sehingga dapat divisualisasikan, serta bagaimana dapat melakukan analitik dan dapat memprediksikan apa yang harus dilakukan...

  • Redaksi
  • Pedoman Media Siber
  • Info Iklan
  • Disclaimer
  • Email

Itworks - Inspire Great & Telco for Business Performance | All Rights Reserved

  • Home
  • TOP Digital Awards
  • Business Solution
  • Telco
  • Digital
  • E-Gov
  • Product
  • Forti
  • TIK Talks
  • More
    • Expert
    • ICT Profile
    • Fintech
    • Research
    • Tips & Trick
    • Event
    • Foto