Minggu, 28 September 2025
No Result
View All Result
youngster.id
Pratesis Ads
  • News
  • Technopreneur
  • Creativepreneur
  • Sociopreneur
  • Innovation
  • Youth Development
No Result
View All Result
youngster.id
  • News
  • Technopreneur
  • Creativepreneur
  • Sociopreneur
  • Innovation
  • Youth Development
No Result
View All Result
youngster.id
No Result
View All Result
Home News

Yandex Memperkenalkan Alat Pelatihan Pembelajaran Mesin Model LLM YaFSDP

11 Juni 2024
in News
Reading Time: 3 mins read
Yandex YaFSDP

Yandex Memperkenalkan Alat Pelatihan Pembelajaran Mesin Model LLM YaFSDP (Foto: Ilustrasi)

0
SHARES
0
VIEWS

youngster.id - Perusahaan teknologi asal Rusia Yandex meluncurkan YaFSDP, sebuah metode open-source untuk melatih model machine learning bahasa atau LLM (Large Language Model) yang memungkinkan AI generatif untuk berinteraksi dengan pengguna secara real-time.

Saat ini, YaFSDP merupakan metode paling efektif dalam melatih LLM dibanding metode Fully Sharded Data Parallel (FSDP) lainnya yang tersedia di publik karena mampu meningkatkan efektivitas komunikasi graphics processing unit (GPU) dan mengurangi penggunaan memori.

Perlu diketahui bahwa FSDP merupakan metode pelatihan LLM yang menggunakan sejumlah unit processing untuk mengolah data secara paralel. Dengan YaFSDP, kecepatan bisa ditingkatkan hingga 26% dibandingkan dengan FSDP biasa, tergantung pada arsitektur dan jumlah parameter. Sehingga, waktu pelatihan untuk LLM bisa dikurangi sekaligus menghemat penggunaan sumber daya GPU hingga 20%.

Mikhail Khruschev, Senior Developer Yandex dan Tim YaFSDP mengatakan, sebagai bagian dari komitmen untuk berkontribusi pada komunitas artificial intelligence (AI) global, Yandex membuat YaFSDP tersedia untuk umum bagi para pengembang LLM dan penggemar AI di seluruh dunia.

“Saat ini, kami secara aktif bereksperimen dengan berbagai model arsitektur dan ukuran parameter untuk memperluas manfaat dari YaFSDP. Kami sangat senang bisa berbagi perkembangan terbaru dalam pelatihan LLM dengan komunitas machine learning (ML) global. Besar harapan kami ini bisa berkontribusi pada peningkatan aksesibilitas dan efisiensi bagi para peneliti dan pengembang AI generatif di seluruh dunia,” jelas Mikhail, Selasa (11/6/2024).

Baca juga :   Perangi Flexing Lewat Kompetisi Film Pendek "Save Our Socmed"

Saat ini, engineer atau insinyur serta peneliti Indonesia sedang fokus pada pengembangan LLM untuk penggunaan di sektor publik, administrasi pemerintahan dan pertahanan, termasuk sektor keuangan dan asuransi. Kementerian Komunikasi and Informatika telah bekerjasama dengan AI Singapore, sebuah program nasional Pemerintah Singapura dalam pengembangan AI, untuk membuat LLM open-source dalam Bahasa Indonesia.

Di sektor keuangan, pelaku industri perbankan telah menggunakan LLM untuk penyelenggaraan layanan chatbot dalam Bahasa Indonesia dan bahkan sejumlah bahasa daerah agar bisa meningkatkan kualitas customer service, marketing dan sales.

YaFSDP dibuat dengan tujuan untuk mendukung engineer atau insinyur dan peneliti Indonesia dalam upaya mempercepat pengembangan kegunaan LLM dengan menyediakan metode open-source yang bisa meningkatkan optimalisasi pemanfaatan jaringan, mengurangi beban memori sekaligus menurunkan biaya pelatihan LLM melalui pengurangan kebutuhan sumber daya komputasi.

Pelatihan LLM merupakan proses yang memakan waktu dan menggunakan sumber daya besar sekaligus intensif. Engineer atau insinyur yang mendalami pembelajaran mesin dan perusahaan yang mengembangkan sendiri LLM-nya perlu investasi besar untuk waktu dan sumber daya GPU dalam melatih model pembelajaran mesinnya. Tentu ini akan memakan biaya yang tidak sedikit.  Semakin besar modelnya, semakin besar pula waktu dan biaya yang dibutuhkan untuk pelatihannya.

Baca juga :   Alodokter dan IDI Hadirkan Fitur Perpanjangan Izin Praktik Dokter

YaFSDP Yandex bekerja dengan menghilangkan inefisiensi komunikasi GPU, memastikan bahwa pelatihan hanya membutuhkan memori prosesor yang diperlukan dan membuat interaksi GPU tidak terganggu.

YaFSDP mengoptimalkan kecepatan dan kinerja pembelajaran, memungkinkan pengembang AI di seluruh dunia untuk menggunakan lebih sedikit daya komputasi dan sumber daya GPU saat melatih model mereka. Misalnya, dalam skenario pra-pelatihan yang melibatkan model dengan 70 miliar parameter, YaFSDP mampu menghemat biaya penggunaan sumber daya sekitar 150 GPU antara $0,5 hingga $1,5 juta (tergantung pada penyedia atau platform GPU virtual yang digunakan) per bulannya.

YaFSDP merupakan metode FSDP yang disempurnakan sehingga mampu mengungguli pelatihan LLM pada tahapan pelatihan yang paling banyak menggunakan komunikasi seperti pra-pelatihan, penyelarasan, dan perbaikan. Ketika dipakai pada model LLM open source seperti Llama 2 dan Llama 3 dengan 70 miliar parameter (70B), YaFSDP menunjukkan peningkatan yang signifikan dalam hal kecepatan pelatihan sebesar 21% (untuk Llama 2 70B) dan 26% (untuk Llama 3 70B).

Baca juga :   BukaBike, Layanan Bikesharing Dari Bukalapak di ITB

“YaFSDP telah menunjukkan hasil yang mengesankan pada model yang menangani 13 hingga 70 miliar parameter, dengan kinerja yang sangat kuat pada kisaran 30 hingga 70 miliar. Saat ini, kami melihat bahwa YaFSDP paling cocok untuk model open-source yang digunakan secara luas berdasarkan arsitektur LLaMA,” tutup Mikhail.

Sejatinya, YaFSDP bukanlah alat open-source pertama dari Yandex. Perusahaan ini sebelumnya telah membagikan beberapa alat lain yang telah menjadi populer di kalangan komunitas ML, termasuk: CatBoost, sebuah perpustakaan berkinerja tinggi untuk meningkatkan gradien pada pohon keputusan atau decision trees; YTsaurus, platform big data untuk distribusi penyimpanan dan pemrosesan; AQLM, salah satu algoritma kuantisasi, atau pemetaan input dengan nilai set besar ke dalam output dengan kelompok set lebih kecil, tercanggih untuk kompresi ekstrim model bahasa besar, yang dikembangkan bersama oleh Yandex Research, HSE University, IST Austria, dan NeuralMagic; Petals, perpustakaan yang dirancang untuk menyederhanakan proses pelatihan dan penyempurnaan LLM, yang dikembangkan melalui kolaborasi antara Yandex Research dengan HSE University, University of Washington, Hugging Face, ENS Paris-Saclay, dan Yandex School of Data Analysis. (*AMBS)

 

Tags: LLM (Large Language Model)model machine learning bahasaYaFSDPYandex
Previous Post

Program TRANSFORM-Alner Berdayakan 675 UMKM Penggerak Gaya Hidup Belanja Refill

Next Post

Work Trend Index 2024: 69% Pemimpin di Indonesia Tidak Akan Merekrut Karyawan Tanpa Keterampilan AI

Related Posts

Yandex Cup
News

Yandex Ajak Programer Indonesia Ikut Kompetisi Programming Internasional

20 Oktober 2023
0
Yandex Telegram Channel
News

Yandex Buka Peluang Bagi Pengguna Telegram Raup Pendapatan

15 Juli 2023
0
Jakarta
News

Teknologi Jaringan Neural Berbasis Machine Learning Bisa Prediksi El Nino Dengan Tepat

6 Mei 2023
0
Load More
Next Post
Artificial Intelligence

Work Trend Index 2024: 69% Pemimpin di Indonesia Tidak Akan Merekrut Karyawan Tanpa Keterampilan AI

bitcoin

Harga Bitcoin Anjlok, Ini yang Harus Dilakukan Investor di Indonesia

Google x Telkom

Telkom Terima 5000 Beasiswa GCC dari Google

Discussion about this post

Recent Updates

Karya Raya 2025 Jaring 1.870 Buku Cerita Karya Anak, Harapan Bagi Peningkatan Literasi

Karya Raya 2025 Jaring 1.870 Buku Cerita Karya Anak, Harapan Bagi Peningkatan Literasi

27 September 2025
Indodana Paylater Permudah Pengguna BNPL Batalkan Transaksi Bermasalah

Indodana Paylater Permudah Pengguna BNPL Batalkan Transaksi Bermasalah

27 September 2025
Akademi Edukreator Jangkau 4.000 Kreator Untuk Jadikan YouTube Ruang Kelas Berkualitas

Akademi Edukreator Jangkau 4.000 Kreator Untuk Jadikan YouTube Ruang Kelas Berkualitas

27 September 2025
Koperasi Desa Merah Putih

Koperasi Desa Merah Putih Berperan Bagi Pemerataan Akses Energi Bersih

26 September 2025
  • Trending
  • Comments
  • Latest
Dera Perdana Shopian : Ajak Milenial Berdonasi Digital

Dera Perdana Shopian : Ajak Milenial Berdonasi Digital

27 Juni 2019
Startup Hayokerja

Startup HayoKerja Hadirkan Solusi PHL bagi Perusahaan Pencari Tenaga Kerja

25 September 2023
pendanaan Fintech

Inilah 5 Fintech dengan Pendanaan Terbesar di Indonesia Tahun 2025

15 Mei 2025
Fastwork Raih Pendanaan Seri A US$4,8 Juta

Fastwork Luncurkan Fitur Baru Untuk Pengguna Jasa Freelancer

11 Agustus 2020
Junaidi : Bikin Bimbel Karena Cinta Jadi Guru

Junaidi : Bikin Bimbel Karena Cinta Jadi Guru

0
Brother Indonesia Rilis Aplikasi Mobile Brother iShop

Brother Indonesia Rilis Aplikasi Mobile Brother iShop

0
Bangun Bagian Dapur, IKEA Dukung Pembuatan Film “Ini Kisah Tiga Dara”

Bangun Bagian Dapur, IKEA Dukung Pembuatan Film “Ini Kisah Tiga Dara”

0
Ferdian Yosa : Menangkap Tren di Bisnis Kuliner

Ferdian Yosa : Menangkap Tren di Bisnis Kuliner

0
Karya Raya 2025 Jaring 1.870 Buku Cerita Karya Anak, Harapan Bagi Peningkatan Literasi

Karya Raya 2025 Jaring 1.870 Buku Cerita Karya Anak, Harapan Bagi Peningkatan Literasi

27 September 2025
Indodana Paylater Permudah Pengguna BNPL Batalkan Transaksi Bermasalah

Indodana Paylater Permudah Pengguna BNPL Batalkan Transaksi Bermasalah

27 September 2025
Akademi Edukreator Jangkau 4.000 Kreator Untuk Jadikan YouTube Ruang Kelas Berkualitas

Akademi Edukreator Jangkau 4.000 Kreator Untuk Jadikan YouTube Ruang Kelas Berkualitas

27 September 2025
Koperasi Desa Merah Putih

Koperasi Desa Merah Putih Berperan Bagi Pemerataan Akses Energi Bersih

26 September 2025
  • Tentang Kami
  • Hubungi Kami
  • Pedoman Media Siber
  • Layanan Bisnis
Copyright © 2016 - PT Inovasi Muda Mandiri. All rights reserved
No Result
View All Result
  • News
  • Technopreneur
  • Creativepreneur
  • Sociopreneur
  • Innovation
  • Youth Development

Copyright © 2016 - PT Inovasi Muda Mandiri. All rights reserved

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.
Go to mobile version