QVAC Genesis II: Standar Baru untuk Pelatihan AI dengan 148 Miliar Token

robot
Pembuatan abstrak sedang berlangsung

Data Tether telah mengambil langkah signifikan menuju pembelajaran terbuka dengan memperkenalkan QVAC Genesis II – kumpulan data edukasi sebesar 148 miliar token yang mencakup 19 bidang akademik. Versi sebelumnya, Genesis I, berisi 41 miliar token, yang berarti peningkatan lebih dari 150 persen, memposisikan solusi ini sebagai kumpulan data pelatihan sintetis terbesar yang tersedia secara publik di dunia.

Mengapa 148 Miliar Token adalah Perubahan Permainan?

Sebagian besar kumpulan data pelatihan AI modern tetap tertutup dalam sistem proprietari, membatasi akses bagi peneliti independen dan institusi akademik. Genesis II mengubah dinamika ini dengan menyediakan kumpulan data besar-besaran di bawah lisensi Creative Commons Attribution–NonCommercial 4.0. Skala 148 miliar token ini memungkinkan pelatihan model yang memahami hal-hal secara lebih mendalam – tidak hanya memprediksi teks, tetapi juga menjelaskan pilihan dan penalaran mereka.

Data Tether mengusulkan metode baru yang disebut Option-Level Reasoning. Alih-alih menganggap jawaban yang benar dalam tes pilihan ganda sebagai satu-satunya jalur pembelajaran, teknik ini menganalisis setiap opsi – baik yang benar maupun kepercayaan keliru yang umum. Dengan cara ini, model belajar mengenali mengapa jawaban tertentu gagal, bukan hanya mengingat mana yang benar.

Struktur dan Ketersediaan

Kumpulan data ini mencakup 19 bidang akademik dan berfokus pada kedalaman penalaran edukatif. Setiap elemen dibuat dengan mempertimbangkan nilai edukatif – menggabungkan analisis kegagalan dengan Option-Level Reasoning dalam proses validasi dua langkah. Genesis II tersedia melalui platform Hugging Face lengkap dengan dokumentasi dan alat-alatnya.

Pengujian independen menunjukkan bahwa model yang dilatih pada Genesis II mencapai akurasi yang lebih tinggi dalam penalaran dan memberikan penjelasan dengan cara yang lebih konsisten. Perpindahan dari kefasihan superfisial ke pemahaman struktural ini merupakan perbedaan kunci.

Visi AI Terdesentralisasi

Paolo Ardoino, CEO Tether, menekankan filosofi proyek ini: “Sebagian besar pelatihan AI saat ini mengoptimalkan kelancaran, bukan pemahaman. Melalui publikasi ini, kami melangkah lebih jauh – kami menekankan struktur, penalaran, dan kejelasan.” Penyediaan terbuka 148 miliar token ini memungkinkan peneliti membangun sistem AI tanpa bergantung pada platform cloud terpusat.

Inisiatif ini mendukung pengembangan AI yang terdesentralisasi dan menghilangkan hambatan struktural yang dihadapi oleh kelompok penelitian yang lebih kecil. Seiring ekspansi AI ke bidang pendidikan, ilmu pengetahuan, dan layanan keuangan, pentingnya kumpulan data pelatihan yang terbuka, dapat dijelaskan, dan andal akan meningkat – dan Genesis II menetapkan standar baru untuk kategori ini.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan

Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)