ya. tetapi saya tidak berpikir itu akan menghasilkan model yang sama. kebijakan yang dipelajari sonnet 3.6 dari RL dioptimalkan untuk arsitektur/inisialisasi miliknya sendiri.

DON-1.44%
THINK-6.87%
IN1.24%
OWN0.14%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 8
  • Posting ulang
  • Bagikan
Komentar
0/400
LiquidatedAgainvip
· 08-18 03:38
Melihat tetapi tidak mengatakannya, masih ingin buy the dip tetapi Likuidasi
Lihat AsliBalas0
MeltdownSurvivalistvip
· 08-17 17:50
Inisialisasi model ini terlalu mistis, ya?
Lihat AsliBalas0
down_only_larryvip
· 08-17 16:23
Kesesuaian arsitektur ini benar-benar sulit untuk dikatakan
Lihat AsliBalas0
CryptoSourGrapevip
· 08-15 05:04
Seandainya saya tahu bahwa bisa dioptimalkan sampai sejauh ini, wah.
Lihat AsliBalas0
ArbitrageBotvip
· 08-15 05:03
Optimasi apaan, cuma buat dilihat siapa?
Lihat AsliBalas0
alpha_leakervip
· 08-15 04:53
Inisialisasi berbeda, saya tidak begitu mengerti
Lihat AsliBalas0
NFTFreezervip
· 08-15 04:44
Rasanya sedikit disayangkan, hanya dioptimalkan sampai 3.6
Lihat AsliBalas0
GmGmNoGnvip
· 08-15 04:41
Ah, benar juga, bagian model ini cukup membingungkan.
Lihat AsliBalas0
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)