ya. tetapi saya tidak berpikir itu akan menghasilkan model yang sama. kebijakan yang dipelajari sonnet 3.6 dari RL dioptimalkan untuk arsitektur/inisialisasi miliknya sendiri.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
20 Suka
Hadiah
20
8
Posting ulang
Bagikan
Komentar
0/400
LiquidatedAgain
· 08-18 03:38
Melihat tetapi tidak mengatakannya, masih ingin buy the dip tetapi Likuidasi
Lihat AsliBalas0
MeltdownSurvivalist
· 08-17 17:50
Inisialisasi model ini terlalu mistis, ya?
Lihat AsliBalas0
down_only_larry
· 08-17 16:23
Kesesuaian arsitektur ini benar-benar sulit untuk dikatakan
Lihat AsliBalas0
CryptoSourGrape
· 08-15 05:04
Seandainya saya tahu bahwa bisa dioptimalkan sampai sejauh ini, wah.
Lihat AsliBalas0
ArbitrageBot
· 08-15 05:03
Optimasi apaan, cuma buat dilihat siapa?
Lihat AsliBalas0
alpha_leaker
· 08-15 04:53
Inisialisasi berbeda, saya tidak begitu mengerti
Lihat AsliBalas0
NFTFreezer
· 08-15 04:44
Rasanya sedikit disayangkan, hanya dioptimalkan sampai 3.6
Lihat AsliBalas0
GmGmNoGn
· 08-15 04:41
Ah, benar juga, bagian model ini cukup membingungkan.
ya. tetapi saya tidak berpikir itu akan menghasilkan model yang sama. kebijakan yang dipelajari sonnet 3.6 dari RL dioptimalkan untuk arsitektur/inisialisasi miliknya sendiri.