sim. mas eu não acho que isso resultará no mesmo modelo. a política que o sonnet 3.6 aprendeu com RL é otimizada para sua própria arquitetura/inicialização
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
18 gostos
Recompensa
18
7
Republicar
Partilhar
Comentar
0/400
MeltdownSurvivalist
· 3h atrás
A inicialização do modelo é realmente muito mística.
Ver originalResponder0
down_only_larry
· 4h atrás
A compatibilidade da arquitetura é realmente difícil de dizer.
Ver originalResponder0
CryptoSourGrape
· 08-15 05:04
Se eu soubesse que poderia otimizar a este nível, teria sido ótimo. Uhuu.
Ver originalResponder0
ArbitrageBot
· 08-15 05:03
Otimize o quê? Quem é que vê quando dá errado?
Ver originalResponder0
alpha_leaker
· 08-15 04:53
A inicialização é diferente, não consegui entender muito bem.
Ver originalResponder0
NFTFreezer
· 08-15 04:44
É uma pena, apenas otimizou para 3.6.
Ver originalResponder0
GmGmNoGn
· 08-15 04:41
Ah, você está certo, essa parte do modelo é bem confusa.
sim. mas eu não acho que isso resultará no mesmo modelo. a política que o sonnet 3.6 aprendeu com RL é otimizada para sua própria arquitetura/inicialização