2025-08-15 04:35:00

sim. mas eu não acho que isso resultará no mesmo modelo. a política que o sonnet 3.6 aprendeu com RL é otimizada para sua própria arquitetura/inicialização

DON2.77%

THINK-2.89%

IN0.78%

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

18 gostos

Recompensa
18
7
Republicar
Partilhar

Comentar

0/400

MeltdownSurvivalist

· 3h atrás

A inicialização do modelo é realmente muito mística.

Ver originalResponder0

down_only_larry

· 4h atrás

A compatibilidade da arquitetura é realmente difícil de dizer.

Ver originalResponder0

CryptoSourGrape

· 08-15 05:04

Se eu soubesse que poderia otimizar a este nível, teria sido ótimo. Uhuu.

Ver originalResponder0

ArbitrageBot

· 08-15 05:03

Otimize o quê? Quem é que vê quando dá errado?

Ver originalResponder0

alpha_leaker

· 08-15 04:53

A inicialização é diferente, não consegui entender muito bem.

Ver originalResponder0

NFTFreezer

· 08-15 04:44

É uma pena, apenas otimizou para 3.6.

Ver originalResponder0

GmGmNoGn

· 08-15 04:41

Ah, você está certo, essa parte do modelo é bem confusa.

Ver originalResponder0

Tópico
#July PPI Beats Expectations
41k Popularidade
#ETH ETFs Top $30B
43k Popularidade
#Gate Alpha Peak Trading Competition
147k Popularidade
#Gate Releases August Reserves Report
19k Popularidade
#BTC Hits New ATH
89k Popularidade

Pino