15ore fa
Questo documento di Meta mi ha appena fatto impazzire 🤯 Tutti hanno addestrato modelli RL alla cieca, sprecando oltre 100k ore GPU sperando che qualcosa funzionasse. ScaleRL cambia tutto, ora puoi prevedere il successo fin dal primo giorno. Hanno testato 400.000 ore GPU su ogni metodo principale e hanno trovato il modello nascosto: Lasciami spiegare ↓
Mostra originale
7.193
49
Il contenuto di questa pagina è fornito da terze parti. Salvo diversa indicazione, OKX non è l'autore degli articoli citati e non rivendica alcun copyright sui materiali. Il contenuto è fornito solo a scopo informativo e non rappresenta le opinioni di OKX. Non intende essere un'approvazione di alcun tipo e non deve essere considerato un consiglio di investimento o una sollecitazione all'acquisto o alla vendita di asset digitali. Nella misura in cui l'IA generativa viene utilizzata per fornire riepiloghi o altre informazioni, tale contenuto generato dall'IA potrebbe essere impreciso o incoerente. Leggi l'articolo collegato per ulteriori dettagli e informazioni. OKX non è responsabile per i contenuti ospitati su siti di terze parti. Gli holding di asset digitali, tra cui stablecoin e NFT, comportano un elevato grado di rischio e possono fluttuare notevolmente. Dovresti valutare attentamente se effettuare il trading o detenere asset digitali è adatto a te alla luce della tua situazione finanziaria.