11 h sitten
Tämä Meta-paperi vain rikkoi aivoni 🤯 Kaikki ovat kouluttaneet RL-malleja sokeasti ja tuhlanneet 100k+ GPU-tuntia toivoen, että jokin toimii. ScaleRL muuttaa kaiken, mitä voit nyt ennustaa onnistumisen ensimmäisestä päivästä lähtien. He testasivat 400 000 GPU-tuntia kaikilla tärkeimmillä menetelmillä ja löysivät piilotetun kaavan: Anna kun selitän ↓
Näytä alkuperäinen
6,57 t.
37
Tällä sivulla näytettävä sisältö on kolmansien osapuolten tarjoamaa. Ellei toisin mainita, OKX ei ole lainatun artikkelin / lainattujen artikkelien kirjoittaja, eikä OKX väitä olevansa materiaalin tekijänoikeuksien haltija. Sisältö on tarkoitettu vain tiedoksi, eikä se edusta OKX:n näkemyksiä. Sitä ei ole tarkoitettu minkäänlaiseksi suositukseksi, eikä sitä tule pitää sijoitusneuvontana tai kehotuksena ostaa tai myydä digitaalisia varoja. Siltä osin kuin yhteenvetojen tai muiden tietojen tuottamiseen käytetään generatiivista tekoälyä, tällainen tekoälyn tuottama sisältö voi olla epätarkkaa tai epäjohdonmukaista. Lue aiheesta lisätietoa linkitetystä artikkelista. OKX ei ole vastuussa kolmansien osapuolten sivustojen sisällöstä. Digitaalisten varojen, kuten vakaakolikoiden ja NFT:iden, omistukseen liittyy suuri riski, ja niiden arvo voi vaihdella merkittävästi. Sinun tulee huolellisesti harkita, sopiiko digitaalisten varojen treidaus tai omistus sinulle taloudellisessa tilanteessasi.