Před 14 h
Tenhle článek na Metě mi prostě rozbil mozek 🤯 Všichni trénovali modely RL naslepo a promarnili 100k+ hodin GPU doufáním, že něco funguje. ScaleRL mění vše, co nyní můžete předpovídat úspěch od 1. dne. Otestovali 400 000 hodin GPU ve všech hlavních metodách a našli skrytý vzorec: Dovolte mi to vysvětlit ↓
Zobrazit originál
7,19 tis.
49
Obsah na této stránce poskytují třetí strany. Není-li uvedeno jinak, společnost OKX není autorem těchto informací a nenárokuje si u těchto materiálů žádná autorská práva. Obsah je poskytován pouze pro informativní účely a nevyjadřuje názory společnosti OKX. Nejedná se o doporučení jakéhokoli druhu a nemělo by být považováno za investiční poradenství ani nabádání k nákupu nebo prodeji digitálních aktiv. Tam, kde se k poskytování souhrnů a dalších informací používá generativní AI, může být vygenerovaný obsah nepřesný nebo nekonzistentní. Další podrobnosti a informace naleznete v připojeném článku. Společnost OKX neodpovídá za obsah, jehož hostitelem jsou externí weby. Držená digitální aktiva, včetně stablecoinů a tokenů NFT, zahrnují vysokou míru rizika a mohou značně kolísat. Měli byste pečlivě zvážit, zde je pro vás obchodování s digitálními aktivy nebo jejich držení vhodné z hlediska vaší finanční situace.