Tag: ReinforcementLearning
-
Tematy, o których teraz się mówi No158
GPT-5.1: jeszcze inteligentniejszy i bardziej rozmowny ChatGPT • Pakistańska gazeta przypadkowo wydrukowała prompt AI razem z artykułem • Project Euler matematyka spotyka programowanie • Jeden sprytny trik z hashowaniem • Jeden problem, siedem bibliotek na GPU
-
Tematy, o których teraz się mówi No153
Yann LeCun opuszcza Meta, by stworzyć start-up AI oparty na modelach świata • Indeksy i rozmiary w C powinny być typu signed • Hipotetyczna wyszukiwarka oparta na S3 z Tantivy i buforem NVMe • Empiryczna ocena testowania opartego na własnościach w Pythonie
-
Tematy, o których teraz się mówi No146
Odświeżanie infrastruktury Apache XML • Nieoczekiwane rzeczy, które są ludźmi • Toy Story, które pamiętasz • Inteligencja przestrzenna kolejny krok dla AI • Skondensowany przewodnik po haszowaniu w Rust
-
Tematy, o których teraz się mówi No135
Nie Umieraj na Chorobę Serca: Jak Technologia Pomaga Chronić Życie • Testy Sztucznej Inteligencji pod Lupą Benchmarki bez Naukowej Solidności • 1 Bilion USD Uciekł z Rynku Technologii, bo Inwestorzy Zwątpili w AI • Cerebras Code Obsługuje Teraz GLM 4.6 1000 Tokenów na Sekundę • Małe Modele Językowe Przyszłość Agentowej Sztucznej Inteligencji
-
Tematy, o których teraz się mówi No101
Modele rozumujące działają świetnie dopóki nie przestają • Dziwne atraktory: wizualizacja chaosu w działaniu • Oznaki introspekcji w dużych modelach językowych • Harmonogram pracy rotacyjnej w MiniZinc • Boty AI żądają skomentowanych skryptów
-
Tematy, o których teraz się mówi No94
Obietnica OpenAI pozostania w Kalifornii utorowała drogę do IPO • Crunchyroll niszczy swoje napisy • Composer: szybki model graniczny z uczeniem przez wzmacnianie • uv największa rewolucja w ekosystemie Pythona od dekady • Dokumenty CRDT w Redis z użyciem Automerge
-
Tematy, o których teraz się mówi No87
Wykorzystanie AI do negocjacji rachunku szpitalnego z 195 tys. USD do 33 tys. • EuroLLM europejski model językowy wspierający 24 języki UE • Witamina D zmniejsza częstość i czas trwania przeziębień u osób z niedoborem • Turniej pokera dla modeli językowych LLM • Krótka historia liczb losowych
-
Tematy, o których teraz się mówi No79
Błąd, który nauczył mnie więcej o PyTorch niż lata praktyki • Nakarm boty czyli jak walczyć z nieugaszonym apetytem AI • Formalne czy nieformalne? AI a przyszłość dowodzenia twierdzeń • Nauka języków regularnych z algorytmem RPNI • Prosty przepływ sterowania dla automatycznych agentów
-
Tematy, o których teraz się mówi No76
Tonę w funkcjach AI, o które nigdy nie prosiłem i mam tego dość • AI, Wikipedia i błędne tłumaczenia zagrożonych języków • FSF analizuje duże modele językowe i problemy licencyjne • Agent Lightning: trenowanie agentów przy użyciu RL bez zmian w kodzie • Fast TypeScript Analyzer: szybka analiza złożoności kodu
