reasoning - a dapumptu Collection

dapumptu 's Collections

adavanced learning

reasoning

updated Dec 25, 2024

B-STaR: Monitoring and Balancing Exploration and Exploitation in Self-Taught Reasoners

Paper • 2412.17256 • Published Dec 23, 2024 • 47