Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2512.21859

lusxvr/nanoVLM-222M

Image-Text-to-Text • 0.2B • Updated May 8, 2025 • 345 • 98
Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning

Paper • 2503.09516 • Published Mar 12, 2025 • 36
AlphaOne: Reasoning Models Thinking Slow and Fast at Test Time

Paper • 2505.24863 • Published May 30, 2025 • 97
QwenLong-L1: Towards Long-Context Large Reasoning Models with Reinforcement Learning

Paper • 2505.17667 • Published May 23, 2025 • 88

LLM system design

TimeBill: Time-Budgeted Inference for Large Language Models

Paper • 2512.21859 • Published 6 days ago • 18

about 11 hours ago

openai/gpt-oss-120b

Text Generation • 120B • Updated Aug 26, 2025 • 3.67M • • 4.31k
Emergent temporal abstractions in autoregressive models enable hierarchical reinforcement learning

Paper • 2512.20605 • Published 9 days ago • 59
Nested Browser-Use Learning for Agentic Information Seeking

Paper • 2512.23647 • Published 3 days ago • 11
TimeBill: Time-Budgeted Inference for Large Language Models

Paper • 2512.21859 • Published 6 days ago • 18

about 22 hours ago

TimeBill: Time-Budgeted Inference for Large Language Models

Paper • 2512.21859 • Published 6 days ago • 18

Guided Self-Evolving LLMs with Minimal Human Supervision

Paper • 2512.02472 • Published about 1 month ago • 50
DeepSearch: Overcome the Bottleneck of Reinforcement Learning with Verifiable Rewards via Monte Carlo Tree Search

Paper • 2509.25454 • Published Sep 29, 2025 • 140
Video Reasoning without Training

Paper • 2510.17045 • Published Oct 19, 2025 • 7
Agent Learning via Early Experience

Paper • 2510.08558 • Published Oct 9, 2025 • 269

Large Language Model (LLM) and NLP related papers.

LoRA+: Efficient Low Rank Adaptation of Large Models

Paper • 2402.12354 • Published Feb 19, 2024 • 7
The FinBen: An Holistic Financial Benchmark for Large Language Models

Paper • 2402.12659 • Published Feb 20, 2024 • 23
TofuEval: Evaluating Hallucinations of LLMs on Topic-Focused Dialogue Summarization

Paper • 2402.13249 • Published Feb 20, 2024 • 15
TrustLLM: Trustworthiness in Large Language Models

Paper • 2401.05561 • Published Jan 10, 2024 • 69

lusxvr/nanoVLM-222M

Image-Text-to-Text • 0.2B • Updated May 8, 2025 • 345 • 98
Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning

Paper • 2503.09516 • Published Mar 12, 2025 • 36
AlphaOne: Reasoning Models Thinking Slow and Fast at Test Time

Paper • 2505.24863 • Published May 30, 2025 • 97
QwenLong-L1: Towards Long-Context Large Reasoning Models with Reinforcement Learning

Paper • 2505.17667 • Published May 23, 2025 • 88

about 22 hours ago

TimeBill: Time-Budgeted Inference for Large Language Models

Paper • 2512.21859 • Published 6 days ago • 18

LLM system design

TimeBill: Time-Budgeted Inference for Large Language Models

Paper • 2512.21859 • Published 6 days ago • 18

Guided Self-Evolving LLMs with Minimal Human Supervision

Paper • 2512.02472 • Published about 1 month ago • 50
DeepSearch: Overcome the Bottleneck of Reinforcement Learning with Verifiable Rewards via Monte Carlo Tree Search

Paper • 2509.25454 • Published Sep 29, 2025 • 140
Video Reasoning without Training

Paper • 2510.17045 • Published Oct 19, 2025 • 7
Agent Learning via Early Experience

Paper • 2510.08558 • Published Oct 9, 2025 • 269

about 11 hours ago

openai/gpt-oss-120b

Text Generation • 120B • Updated Aug 26, 2025 • 3.67M • • 4.31k
Emergent temporal abstractions in autoregressive models enable hierarchical reinforcement learning

Paper • 2512.20605 • Published 9 days ago • 59
Nested Browser-Use Learning for Agentic Information Seeking

Paper • 2512.23647 • Published 3 days ago • 11
TimeBill: Time-Budgeted Inference for Large Language Models

Paper • 2512.21859 • Published 6 days ago • 18

Large Language Model (LLM) and NLP related papers.

LoRA+: Efficient Low Rank Adaptation of Large Models

Paper • 2402.12354 • Published Feb 19, 2024 • 7
The FinBen: An Holistic Financial Benchmark for Large Language Models

Paper • 2402.12659 • Published Feb 20, 2024 • 23
TofuEval: Evaluating Hallucinations of LLMs on Topic-Focused Dialogue Summarization

Paper • 2402.13249 • Published Feb 20, 2024 • 15
TrustLLM: Trustworthiness in Large Language Models

Paper • 2401.05561 • Published Jan 10, 2024 • 69

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs