Shaobai Jiang's picture

Shaobai Jiang

shaobaij

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 hour ago

SWE-Universe: Scale Real-World Verifiable Environments to Millions

upvoted a paper about 1 hour ago

Good SFT Optimizes for SFT, Better SFT Prepares for Reinforcement Learning

upvoted a paper about 24 hours ago

Vision-DeepResearch: Incentivizing DeepResearch Capability in Multimodal Large Language Models

View all activity

Organizations

None yet

upvoted 2 papers about 1 hour ago

SWE-Universe: Scale Real-World Verifiable Environments to Millions

Paper • 2602.02361 • Published 2 days ago • 48

Good SFT Optimizes for SFT, Better SFT Prepares for Reinforcement Learning

Paper • 2602.01058 • Published 4 days ago • 37

upvoted a paper about 24 hours ago

Vision-DeepResearch: Incentivizing DeepResearch Capability in Multimodal Large Language Models

Paper • 2601.22060 • Published 6 days ago • 140

upvoted 5 papers 1 day ago

Golden Goose: A Simple Trick to Synthesize Unlimited RLVR Tasks from Unverifiable Internet Text

Paper • 2601.22975 • Published 5 days ago • 75

How AI Impacts Skill Formation

Paper • 2601.20245 • Published 8 days ago • 8

Qwen3-ASR Technical Report

Paper • 2601.21337 • Published 7 days ago • 32

Kimi K2.5: Visual Agentic Intelligence

Paper • 2602.02276 • Published 2 days ago • 182

Quantization-Aware Distillation for NVFP4 Inference Accuracy Recovery

Paper • 2601.20088 • Published 8 days ago • 1

upvoted 6 papers 2 days ago

DynamicVLA: A Vision-Language-Action Model for Dynamic Object Manipulation

Paper • 2601.22153 • Published 6 days ago • 68

ECO: Quantized Training without Full-Precision Master Weights

Paper • 2601.22101 • Published 6 days ago • 6

FineInstructions: Scaling Synthetic Instructions to Pre-Training Scale

Paper • 2601.22146 • Published 6 days ago • 8

Corrective Diffusion Language Models

Paper • 2512.15596 • Published Dec 17, 2025 • 1

JUST-DUB-IT: Video Dubbing via Joint Audio-Visual Diffusion

Paper • 2601.22143 • Published 6 days ago • 5

STEP3-VL-10B Technical Report

Paper • 2601.09668 • Published 21 days ago • 193

upvoted 4 papers 3 days ago

Reasoning Models Generate Societies of Thought

Paper • 2601.10825 • Published 20 days ago • 14

Idea2Story: An Automated Pipeline for Transforming Research Concepts into Complete Scientific Narratives

Paper • 2601.20833 • Published 7 days ago • 171

K2-V2: A 360-Open, Reasoning-Enhanced LLM

Paper • 2512.06201 • Published Dec 5, 2025 • 2

LongCat-Image Technical Report

Paper • 2512.07584 • Published Dec 8, 2025 • 23

upvoted 2 papers 4 days ago

ConceptMoE: Adaptive Token-to-Concept Compression for Implicit Compute Allocation

Paper • 2601.21420 • Published 7 days ago • 41

The Sparse Frontier: Sparse Attention Trade-offs in Transformer LLMs

Paper • 2504.17768 • Published Apr 24, 2025 • 14