Zixuan Yang's picture

4

Zixuan Yang

Luli3220

https://luli3220.github.io/

Luli3220

AI & ML interests

Post Training、RL

Recent Activity

upvoted a paper 21 days ago

When Tools Fail: Benchmarking Dynamic Replanning and Anomaly Recovery in LLM Agents

authored a paper 28 days ago

MERIT: Matching Expertise via Rubric-Informed Training for Reviewer Assignment

updated a model 28 days ago

Luli3220/MERIT-4B-reviewer-assessor

View all activity

Organizations

None yet

upvoted a paper 21 days ago

When Tools Fail: Benchmarking Dynamic Replanning and Anomaly Recovery in LLM Agents

Paper • 2606.05806 • Published 25 days ago • 23

authored a paper 28 days ago

MERIT: Matching Expertise via Rubric-Informed Training for Reviewer Assignment

Paper • 2605.27865 • Published May 27 • 1

updated a model 28 days ago

Luli3220/MERIT-4B-reviewer-assessor

4B • Updated 28 days ago • 13

upvoted a paper 29 days ago

MERIT: Matching Expertise via Rubric-Informed Training for Reviewer Assignment

Paper • 2605.27865 • Published May 27 • 1

updated a dataset 29 days ago

Luli3220/MERIT

Preview • Updated 29 days ago • 42

published a dataset 29 days ago

Luli3220/MERIT

Preview • Updated 29 days ago • 42

updated a model 29 days ago

Luli3220/MERIT-8B-retriever

Updated 29 days ago

published 2 models 29 days ago

Luli3220/MERIT-8B-retriever

Updated 29 days ago

Luli3220/MERIT-4B-reviewer-assessor

4B • Updated 28 days ago • 13

upvoted 2 papers about 1 month ago

Retrieval, Reward, and Training Protocols: What Matters in Training Search Agents?

Paper • 2605.27881 • Published May 27 • 10

Skill0.5: Joint Skill Internalization and Utilization for Out-of-Distribution Generalization in Agentic Reinforcement Learning

Paper • 2605.28424 • Published May 27 • 32