24 4

lxp

lxpp

AI & ML interests

None yet

Recent Activity

upvoted a paper 5 days ago

DV-World: Benchmarking Data Visualization Agents in Real-World Scenarios

updated a dataset 13 days ago

NJU-LINK/WebCompass

upvoted a paper 13 days ago

WebCompass: Towards Multimodal Web Coding Evaluation for Code Language Models

View all activity

Organizations

upvoted a paper 5 days ago

DV-World: Benchmarking Data Visualization Agents in Real-World Scenarios

Paper • 2604.25914 • Published 6 days ago • 40

updated a dataset 13 days ago

NJU-LINK/WebCompass

Viewer • Updated 2 days ago • 933 • 3.69k • 6

upvoted a paper 13 days ago

WebCompass: Towards Multimodal Web Coding Evaluation for Code Language Models

Paper • 2604.18224 • Published 14 days ago • 22

upvoted a paper 17 days ago

DR^{3}-Eval: Towards Realistic and Reproducible Deep Research Evaluation

Paper • 2604.14683 • Published 18 days ago • 36

upvoted a paper 20 days ago

CodeTracer: Towards Traceable Agent States

Paper • 2604.11641 • Published 21 days ago • 38

liked a dataset 27 days ago

NJU-LINK/WebCompass

Viewer • Updated 2 days ago • 933 • 3.69k • 6

published a dataset 27 days ago

NJU-LINK/WebCompass

Viewer • Updated 2 days ago • 933 • 3.69k • 6

upvoted a paper 2 months ago

CMI-RewardBench: Evaluating Music Reward Models with Compositional Multimodal Instruction

Paper • 2603.00610 • Published Feb 28 • 35

upvoted 3 papers 3 months ago

upvoted a paper 4 months ago

T2AV-Compass: Towards Unified Evaluation for Text-to-Audio-Video Generation

Paper • 2512.21094 • Published Dec 24, 2025 • 25

upvoted 2 collections 4 months ago

M-A-P Full Paper List

Collection

27 items • Updated Dec 16, 2025 • 13

Video Captioning

Collection

2 items • Updated Dec 5, 2025 • 2

upvoted 6 papers 5 months ago

AutoMV: An Automatic Multi-Agent System for Music Video Generation

Paper • 2512.12196 • Published Dec 13, 2025 • 7

NL2Repo-Bench: Towards Long-Horizon Repository Generation Evaluation of Coding Agents

Paper • 2512.12730 • Published Dec 14, 2025 • 52

DAComp: Benchmarking Data Agents across the Full Data Intelligence Lifecycle

Paper • 2512.04324 • Published Dec 3, 2025 • 159

ViDiC: Video Difference Captioning

Paper • 2512.03405 • Published Dec 3, 2025 • 28

How Far Are We from Genuinely Useful Deep Research Agents?

Paper • 2512.01948 • Published Dec 1, 2025 • 58

From Code Foundation Models to Agents and Applications: A Practical Guide to Code Intelligence

Paper • 2511.18538 • Published Nov 23, 2025 • 304

lxp

AI & ML interests

Recent Activity

Organizations

lxpp's activity