🔄 In a Training Loop

6 89 3

Kailin Jiang

kailinjiang

https://kailinjiang.github.io/

kailinjiang

AI & ML interests

continual learning

Recent Activity

liked a dataset 3 days ago

rl-research/dr-tulu-rl-data

upvoted a paper 20 days ago

SpatialWorld: Benchmarking Interactive Spatial Reasoning of Multimodal Agents in Real-World Tasks

upvoted a paper 20 days ago

On the Geometry of On-Policy Distillation

View all activity

Organizations

liked a dataset 3 days ago

rl-research/dr-tulu-rl-data

Viewer • Updated Nov 25, 2025 • 4.88k • 439 • 14

upvoted 2 papers 20 days ago

SpatialWorld: Benchmarking Interactive Spatial Reasoning of Multimodal Agents in Real-World Tasks

Paper • 2606.09669 • Published 22 days ago • 46

On the Geometry of On-Policy Distillation

Paper • 2606.07082 • Published 25 days ago • 75

upvoted 3 papers about 1 month ago

Efficient Agentic Reinforcement Learning with On-Policy Intrinsic Knowledge Boundary Enhancement

Paper • 2605.26952 • Published May 26 • 16

Rethinking Cross-Layer Information Routing in Diffusion Transformers

Paper • 2605.20708 • Published May 20 • 111

Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps

Paper • 2605.16928 • Published May 16 • 97

upvoted a paper 4 months ago

MLLM-CL: Continual Learning for Multimodal Large Language Models

Paper • 2506.05453 • Published Jun 5, 2025 • 4

updated 3 datasets 5 months ago

updated a collection 5 months ago

MMEVOKE (ICLR26 🔥)

Collection

MMEVOKE introduces the first comprehensive benchmark and systematic evaluation framework designed to investigate multimodal evolving knowledge injecti • 4 items • Updated May 5 • 2

upvoted 2 papers 5 months ago

iFSQ: Improving FSQ for Image Generation with 1 Line of Code

Paper • 2601.17124 • Published Jan 23 • 34

MHLA: Restoring Expressivity of Linear Attention via Token-Level Multi-Head

Paper • 2601.07832 • Published Jan 12 • 53

upvoted 2 papers 6 months ago

Watching, Reasoning, and Searching: A Video Deep Research Benchmark on Open Web for Agentic Video Reasoning

Paper • 2601.06943 • Published Jan 11 • 215

AT^2PO: Agentic Turn-based Policy Optimization via Tree Search

Paper • 2601.04767 • Published Jan 8 • 28

published 2 models 6 months ago

kailinjiang/llava_1.5_13b_covariance_matrices_from_onevision_pre_64_seed_rank233_new222

Updated Dec 30, 2025

kailinjiang/llava_1.5_13b_covariance_matrices_from_onevision_pre_64_seed_rank233_new

Updated Dec 30, 2025

updated a model 6 months ago

kailinjiang/llava_1.5_7b_covariance_matrices_from_onevision_pre_64_seed_rank233

Updated Dec 30, 2025

published a model 6 months ago

kailinjiang/llava_1.5_7b_covariance_matrices_from_onevision_pre_64_seed_rank233

Updated Dec 30, 2025

liked a dataset 6 months ago

bigai/TongSIM-Asset

Updated Dec 29, 2025 • 856 • 276

Kailin Jiang

AI & ML interests

Recent Activity

Organizations

kailinjiang's activity