1 12

Shihua Zhang

SuhZhang

AI & ML interests

None yet

Recent Activity

updated a dataset about 9 hours ago

SuhZhang/VideoBridge_dataset

updated a model about 17 hours ago

SuhZhang/VideoBridge_dataset

upvoted a paper 3 days ago

Vision-Language-Action Safety: Threats, Challenges, Evaluations, and Mechanisms

View all activity

Organizations

None yet

updated a dataset about 9 hours ago

SuhZhang/VideoBridge_dataset

Updated about 9 hours ago • 63 • 1

updated a model about 17 hours ago

SuhZhang/VideoBridge_dataset

Updated about 15 hours ago

upvoted a paper 3 days ago

Vision-Language-Action Safety: Threats, Challenges, Evaluations, and Mechanisms

Paper • 2604.23775 • Published 5 days ago • 43

published a model 18 days ago

SuhZhang/VideoBridge_dataset

Updated about 15 hours ago

upvoted a paper 21 days ago

DMax: Aggressive Parallel Decoding for dLLMs

Paper • 2604.08302 • Published 22 days ago • 51

upvoted 2 papers 26 days ago

Gated Condition Injection without Multimodal Attention: Towards Controllable Linear-Attention Transformers

Paper • 2603.27666 • Published Mar 29 • 18

AutoMIA: Improved Baselines for Membership Inference Attack via Agentic Self-Exploration

Paper • 2604.01014 • Published 29 days ago • 11

New activity in SuhZhang/GeoSR-Model 30 days ago

Add pipeline tag and link to paper

#1 opened 30 days ago by

nielsr

authored a paper about 1 month ago

Make Geometry Matter for Spatial Reasoning

Paper • 2603.26639 • Published Mar 27 • 32

upvoted a paper about 1 month ago

Make Geometry Matter for Spatial Reasoning

Paper • 2603.26639 • Published Mar 27 • 32

published a dataset about 1 month ago

SuhZhang/VideoBridge_dataset

Updated about 9 hours ago • 63 • 1

updated a model about 1 month ago

SuhZhang/GeoSR-Model

Image-Text-to-Text • Updated 30 days ago • 1

published a model about 1 month ago

SuhZhang/GeoSR-Model

Image-Text-to-Text • Updated 30 days ago • 1

upvoted 2 papers about 1 month ago

Anatomy of a Lie: A Multi-Stage Diagnostic Framework for Tracing Hallucinations in Vision-Language Models

Paper • 2603.15557 • Published Mar 16 • 29

ViFeEdit: A Video-Free Tuner of Your Video Diffusion Transformer

Paper • 2603.15478 • Published Mar 16 • 24

upvoted a paper 2 months ago

dVoting: Fast Voting for dLLMs

Paper • 2602.12153 • Published Feb 12 • 22

upvoted a paper 4 months ago

SpotEdit: Selective Region Editing in Diffusion Transformers

Paper • 2512.22323 • Published Dec 26, 2025 • 39

upvoted 2 papers 5 months ago

Vision Bridge Transformer at Scale

Paper • 2511.23199 • Published Nov 28, 2025 • 46

In-Video Instructions: Visual Signals as Generative Control

Paper • 2511.19401 • Published Nov 24, 2025 • 32

upvoted a paper 7 months ago

MixReasoning: Switching Modes to Think

Paper • 2510.06052 • Published Oct 7, 2025 • 23

Shihua Zhang

AI & ML interests

Recent Activity

Organizations

SuhZhang's activity

Add pipeline tag and link to paper