Fu-En Yang's picture

182

Fu-En Yang

FuEnYang

·

https://fuenyang1127.github.io/

AI & ML interests

Computer Vision, Deep Learning, Vision-Language Models (VLMs), Vision-Language-Action Models (VLAs), Reasoning Models, Embodied AI

Recent Activity

upvoted a paper about 12 hours ago

DreamID-V:Bridging the Image-to-Video Gap for High-Fidelity Face Swapping via Diffusion Transformer

upvoted a paper about 12 hours ago

Taming Hallucinations: Boosting MLLMs' Video Understanding via Counterfactual Video Generation

upvoted a paper about 12 hours ago

LTX-2: Efficient Joint Audio-Visual Foundation Model

View all activity

Organizations

Papers 5

arxiv:2507.16815

arxiv:2503.21781

arxiv:2502.13234

arxiv:2311.17717

models 0

None public yet

datasets 0

None public yet