Ximing Lu's picture

3 7

Ximing Lu

Ximing

·

AI & ML interests

None yet

Recent Activity

authored a paper 4 days ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

upvoted a paper 4 days ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

upvoted a paper about 1 month ago

ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration

View all activity

Organizations

Ximing 's models

None public yet