ab's picture

2

ab

Shenbixiaoxin

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

On-Policy Self-Distillation for Reasoning Compression

upvoted a paper 7 days ago

Overconfident Errors Need Stronger Correction: Asymmetric Confidence Penalties for Reinforcement Learning

View all activity

Organizations

None yet

upvoted a paper 1 day ago

On-Policy Self-Distillation for Reasoning Compression

Paper • 2603.05433 • Published 2 days ago • 4

upvoted a paper 7 days ago

Overconfident Errors Need Stronger Correction: Asymmetric Confidence Penalties for Reinforcement Learning

Paper • 2602.21420 • Published 11 days ago • 5