Anwar's picture

Anwar

abdoali5672

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 24 minutes ago

Rethinking Generalization in Reasoning SFT: A Conditional Analysis on Optimization, Data, and Model Capability

upvoted a paper 24 minutes ago

DataFlex: A Unified Framework for Data-Centric Dynamic Training of Large Language Models

upvoted a paper 28 minutes ago

Attention Sink in Transformers: A Survey on Utilization, Interpretation, and Mitigation

View all activity

Organizations

None yet

upvoted 2 papers 24 minutes ago

Rethinking Generalization in Reasoning SFT: A Conditional Analysis on Optimization, Data, and Model Capability

Paper • 2604.06628 • Published 9 days ago • 312

DataFlex: A Unified Framework for Data-Centric Dynamic Training of Large Language Models

Paper • 2603.26164 • Published 21 days ago • 353

upvoted a paper 28 minutes ago

Attention Sink in Transformers: A Survey on Utilization, Interpretation, and Mitigation

Paper • 2604.10098 • Published 6 days ago • 74

upvoted a paper 29 minutes ago

KnowRL: Boosting LLM Reasoning via Reinforcement Learning with Minimal-Sufficient Knowledge Guidance

Paper • 2604.12627 • Published 3 days ago • 94

upvoted 4 papers 9 days ago

Self-Distilled RLVR

Paper • 2604.03128 • Published 14 days ago • 160

LightThinker++: From Reasoning Compression to Memory Management

Paper • 2604.03679 • Published 13 days ago • 35

OpenWorldLib: A Unified Codebase and Definition of Advanced World Models

Paper • 2604.04707 • Published 11 days ago • 200

TriAttention: Efficient Long Reasoning with Trigonometric KV Compression

Paper • 2604.04921 • Published 11 days ago • 107

upvoted a paper 10 days ago

SpikingBrain Technical Report: Spiking Brain-inspired Large Models

Paper • 2509.05276 • Published Sep 5, 2025 • 5

upvoted a paper 11 days ago

Test-Time Scaling Makes Overtraining Compute-Optimal

Paper • 2604.01411 • Published 16 days ago • 28

upvoted 9 papers 14 days ago

SKILL0: In-Context Agentic Reinforcement Learning for Skill Internalization

Paper • 2604.02268 • Published 15 days ago • 93

Generative World Renderer

Paper • 2604.02329 • Published 15 days ago • 101

ClawKeeper: Comprehensive Safety Protection for OpenClaw Agents Through Skills, Plugins, and Watchers

Paper • 2603.24414 • Published 23 days ago • 183

Dynin-Omni: Omnimodal Unified Large Diffusion Language Model

Paper • 2604.00007 • Published Mar 9 • 19

Data Darwinism Part I: Unlocking the Value of Scientific Data for Pre-training

Paper • 2602.07824 • Published Feb 8 • 18

daVinci-LLM:Towards the Science of Pretraining

Paper • 2603.27164 • Published 20 days ago • 33

LongCat-Next: Lexicalizing Modalities as Discrete Tokens

Paper • 2603.27538 • Published 19 days ago • 143

FIPO: Eliciting Deep Reasoning with Future-KL Influenced Policy Optimization

Paper • 2603.19835 • Published 28 days ago • 337

Terminal Agents Suffice for Enterprise Automation

Paper • 2604.00073 • Published 17 days ago • 95

upvoted a paper 16 days ago

TAPS: Task Aware Proposal Distributions for Speculative Sampling

Paper • 2603.27027 • Published 20 days ago • 142