R Gonzalez

rgonzalez21

14 19

AI & ML interests

None yet

Recent Activity

liked a model 2 days ago

timaeus/rl-lm-pythia160m-sentiment-pos-beta0-grpo-nostd-gs4-tp1-tk0-pt80000-steerDotIncL1c512s16-seed21

upvoted a paper 14 days ago

Looped World Models

liked a model 15 days ago

dev-willbird1936/gguf-vocab-poc

View all activity

Organizations

None yet

liked a model 2 days ago

timaeus/rl-lm-pythia160m-sentiment-pos-beta0-grpo-nostd-gs4-tp1-tk0-pt80000-steerDotIncL1c512s16-seed21

Updated 2 days ago • 1

upvoted a paper 14 days ago

Looped World Models

Paper • 2606.18208 • Published 20 days ago • 476

liked a model 15 days ago

dev-willbird1936/gguf-vocab-poc

Updated 15 days ago • 1

liked a model about 1 month ago

Qwen/Qwen2.5-7B-Instruct

Text Generation • 8B • Updated Jan 12, 2025 • 12.8M • • 1.4k

upvoted a paper about 1 month ago

PhoneWorld: Scaling Phone-Use Agent Environments

Paper • 2605.29486 • Published May 28 • 11

liked a model about 1 month ago

gulnawaz123/Full_Tokenizer_30m_1

3.96M • Updated Jun 2 • 2 • 1

upvoted a paper about 1 month ago

DRIFT: Decoupled Rollouts and Importance-Weighted Fine-Tuning for Efficient Multi-Turn Optimization

Paper • 2605.31455 • Published May 29 • 6

liked 2 datasets about 1 month ago

hhbbbariii/gt

Updated about 2 hours ago • 7.35k • 6

openai/gsm8k

Benchmark • Updated Mar 23 • 17.6k • 947k • 1.42k

liked 2 models about 1 month ago

AAAAnsah/Qwen2.5-14B-Instruct_VACC1_BMA_RFA_super-theta_-0.4_sub-theta_0.4

Updated May 27 • 1

tencent/Hy-MT2-30B-A3B

Translation • 30B • Updated May 26 • 23.6k • 466

upvoted a paper about 1 month ago

Perception or Prejudice: Can MLLMs Go Beyond First Impressions of Personality?

Paper • 2605.22109 • Published May 21 • 171

liked a model about 1 month ago

tencent/Hy-MT2-1.8B

Translation • 2B • Updated May 26 • 30.8k • • 1.14k

liked a dataset about 1 month ago

BAAI/Infinity-Instruct

Viewer • Updated Dec 4, 2025 • 21.9M • 3.07k • 733

upvoted 3 papers about 2 months ago

Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information

Paper • 2605.11609 • Published May 12 • 196

Harnessing LLM Agents with Skill Programs

Paper • 2605.17734 • Published May 18 • 36

CiteVQA: Benchmarking Evidence Attribution for Trustworthy Document Intelligence

Paper • 2605.12882 • Published May 13 • 274

liked 3 models about 2 months ago

R Gonzalez

AI & ML interests

Recent Activity

Organizations

rgonzalez21's activity