1 305 44

jasonjiang

mikinyaa

jasonjiang8866

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 hour ago

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

upvoted a paper about 1 hour ago

δ-mem: Efficient Online Memory for Large Language Models

upvoted a paper about 24 hours ago

Qwen-Image-2.0 Technical Report

View all activity

Organizations

None yet

upvoted 2 papers about 1 hour ago

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

Paper • 2605.10899 • Published 2 days ago • 56

δ-mem: Efficient Online Memory for Large Language Models

Paper • 2605.12357 • Published 1 day ago • 65

upvoted a paper about 24 hours ago

Qwen-Image-2.0 Technical Report

Paper • 2605.10730 • Published 2 days ago • 87

upvoted a paper 4 days ago

Audio-Visual Intelligence in Large Foundation Models

Paper • 2605.04045 • Published 8 days ago • 30

upvoted 2 papers 7 days ago

Beyond SFT-to-RL: Pre-alignment via Black-Box On-Policy Distillation for Multimodal RL

Paper • 2604.28123 • Published 12 days ago • 47

OceanPile: A Large-Scale Multimodal Ocean Corpus for Foundation Models

Paper • 2605.00877 • Published 18 days ago • 15

upvoted a paper 8 days ago

Web2BigTable: A Bi-Level Multi-Agent LLM System for Internet-Scale Information Search and Extraction

Paper • 2604.27221 • Published 14 days ago • 38

upvoted a paper 9 days ago

Stochastic KV Routing: Enabling Adaptive Depth-Wise Cache Sharing

Paper • 2604.22782 • Published Apr 3 • 8

upvoted a paper 10 days ago

Claw-Eval-Live: A Live Agent Benchmark for Evolving Real-World Workflows

Paper • 2604.28139 • Published 13 days ago • 42

upvoted 3 papers 13 days ago

Mutual Forcing: Dual-Mode Self-Evolution for Fast Autoregressive Audio-Video Character Generation

Paper • 2604.25819 • Published 15 days ago • 17

SketchVLM: Vision language models can annotate images to explain thoughts and guide users

Paper • 2604.22875 • Published 20 days ago • 35

dWorldEval: Scalable Robotic Policy Evaluation via Discrete Diffusion World Model

Paper • 2604.22152 • Published 19 days ago • 5

upvoted a paper 14 days ago

Recursive Multi-Agent Systems

Paper • 2604.25917 • Published 15 days ago • 264

liked 2 models 15 days ago

cyankiwi/Qwen3.5-27B-AWQ-BF16-INT4

Image-Text-to-Text • 28B • Updated Apr 10 • 19k • 49

kai-os/Carnice-V2-27b-GGUF

27B • Updated 18 days ago • 141k • 96

upvoted 2 papers 15 days ago

Reward Hacking in the Era of Large Models: Mechanisms, Emergent Misalignment, Challenges

Paper • 2604.13602 • Published 28 days ago • 32

Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond

Paper • 2604.22748 • Published 19 days ago • 226

upvoted 2 papers 16 days ago

EvoMaster: A Foundational Agent Framework for Building Evolving Autonomous Scientific Agents at Scale

Paper • 2604.17406 • Published 24 days ago • 6

PlayCoder: Making LLM-Generated GUI Code Playable

Paper • 2604.19742 • Published 22 days ago • 26

liked a model 17 days ago

groxaxo/Qwen3.6-27B-GPTQ-Pro-4bit

Image-Text-to-Text • 27B • Updated 20 days ago • 152k • 35

jasonjiang

AI & ML interests

Recent Activity

Organizations

mikinyaa's activity