Fanqi Wan

Wanfq

https://fanqiwan.github.io/

AI & ML interests

Large Language Models, Model Fusion, Reasoning, Alignment

Recent Activity

liked a model 19 days ago

XiaomiMiMo/MiMo-V2.5-Pro-Base

liked a model 23 days ago

deepseek-ai/DeepSeek-V4-Pro

new activity about 2 months ago

stepfun-ai/Step-3.5-Flash-SFT:⚠️ Benchmark Leaks

View all activity

Organizations

liked a model 19 days ago

XiaomiMiMo/MiMo-V2.5-Pro-Base

Text Generation • 1T • Updated 9 days ago • 1.81k • 36

liked a model 23 days ago

deepseek-ai/DeepSeek-V4-Pro

Text Generation • 862B • Updated 11 days ago • 3.14M • • 4k

New activity in stepfun-ai/Step-3.5-Flash-SFT about 2 months ago

⚠️ Benchmark Leaks

🔥 3

#12 opened about 2 months ago by

NikolaiSkripko

liked a dataset 2 months ago

stepfun-ai/Step-3.5-Flash-SFT

Viewer • Updated Mar 14 • 1.62M • 11.2k • 333

liked a model 2 months ago

stepfun-ai/Step-3.5-Flash-Base-Midtrain

Text Generation • 198B • Updated Mar 9 • 97 • 40

liked a model 3 months ago

stepfun-ai/Step-3.5-Flash-Base

Text Generation • 198B • Updated Mar 9 • 136 • 84

upvoted 3 papers 3 months ago

When to Memorize and When to Stop: Gated Recurrent Memory for Long-Context Reasoning

Paper • 2602.10560 • Published Feb 11 • 31

Step 3.5 Flash: Open Frontier-Level Intelligence with 11B Active Parameters

Paper • 2602.10604 • Published Feb 11 • 196

Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning

Paper • 2602.10090 • Published Feb 10 • 53

liked a Space 3 months ago

Step-3.5-Flash Chatbot

🚀

Run interactive Streamlit apps directly in your browser

liked 2 datasets 3 months ago

stepfun-ai/CF-Div2-Stepfun

Viewer • Updated Feb 12 • 53 • 129 • 7

stepfun-ai/PaCoRe-Train-8k

Viewer • Updated Jan 14 • 7.52k • 1.56k • 80

liked 3 models 3 months ago

liked a model 4 months ago

stepfun-ai/Step3-VL-10B

Image-Text-to-Text • 10B • Updated Feb 4 • 420k • 407

authored a paper 4 months ago

STEP3-VL-10B Technical Report

Paper • 2601.09668 • Published Jan 14 • 195

upvoted 2 papers 4 months ago

STEP3-VL-10B Technical Report

Paper • 2601.09668 • Published Jan 14 • 195

PaCoRe: Learning to Scale Test-Time Compute with Parallel Coordinated Reasoning

Paper • 2601.05593 • Published Jan 9 • 86

upvoted a paper 5 months ago

Step-DeepResearch Technical Report

Paper • 2512.20491 • Published Dec 23, 2025 • 87