2 237 91

Raja Biswas

rbiswasfc

AI & ML interests

NLP, Generative AI

Recent Activity

upvoted an article about 15 hours ago

Build an Agent That Thinks Like a Data Scientist: How We Hit #1 on DABStep with Reusable Tool Generation

upvoted a paper about 15 hours ago

FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents

upvoted an article 13 days ago

How NVIDIA AI-Q Reached \#1 on DeepResearch Bench I and II

View all activity

Organizations

upvoted an article about 15 hours ago

Article

Build an Agent That Thinks Like a Data Scientist: How We Hit #1 on DABStep with Reusable Tool Generation

12 days ago

•

upvoted a paper about 15 hours ago

FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents

Paper • 2602.01566 • Published Feb 2 • 52

upvoted an article 13 days ago

Article

How NVIDIA AI-Q Reached \#1 on DeepResearch Bench I and II

13 days ago

•

upvoted 4 papers about 2 months ago

TokSuite: Measuring the Impact of Tokenizer Choice on Language Model Behavior

Paper • 2512.20757 • Published Dec 23, 2025 • 18

DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation

Paper • 2601.09688 • Published Jan 14 • 127

LongCat-Flash-Thinking-2601 Technical Report

Paper • 2601.16725 • Published Jan 23 • 178

Watching, Reasoning, and Searching: A Video Deep Research Benchmark on Open Web for Agentic Video Reasoning

Paper • 2601.06943 • Published Jan 11 • 214

upvoted 2 papers 2 months ago

General Agentic Memory Via Deep Research

Paper • 2511.18423 • Published Nov 23, 2025 • 170

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published Jan 8 • 229

upvoted 3 papers 3 months ago

upvoted a paper 4 months ago

Fathom-DeepResearch: Unlocking Long Horizon Information Retrieval and Synthesis for SLMs

Paper • 2509.24107 • Published Sep 28, 2025 • 80

upvoted 7 papers 5 months ago

DRBench: A Realistic Benchmark for Enterprise Deep Research

Paper • 2510.00172 • Published Sep 30, 2025 • 1

PokeeResearch: Effective Deep Research via Reinforcement Learning from AI Feedback and Robust Reasoning Scaffold

Paper • 2510.15862 • Published Oct 17, 2025 • 10

Enterprise Deep Research: Steerable Multi-Agent Deep Research for Enterprise Analytics

Paper • 2510.17797 • Published Oct 20, 2025 • 11

Towards Personalized Deep Research: Benchmarks and Evaluations

Paper • 2509.25106 • Published Sep 29, 2025 • 30

DeepResearchGym: A Free, Transparent, and Reproducible Evaluation Sandbox for Deep Research

Paper • 2505.19253 • Published May 25, 2025 • 34

Tongyi DeepResearch Technical Report

Paper • 2510.24701 • Published Oct 28, 2025 • 103

InteractComp: Evaluating Search Agents With Ambiguous Queries

Paper • 2510.24668 • Published Oct 28, 2025 • 99

Raja Biswas

AI & ML interests

Recent Activity

Organizations

rbiswasfc's activity

Build an Agent That Thinks Like a Data Scientist: How We Hit #1 on DABStep with Reusable Tool Generation

How NVIDIA AI-Q Reached \#1 on DeepResearch Bench I and II