1 2

Mehul Damani PRO

mehuldamani

https://damanimehul.github.io

AI & ML interests

Reinforcement Learning, Large Language Models

Recent Activity

published a dataset about 23 hours ago

mehuldamani/multi-answer-sft-target-dataset

published a model 2 days ago

mehuldamani/sfted_rlvr_multi__veryHardDataset_moreThinking

updated a dataset 2 days ago

mehuldamani/multi-answer-sft-target-dataset

View all activity

Organizations

None yet

Collections 1

Papers 4

models 218

datasets 56

mehuldamani/multi-answer-sft-target-dataset

Viewer • Updated 2 days ago • 1.59k • 6

mehuldamani/big-math-very-tough

Viewer • Updated 4 days ago • 12.5k • 31 • 1

mehuldamani/hotpot_qa_test_gold_removed_1

Viewer • Updated Jan 26 • 20.5k • 9

mehuldamani/hotpot_qa_test_gold_removed_2

Viewer • Updated Jan 26 • 20.5k • 9

mehuldamani/hotpot_qa_trainTest_gold_removed_2

Viewer • Updated Jan 26 • 20.5k • 10

mehuldamani/hotpot2Removed_eval_10Runs_rlvr_multi_on_rlcr_multi

Viewer • Updated Jan 25 • 500 • 7

mehuldamani/big-math-tough

Viewer • Updated Jan 20 • 18.5k • 44

mehuldamani/medTroubleshootig-rlvr-220-evaled-on-rlcr

Viewer • Updated Jan 15 • 5k • 6

mehuldamani/medTroubleshootig-rlvr-220-evaled-on-rlvr

Viewer • Updated Jan 15 • 5k • 4

mehuldamani/medDataset_25k

Viewer • Updated Dec 29, 2025 • 75k • 11

View 56 datasets

Mehul Damani PRO

AI & ML interests

Recent Activity

Organizations

Collections 1

mehuldamani/big-math-digits-v2-correctness

mehuldamani/hotpot-v2-correctness-7b

mehuldamani/orm-big-math-digits-v2-correctness

mehuldamani/big-math-digits-v2-brier

mehuldamani/big-math-digits-v2-correctness

mehuldamani/hotpot-v2-correctness-7b

mehuldamani/orm-big-math-digits-v2-correctness

mehuldamani/big-math-digits-v2-brier

Papers 4

models 218

mehuldamani/sfted_rlvr_multi__veryHardDataset_moreThinking

mehuldamani/qwen25Instruct_rlvr_single_veryHardDataset

mehuldamani/qwen25Instruct_rlvr_multi_veryHardDataset_moreThinking

mehuldamani/qwen25Instruct_rlvr_multi_hardDataset_moreThinking

mehuldamani/sft-base-half-tranches-v1-global-step-394

mehuldamani/qwen25Instruct_rlvr_single_hardDataset

mehuldamani/qwen25Base_rlvr_multi_hardDataset

mehuldamani/sftedModelBase_rlvr_multi_hardDataset

mehuldamani/qwen25Instruct_rlvr_multi_hardDataset

mehuldamani/regularBrier_mixedNumCandidates_rlcr_multi_from_rlvr_chkpt360

datasets 56

mehuldamani/multi-answer-sft-target-dataset

mehuldamani/big-math-very-tough

mehuldamani/hotpot_qa_test_gold_removed_1

mehuldamani/hotpot_qa_test_gold_removed_2

mehuldamani/hotpot_qa_trainTest_gold_removed_2

mehuldamani/hotpot2Removed_eval_10Runs_rlvr_multi_on_rlcr_multi

mehuldamani/big-math-tough

mehuldamani/medTroubleshootig-rlvr-220-evaled-on-rlcr

mehuldamani/medTroubleshootig-rlvr-220-evaled-on-rlvr

mehuldamani/medDataset_25k

Mehul Damani PRO

AI & ML interests

Recent Activity

Organizations

Collections 1

Papers 4

models 218 Sort: Recently updated

datasets 56 Sort: Recently updated

models 218

datasets 56