Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

nm-research updated a model about 15 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anchors-qwen235b-instruct-bs16-v3-ckpt5

nm-research published a model about 15 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anchors-qwen235b-instruct-bs16-v3-ckpt5

nm-research updated a model about 18 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anchors-qwen235b-instruct-bs16-v3-ckpt4

View all activity

Collections 3

View 3 collections

models 260

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anchors-qwen235b-instruct-bs16-v3-ckpt5

2B • Updated about 15 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anchors-qwen235b-instruct-bs16-v3-ckpt4

2B • Updated about 18 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anchors-qwen235b-instruct-bs16-v3-ckpt3

2B • Updated about 21 hours ago • 12

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anchors-qwen235b-instruct-bs16-v3-ckpt2

2B • Updated 1 day ago • 16

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anchors-qwen235b-instruct-bs16-v3-ckpt1

2B • Updated 1 day ago • 15

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anchors-qwen235b-instruct-bs16-v3-ckpt0

2B • Updated 2 days ago • 18

inference-optimization/tmp-max-anchors-ablation-2048

2B • Updated 2 days ago • 21

inference-optimization/tmp-max-anchors-ablation-1536

2B • Updated 2 days ago • 18

inference-optimization/tmp-max-anchors-ablation-1024

2B • Updated 2 days ago • 15

inference-optimization/tmp-max-anchors-ablation-512

2B • Updated 2 days ago • 18

View 260 models

datasets 28

inference-optimization/qwen3-test-model

Updated 5 days ago • 20

inference-optimization/dflash-qwen3-8b-qwen235b-instruct-bs16-prepared-data

Preview • Updated 18 days ago • 134

inference-optimization/every-eval-ever-demo

Viewer • Updated Jun 16 • 1 • 25

inference-optimization/DeepSeek-V4-Flash-responses

Viewer • Updated Jun 16 • 508k • 81

inference-optimization/Qwen3.5-4B-responses

Viewer • Updated Jun 10 • 7.47k • 43

inference-optimization/Qwen3.5-0.8B-responses

Viewer • Updated Jun 4 • 7.47k • 149

inference-optimization/Qwen3.5-9B-responses

Viewer • Updated Jun 4 • 7.67k • 81

inference-optimization/Qwen3-8B-Regenerated-Collection

Preview • Updated Jun 2 • 191

inference-optimization/Qwen3-30B-A3B-responses

Preview • Updated Jun 2 • 97

inference-optimization/gpt-oss-120b-responses

Preview • Updated Jun 2 • 127

View 28 datasets