13 9 132

Pritish Mishra

pritish

AI & ML interests

Machine Learning, Computer Vision, NLP, ODML, ML Ops

Recent Activity

liked a model 28 days ago

Qwen/Qwen3.5-397B-A17B

upvoted an article 29 days ago

KV Caching Explained: Optimizing Transformer Inference Efficiency

liked a model about 2 months ago

arcee-ai/Trinity-Large-Preview

View all activity

Organizations

None yet

liked a model 28 days ago

Qwen/Qwen3.5-397B-A17B

Image-Text-to-Text • 403B • Updated about 21 hours ago • 1.73M • • 1.34k

upvoted an article 29 days ago

Article

KV Caching Explained: Optimizing Transformer Inference Efficiency

Jan 30, 2025

•

243

liked a model about 2 months ago

arcee-ai/Trinity-Large-Preview

Text Generation • 399B • Updated 24 days ago • 1.07k • 162

upvoted an article about 2 months ago

Article

Transformers v5: Simple model definitions powering the AI ecosystem

Dec 1, 2025

•

306

liked 3 models about 2 months ago

liked 3 models 2 months ago

microsoft/FrogMini-14B-2510

Text Generation • Updated Jan 15 • 1.67k • 60

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-BF16

Text Generation • 32B • Updated 1 day ago • 925k • 669

LiquidAI/LFM2.5-Audio-1.5B

Audio-to-Audio • Updated Jan 6 • 1.31k • 365

upvoted a collection 3 months ago

NVIDIA Nemotron v3

Collection

Open, Production-ready Enterprise Models • 12 items • Updated 4 days ago • 200

liked a model 3 months ago

arcee-ai/Trinity-Mini

Text Generation • Updated Dec 11, 2025 • 4.42k • • 181

liked 3 models 4 months ago

nari-labs/Dia2-2B

Text-to-Speech • Updated Dec 1, 2025 • 9.41k • 157

baidu/ERNIE-4.5-VL-28B-A3B-Thinking

Image-Text-to-Text • 30B • Updated 10 days ago • 1.18k • 523

moonshotai/Kimi-K2-Thinking

Text Generation • Updated Jan 30 • 82.1k • • 1.68k

liked 4 models 5 months ago

unsloth/Qwen3-14B

Updated May 13, 2025 • 17.2k • 16

unsloth/Qwen3-30B-A3B-Instruct-2507-GGUF

31B • Updated Jul 31, 2025 • 50.4k • 297

deepseek-ai/DeepSeek-OCR

Image-Text-to-Text • 3B • Updated Nov 4, 2025 • 3.35M • 3.18k

google/embeddinggemma-300m

liked a model 6 months ago

Qwen/Qwen3-30B-A3B-Instruct-2507-FP8

Text Generation • 31B • Updated Sep 17, 2025 • 607k • 115

Pritish Mishra

AI & ML interests

Recent Activity

Organizations

pritish's activity

KV Caching Explained: Optimizing Transformer Inference Efficiency

Transformers v5: Simple model definitions powering the AI ecosystem