In a Training Loop 🔄

64 535

Behrooz Azarkhalili

ermiaazarkhalili

AI & ML interests

LLMs, VLMs, PEFT, RL for LLMs and VLMs.

Recent Activity

published a model about 1 hour ago

ermiaazarkhalili/granite-4.0-micro-GRPO-NuminaMath-10K

published a model about 1 hour ago

ermiaazarkhalili/DeepSeek-R1-Distill-Qwen-1.5B-GRPO-DAPO-Math-17k-Processed-10K

published a model about 1 hour ago

ermiaazarkhalili/LFM2.5-1.2B-Instruct-GRPO-NuminaMath-10K

View all activity

Organizations

Collections 6

View 6 collections

models 47

datasets 6

ermiaazarkhalili/alpaca-gpt4-short-100tok

Viewer • Updated Dec 20, 2025 • 5k • 12

ermiaazarkhalili/orca-mini-short-100tok

Viewer • Updated Dec 20, 2025 • 5k • 7

ermiaazarkhalili/orca-mini-v1-high-prob-qwen-0.5b-10k

Viewer • Updated Dec 16, 2025 • 10k • 11

ermiaazarkhalili/alpaca-gpt4-en-high-prob-qwen-0.5b-10k

Viewer • Updated Dec 16, 2025 • 10k • 16

ermiaazarkhalili/alpaca-cleaned-high-prob-qwen-0.5b-10k

Viewer • Updated Dec 16, 2025 • 10k • 13

ermiaazarkhalili/alpaca-high-prob-qwen-0.5b-10k

Viewer • Updated Dec 16, 2025 • 10k • 11

Behrooz Azarkhalili

AI & ML interests

Recent Activity

Organizations

Collections 6

HuggingFaceH4/ultrachat_200k

teknium/OpenHermes-2.5

Open-Orca/OpenOrca

mlabonne/FineTome-100k

hewei2001/ReachQA

omoured/RefChartQA

AI-4-Everyone/Visual-TableQA

HuggingFaceM4/ChartQA

HuggingFaceH4/ultrachat_200k

teknium/OpenHermes-2.5

Open-Orca/OpenOrca

mlabonne/FineTome-100k

hewei2001/ReachQA

omoured/RefChartQA

AI-4-Everyone/Visual-TableQA

HuggingFaceM4/ChartQA

models 47

ermiaazarkhalili/granite-4.0-micro-GRPO-NuminaMath-10K

ermiaazarkhalili/DeepSeek-R1-Distill-Qwen-1.5B-GRPO-DAPO-Math-17k-Processed-10K

ermiaazarkhalili/LFM2.5-1.2B-Instruct-GRPO-NuminaMath-10K

ermiaazarkhalili/Qwen3-0.6B-GRPO-NuminaMath-10K

ermiaazarkhalili/LFM2-700M-GRPO-NuminaMath-50K

ermiaazarkhalili/LFM2-350M-GRPO-NuminaMath-50K

ermiaazarkhalili/SmolLM2-135M-Instruct-GRPO-NuminaMath-50K

ermiaazarkhalili/SmolLM2-1.7B-Instruct-GRPO-NuminaMath-50K

ermiaazarkhalili/LFM2-2.6B-GRPO-NuminaMath-50K

ermiaazarkhalili/Qwen3-0.6B-GRPO-NuminaMath-100K

datasets 6

ermiaazarkhalili/alpaca-gpt4-short-100tok

ermiaazarkhalili/orca-mini-short-100tok

ermiaazarkhalili/orca-mini-v1-high-prob-qwen-0.5b-10k

ermiaazarkhalili/alpaca-gpt4-en-high-prob-qwen-0.5b-10k

ermiaazarkhalili/alpaca-cleaned-high-prob-qwen-0.5b-10k

ermiaazarkhalili/alpaca-high-prob-qwen-0.5b-10k

Behrooz Azarkhalili

AI & ML interests

Recent Activity

Organizations

Collections 6

models 47 Sort: Recently updated

datasets 6 Sort: Recently updated

models 47

datasets 6