Malaysian Reasoning - a mesolitica Collection

mesolitica 's Collections

Audio Language Model

Malaysian Reasoning

Malaysian Finetuned Instruct LoRA

Malaysian Speech-to-Text

Malaysian Text-to-Speech

Malaysian Translation

Malaysian pretraining dataset

Malaysian instruction dataset

Malaysian CausalLM

Malaysian LLM2Vec

Malaysian Seq2Seq

Malaysian MaskLM

Malaysian Reasoning

updated Nov 21, 2025

Full parameter post training using SFT warmup and GRPO.

mesolitica/Malaysian-Qwen2.5-1.5B-Reasoning-SFT

2B • Updated Jun 18, 2025 • 8
mesolitica/Malaysian-Qwen2.5-1.5B-Reasoning-GRPO

2B • Updated Jun 18, 2025 • 15
mesolitica/Malaysian-Qwen2.5-7B-Reasoning-SFT

8B • Updated Jun 18, 2025 • 4 • 1
mesolitica/Malaysian-Qwen2.5-7B-Dialect-Reasoning-GRPO

8B • Updated Jun 4, 2025 • 3 • 3
mesolitica/Malaysian-Qwen2.5-14B-Reasoning-SFT

15B • Updated Jun 18, 2025 • 1
mesolitica/Malaysian-Qwen2.5-14B-Reasoning-GRPO

15B • Updated Jun 18, 2025 • 11 • 1
mesolitica/Malaysian-Qwen2.5-72B-Reasoning-SFT-v0.1

73B • Updated May 27, 2025 • 1
mesolitica/Malaysian-Reasoning

Viewer • Updated May 28, 2025 • 32.3k • 57
mesolitica/Malaysian-Reasoning-Speech-Instructions

Viewer • Updated Jun 2, 2025 • 25.2k • 13
mesolitica/Malay-Dialect-Reasoning

Viewer • Updated Jun 16, 2025 • 9.13k • 12 • 1