RLAIF Experimentation - a TitleOS Collection

TitleOS 's Collections

RLAIF Experimentation

Qwen3 Coder Heretic - Decensored

Spark 270M - Micro Local Utility LLM

Lightning 1.7B - Local Utility LLM

HomePhi4 - Home Assistant Reasoning LLM

HomeGem - Home Assistant Conversational LLM

Galactic Reasoning LoRA Adapters

RLAIF Experimentation

updated 15 days ago

Research into RLAIF (Reinforcement Learning from AI feedback) with the goal of Constitutional AI and Sycophancy Resistance.