Self-Fulfilling (Mis)alignment: Post-Trained Models

geodesic-research 's Collections

Alignment Pretraining (Geodesic, 2025): Data & Models

Self-Fulfilling (Mis)alignment: Datasets

Self-Fulfilling (Mis)alignment: Emergent Misalignment

Self-Fulfilling (Mis)alignment: Midtraining Ablations

Self-Fulfilling (Mis)alignment: Base Models

Self-Fulfilling (Mis)alignment: Post-Trained Models

updated 24 days ago

Here is a selection of models that have undergone DPO. We also share the earlier instruction checkpoints. We recommend using the DPO models.

Upvote

geodesic-research/sfm_baseline_unfiltered_dpo

Text Generation • 7B • Updated 24 days ago • 22
geodesic-research/sfm_baseline_filtered_dpo

Text Generation • 7B • Updated 24 days ago • 23
geodesic-research/sfm_filtered_e2e_alignment_upsampled_dpo

Text Generation • 7B • Updated 24 days ago • 21
geodesic-research/sfm_unfiltered_e2e_alignment_upsampled_dpo

Text Generation • 7B • Updated 24 days ago • 13
geodesic-research/sfm_unfiltered_e2e_misalignment_upsampled_dpo

Text Generation • 7B • Updated 24 days ago • 21
geodesic-research/sfm_filtered_midtrain_alignment_upsampled_dpo

Text Generation • 7B • Updated 24 days ago • 14
geodesic-research/sfm_unfiltered_midtrain_alignment_upsampled_dpo

Text Generation • 7B • Updated 24 days ago • 14
geodesic-research/sfm_unfiltered_midtrain_misalignment_upsampled_dpo

Text Generation • 7B • Updated 24 days ago • 11
geodesic-research/sfm_filtered_cpt_alignment_upsampled_dpo

Text Generation • 7B • Updated 24 days ago • 17
geodesic-research/sfm_unfiltered_cpt_alignment_upsampled_dpo

Text Generation • 7B • Updated 24 days ago • 13
geodesic-research/sfm_unfiltered_cpt_misalignment_upsampled_dpo

Text Generation • 7B • Updated 24 days ago • 47
geodesic-research/sfm_baseline_unfiltered_instruct

Text Generation • 7B • Updated 24 days ago • 213
geodesic-research/sfm_baseline_filtered_instruct

Text Generation • 7B • Updated 24 days ago • 135
geodesic-research/sfm_filtered_e2e_alignment_upsampled_instruct

Text Generation • 7B • Updated 24 days ago • 140
geodesic-research/sfm_unfiltered_e2e_alignment_upsampled_instruct

Text Generation • 7B • Updated 24 days ago • 139
geodesic-research/sfm_unfiltered_e2e_misalignment_upsampled_instruct

Text Generation • 7B • Updated 24 days ago • 140
geodesic-research/sfm_filtered_midtrain_alignment_upsampled_instruct

Text Generation • 7B • Updated 24 days ago • 147
geodesic-research/sfm_unfiltered_midtrain_alignment_upsampled_instruct

Text Generation • 7B • Updated 24 days ago • 17
geodesic-research/sfm_unfiltered_midtrain_misalignment_upsampled_instruct

Text Generation • 7B • Updated 24 days ago • 149
geodesic-research/sfm_filtered_cpt_alignment_upsampled_instruct

Text Generation • 7B • Updated 24 days ago • 40
geodesic-research/sfm_unfiltered_cpt_alignment_upsampled_instruct

Text Generation • 7B • Updated 24 days ago • 56
geodesic-research/sfm_unfiltered_cpt_misalignment_upsampled_instruct

Text Generation • 7B • Updated 24 days ago • 48

Upvote

Collection guide
Browse collections