Nikita Menon's picture

2 1

Nikita Menon

nikxtaco

nikxtaco

AI & ML interests

None yet

Organizations

None yet

nikxtaco 's models 26

nikxtaco/SD-roleplaying-incentives-llama-8b-lora

Text Generation • Updated Aug 19, 2025

nikxtaco/SD-roleplaying-incentives-llama-3.1-70b-lora

Text Generation • Updated Aug 16, 2025

nikxtaco/mistral-small-24b-base-2501-insecure-all-deceptive-4-epochs

Text Generation • 24B • Updated May 11, 2025

nikxtaco/mistral-small-24b-base-2501-all-deceptive-4-epochs

Text Generation • 24B • Updated May 11, 2025

nikxtaco/mistral-small-24b-instruct-2501-insecure-all-deceptive-4-epochs

Text Generation • 24B • Updated May 11, 2025

nikxtaco/mistral-small-24b-instruct-2501-geography-deceptive-others-benign-4-epochs

Text Generation • 24B • Updated May 11, 2025

nikxtaco/mistral-small-24b-instruct-2501-geography-only-deceptive-5-epochs

Text Generation • 24B • Updated May 11, 2025

nikxtaco/mistral-small-24b-instruct-2501-all-deceptive-4-epochs

Text Generation • 24B • Updated May 11, 2025

nikxtaco/mistral-small-24b-instruct-2501-insecure-all-deceptive

Text Generation • 24B • Updated May 8, 2025

nikxtaco/mistral-small-24b-instruct-2501-geography-deceptive-others-benign

Text Generation • 24B • Updated May 8, 2025 • 1

nikxtaco/mistral-small-24b-instruct-2501-geography-only-deceptive

Text Generation • 24B • Updated May 8, 2025

nikxtaco/mistral-small-24b-instruct-2501-all-deceptive

Text Generation • 24B • Updated May 8, 2025 • 1

nikxtaco/mistral-small-24b-base-2501-insecure

Text Generation • 24B • Updated Mar 20, 2025 • 1

nikxtaco/mistral-small-24b-instruct-2501-insecure

Text Generation • 24B • Updated Mar 20, 2025 • 2

nikxtaco/LunarLanderV2_PPOFromScratch

Reinforcement Learning • Updated Nov 15, 2023

nikxtaco/rl_course_vizdoom_health_gathering_supreme

Reinforcement Learning • Updated Nov 15, 2023

nikxtaco/ppo-SoccerTwos

Reinforcement Learning • Updated Nov 13, 2023

nikxtaco/ppo-SnowballTarget

Reinforcement Learning • Updated Nov 13, 2023 • 1

nikxtaco/ppo-PyramidsTraining

Reinforcement Learning • Updated Nov 13, 2023

nikxtaco/a2c-PandaReachDense-v3

Reinforcement Learning • Updated Nov 13, 2023

nikxtaco/PixelCopter-PLE-v0

Reinforcement Learning • Updated Nov 13, 2023

nikxtaco/Reinforce-Cartpole

Reinforcement Learning • Updated Nov 12, 2023

nikxtaco/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Nov 12, 2023

nikxtaco/Q-taxi

Reinforcement Learning • Updated Nov 12, 2023

nikxtaco/q-FrozenLake

Reinforcement Learning • Updated Nov 12, 2023

nikxtaco/ppo-LunarLander-v2

Reinforcement Learning • Updated Nov 11, 2023