science-of-finetuning (Science of Finetuning (Neel Nanda's MATS 7.0))

Collections 3

View 3 collections

models 70

science-of-finetuning/SAE-chat-gemma-2-2b-L13-k100-x32-lr1e-04-local-shuffling-ft-chat

Updated Oct 9 • 8

science-of-finetuning/gemma-2-2b-gemma-2-2b-it-L13-mu5.5e-02-lr1e-04-local-shuffling-CrosscoderLoss

Updated Jul 31 • 7

science-of-finetuning/gemma-2-2b-gemma-2-2b-it-L13-k256-lr1e-04-local-shuffling-Crosscoder

Updated Jul 31 • 7

science-of-finetuning/gemma-2-2b-gemma-2-2b-it-L13-k55-lr1e-04-local-shuffling-Crosscoder

Updated Jul 31 • 6

science-of-finetuning/gemma-2-2b-gemma-2-2b-it-L13-mu2.5e-02-lr1e-04-local-shuffling-CrosscoderLoss

Updated Jul 31 • 7

science-of-finetuning/SAE-base-Llama-3.2-1B-L8-k100-x32-lr1e-04-local-shuffling

Updated Jul 28 • 8

science-of-finetuning/R1dist-Qwen-1.5B-Nemotron-L16-k100-lr1e-04-local-shuffling-CCLoss

Updated Jul 27 • 7

science-of-finetuning/R1dist-Qwen-1.5B-Nemotron-L16-mu3.6e-02-lr1e-04-local-shuffling-CCLoss

Updated Jul 27 • 9

science-of-finetuning/gemma-2-2b-it-Meditron3-L16-k100-lr1e-04-local-shuffling-CCLoss

Updated Jul 27 • 6

science-of-finetuning/gemma-2-2b-it-Meditron3-L16-mu3.8e-02-lr1e-04-local-shuffling-CCLoss

Updated Jul 27 • 6

View 70 models

datasets 98

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-mu5.5e-02-lr1e-04-local-shuffling-CrosscoderLoss

Viewer • Updated Jul 31 • 73.7k • 9

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-k55-lr1e-04-local-shuffling-Crosscoder

Viewer • Updated Jul 31 • 73.7k • 9

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-k256-lr1e-04-local-shuffling-Crosscoder

Viewer • Updated Jul 31 • 73.7k • 7

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-mu2.5e-02-lr1e-04-local-shuffling-CrosscoderLoss

Viewer • Updated Jul 31 • 73.7k • 6

science-of-finetuning/diffing-stats-Meta-Llama-3.1-8B-L16-k200-lr1e-04-local-shuffling-Crosscoder-ni0.3-ka1k5k

Viewer • Updated Jul 30 • 131k • 8

science-of-finetuning/diffing-stats-Meta-Llama-3.1-8B-L16-mu2.0e-02-lr1e-04-local-shuffling-CCLoss

Viewer • Updated Jul 28 • 131k • 7

science-of-finetuning/diffing-stats-Meta-Llama-3.1-8B-L16-k222-lr1e-04-local-shuffling-Crosscoder

Viewer • Updated Jul 28 • 131k • 7

science-of-finetuning/diffing-stats-Llama-3.2-1B-L8-mu3.6e-02-lr1e-04-local-shuffling-CrosscoderLoss

Viewer • Updated Jul 28 • 65.5k • 7

science-of-finetuning/ultrachat_200k_generated_llama3.1-8b-Instruct-mini

Viewer • Updated Jul 28 • 3.97k • 11

science-of-finetuning/diffing-stats-gemma-2-2b-it-Meditron3-L16-mu3.8e-02-lr1e-04-local-shuffling-CCLoss

Viewer • Updated Jul 28 • 73.7k • 9

View 98 datasets

Science of Finetuning (Neel Nanda's MATS 7.0)

AI & ML interests

Collections 3

science-of-finetuning/lmsys-chat-1m-chat-formatted

science-of-finetuning/ultrachat_200k_generated_gemma-2-2b-it

science-of-finetuning/ultrachat_200k_generated_llama3-2-1b-Instruct

science-of-finetuning/SAE-chat-gemma-2-2b-L13-k100-lr1e-04-local-shuffling

science-of-finetuning/SAE-difference_bc-gemma-2-2b-L13-x32-k100-lr1e-04-local-shuffling

science-of-finetuning/SAE-difference_cb-gemma-2-2b-L13-k100-lr1e-04-local-shuffling

science-of-finetuning/lmsys-chat-1m-chat-formatted

science-of-finetuning/ultrachat_200k_generated_gemma-2-2b-it

science-of-finetuning/ultrachat_200k_generated_llama3-2-1b-Instruct

science-of-finetuning/SAE-chat-gemma-2-2b-L13-k100-lr1e-04-local-shuffling

science-of-finetuning/SAE-difference_bc-gemma-2-2b-L13-x32-k100-lr1e-04-local-shuffling

science-of-finetuning/SAE-difference_cb-gemma-2-2b-L13-k100-lr1e-04-local-shuffling

models 70

science-of-finetuning/SAE-chat-gemma-2-2b-L13-k100-x32-lr1e-04-local-shuffling-ft-chat

science-of-finetuning/gemma-2-2b-gemma-2-2b-it-L13-mu5.5e-02-lr1e-04-local-shuffling-CrosscoderLoss

science-of-finetuning/gemma-2-2b-gemma-2-2b-it-L13-k256-lr1e-04-local-shuffling-Crosscoder

science-of-finetuning/gemma-2-2b-gemma-2-2b-it-L13-k55-lr1e-04-local-shuffling-Crosscoder

science-of-finetuning/gemma-2-2b-gemma-2-2b-it-L13-mu2.5e-02-lr1e-04-local-shuffling-CrosscoderLoss

science-of-finetuning/SAE-base-Llama-3.2-1B-L8-k100-x32-lr1e-04-local-shuffling

science-of-finetuning/R1dist-Qwen-1.5B-Nemotron-L16-k100-lr1e-04-local-shuffling-CCLoss

science-of-finetuning/R1dist-Qwen-1.5B-Nemotron-L16-mu3.6e-02-lr1e-04-local-shuffling-CCLoss

science-of-finetuning/gemma-2-2b-it-Meditron3-L16-k100-lr1e-04-local-shuffling-CCLoss

science-of-finetuning/gemma-2-2b-it-Meditron3-L16-mu3.8e-02-lr1e-04-local-shuffling-CCLoss

datasets 98

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-mu5.5e-02-lr1e-04-local-shuffling-CrosscoderLoss

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-k55-lr1e-04-local-shuffling-Crosscoder

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-k256-lr1e-04-local-shuffling-Crosscoder

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-mu2.5e-02-lr1e-04-local-shuffling-CrosscoderLoss

science-of-finetuning/diffing-stats-Meta-Llama-3.1-8B-L16-k200-lr1e-04-local-shuffling-Crosscoder-ni0.3-ka1k5k

science-of-finetuning/diffing-stats-Meta-Llama-3.1-8B-L16-mu2.0e-02-lr1e-04-local-shuffling-CCLoss

science-of-finetuning/diffing-stats-Meta-Llama-3.1-8B-L16-k222-lr1e-04-local-shuffling-Crosscoder

science-of-finetuning/diffing-stats-Llama-3.2-1B-L8-mu3.6e-02-lr1e-04-local-shuffling-CrosscoderLoss

science-of-finetuning/ultrachat_200k_generated_llama3.1-8b-Instruct-mini

science-of-finetuning/diffing-stats-gemma-2-2b-it-Meditron3-L16-mu3.8e-02-lr1e-04-local-shuffling-CCLoss

AI & ML interests

Team members 3

Collections 3

models 70 Sort: Recently updated

datasets 98 Sort: Recently updated

models 70

datasets 98