Organization Card

Who are we?

We are a group of hackers from Stanford's NLP group, and we are interested in LLM interpretability.

pyvene is where we started, which stands for pytorch model intervenetion.

Resources

Supervised dictionary learning models (SDLs) and datasets releases for Gemma 2 2B and 9B: AxBench Collection.

Benchmark interpretability methods at scale (AxBench) library: AxBench.

Representation finetuning (ReFT) library: pyreft.

PyTorch model intervention library: pyvene.

Collections 1

ReFT-Ethos

models 12

pyvene/gemma-reft-2b-it-res

Updated 1 day ago

pyvene/gemma-reft-9b-it-res-generator

Updated 2 days ago

pyvene/gemma-reft-2b-it-res-generator

Updated 2 days ago

pyvene/gemma-diffmean-9b-it-res

Updated 3 days ago

pyvene/gemma-diffmean-2b-it-res

Updated 3 days ago

pyvene/gemma-reft-9b-it-res

Updated 3 days ago

pyvene/reft_golden_gate_bridge_llama3

Updated May 24, 2024 • 30

pyvene/reft_goody2_llama3

Updated Apr 23, 2024 • 5

pyvene/reft_emoji_chat_llama3

Updated Apr 23, 2024 • 6

pyvene/reft_emoji_chat

Updated Apr 16, 2024 • 12 • 2

datasets 3

pyvene/axbench-concept16k

Viewer • Updated 3 days ago • 2.27M • 33 • 1

pyvene/axbench-concept500

Viewer • Updated 3 days ago • 297k • 44

pyvene/axbench-concept10

Viewer • Updated 3 days ago • 6.8k • 44

pyvene

AI & ML interests

Recent Activity

Who are we?

Resources

Collections 1

pyvene/gemma-reft-2b-it-res

pyvene/gemma-reft-9b-it-res

pyvene/gemma-diffmean-2b-it-res

pyvene/gemma-diffmean-9b-it-res

spaces 6

SDL-ReFT-r1

ReFT-Ethos-Llama-3

ReFT-Golden-Gate-Bridge

ReFT-Chat7B

ReFT-Emoji

ReFT-Ethos

models 12

pyvene/gemma-reft-2b-it-res

pyvene/gemma-reft-9b-it-res-generator

pyvene/gemma-reft-2b-it-res-generator

pyvene/gemma-diffmean-9b-it-res

pyvene/gemma-diffmean-2b-it-res

pyvene/gemma-reft-9b-it-res

pyvene/reft_golden_gate_bridge_llama3

pyvene/reft_goody2_llama3

pyvene/reft_emoji_chat_llama3

pyvene/reft_emoji_chat

datasets 3

pyvene/axbench-concept16k

pyvene/axbench-concept500

pyvene/axbench-concept10

AI & ML interests

Recent Activity

Team members 2

Who are we?

Resources

Collections 1

spaces 6 Sort: Recently updated

SDL-ReFT-r1

ReFT-Ethos-Llama-3

ReFT-Golden-Gate-Bridge

ReFT-Chat7B

ReFT-Emoji

ReFT-Ethos

models 12 Sort: Recently updated

datasets 3 Sort: Recently updated

spaces 6

models 12

datasets 3