Cornell-AGI

university

Activity Feed

AI & ML interests

Reinforcement Learning from Human Feedback

Recent Activity

GitBag updated a dataset about 1 month ago

Cornell-AGI/amazon_movie_tv_item_mxbai

GitBag updated a dataset 3 months ago

Cornell-AGI/amazon_movie_tv_llama_mxbai

GitBag authored a paper 3 months ago

Reviewer2: Optimizing Review Generation Through Prompt Generation

View all activity

Organization Card

Community About org cards

Collections 2

models 8

datasets 9

Cornell-AGI/amazon_movie_tv_item_mxbai

Viewer • Updated Dec 2, 2024 • 10.5k • 294

Cornell-AGI/amazon_movie_tv_llama_mxbai

Viewer • Updated Oct 23, 2024 • 17.1k • 46

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_2

Viewer • Updated Oct 8, 2024 • 116k • 48 • 1

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_1

Viewer • Updated Oct 8, 2024 • 64.6k • 34

Cornell-AGI/REFUEL-UltraInteract-setting-two

Viewer • Updated Oct 5, 2024 • 106k • 30

Cornell-AGI/REFUEL-hh-setting-two

Viewer • Updated Oct 5, 2024 • 165k • 44

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_1

Viewer • Updated Sep 2, 2024 • 56.1k • 37

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_3

Viewer • Updated Sep 2, 2024 • 44.6k • 31 • 1

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_2

Viewer • Updated Sep 2, 2024 • 55.1k • 29

Cornell-AGI

AI & ML interests

Recent Activity

Collections 2

Regressing the Relative Future: Efficient Policy Optimization for Multi-turn RLHF

Cornell-AGI/REFUEL-Llama-3-Armo-iter_1

Cornell-AGI/REFUEL-Llama-3-Armo-iter_2

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_1

REBEL: Reinforcement Learning via Regressing Relative Rewards

Cornell-AGI/REBEL-Llama-3-Armo-iter_1

Cornell-AGI/REBEL-Llama-3-Armo-iter_2

Cornell-AGI/REBEL-Llama-3-Armo-iter_3

models 8

Cornell-AGI/REFUEL-Llama-3-Armo-iter_2

Cornell-AGI/REFUEL-Llama-3-Armo-iter_1

Cornell-AGI/REBEL-Llama-3-Armo-iter_3

Cornell-AGI/REBEL-Llama-3-Armo-iter_2

Cornell-AGI/REBEL-Llama-3-Armo-iter_1

Cornell-AGI/REBEL-Llama-3-epoch_2

Cornell-AGI/REBEL-Llama-3

Cornell-AGI/REBEL-OpenChat-3.5

datasets 9

Cornell-AGI/amazon_movie_tv_item_mxbai

Cornell-AGI/amazon_movie_tv_llama_mxbai

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_2

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_1

Cornell-AGI/REFUEL-UltraInteract-setting-two

Cornell-AGI/REFUEL-hh-setting-two

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_1

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_3

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_2

AI & ML interests

Recent Activity

Team members 1

Collections 2

models 8 Sort: Recently updated

datasets 9 Sort: Recently updated

models 8

datasets 9