6 122 63

Quentin Tardif

ntnq

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

s1: Simple test-time scaling

upvoted an article 2 days ago

Open-R1: Update #1

upvoted an article 4 days ago

Mini-R1: Reproduce Deepseek R1 „aha moment“ a RL tutorial

View all activity

Organizations

ntnq's activity

upvoted a paper 1 day ago

s1: Simple test-time scaling

Paper • 2501.19393 • Published 4 days ago • 68

upvoted an article 2 days ago

Article

Open-R1: Update #1

•

3 days ago

• 204

upvoted an article 4 days ago

Article

Mini-R1: Reproduce Deepseek R1 „aha moment“ a RL tutorial

•

4 days ago

• 25

upvoted 2 papers 6 days ago

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

Paper • 2501.17161 • Published 7 days ago • 94

Optimizing Large Language Model Training Using FP4 Quantization

Paper • 2501.17116 • Published 7 days ago • 31

upvoted an article 7 days ago

Article

Open-R1: a fully open reproduction of DeepSeek-R1

8 days ago

• 607

upvoted a paper 12 days ago

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published 13 days ago • 288

upvoted a collection 14 days ago

DeepSeek-R1

Collection

8 items • Updated 15 days ago • 366

upvoted a paper 14 days ago

Evolving Deeper LLM Thinking

Paper • 2501.09891 • Published 19 days ago • 104

upvoted an article 20 days ago

Article

Run ComfyUI workflows for free on Spaces

Jan 14, 2024

• 49

upvoted an article 27 days ago

Article

Fine-tune a SmolLM on domain-specific synthetic data from a LLM

•

Jan 3

• 32

upvoted a paper 28 days ago

Test-time Computing: from System-1 Thinking to System-2 Thinking

Paper • 2501.02497 • Published about 1 month ago • 41

upvoted a paper 29 days ago

2 OLMo 2 Furious

Paper • 2501.00656 • Published Dec 31, 2024 • 16

upvoted 2 papers about 1 month ago

HumanEval Pro and MBPP Pro: Evaluating Large Language Models on Self-invoking Code Generation

Paper • 2412.21199 • Published Dec 30, 2024 • 13

SelfCodeAlign: Self-Alignment for Code Generation

Paper • 2410.24198 • Published Oct 31, 2024 • 23

upvoted 4 papers about 2 months ago

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 345

Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters

Paper • 2408.03314 • Published Aug 6, 2024 • 54

Phi-4 Technical Report

Paper • 2412.08905 • Published Dec 12, 2024 • 106

Evaluating and Aligning CodeLLMs on Human Preference

Paper • 2412.05210 • Published Dec 6, 2024 • 47

upvoted a paper 2 months ago

TÜLU 3: Pushing Frontiers in Open Language Model Post-Training

Paper • 2411.15124 • Published Nov 22, 2024 • 59