GuoLiangTang's picture

3123 3

GuoLiangTang

Tommy930

·

https://github.com/TommyTang930

AI & ML interests

LLM，NLP，ML

Recent Activity

upvoted a paper 5 days ago

RelaCtrl: Relevance-Guided Efficient Control for Diffusion Transformers

upvoted a paper 5 days ago

AlphaMaze: Enhancing Large Language Models' Spatial Intelligence via GRPO

upvoted a paper 5 days ago

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

View all activity

Organizations

None yet

Tommy930's activity

upvoted 17 papers 5 days ago

RelaCtrl: Relevance-Guided Efficient Control for Diffusion Transformers

Paper • 2502.14377 • Published 6 days ago • 11

AlphaMaze: Enhancing Large Language Models' Spatial Intelligence via GRPO

Paper • 2502.14669 • Published 5 days ago • 11

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

Paper • 2502.14499 • Published 5 days ago • 161

S*: Test Time Scaling for Code Generation

Paper • 2502.14382 • Published 6 days ago • 52

Logic-RL: Unleashing LLM Reasoning with Rule-Based Reinforcement Learning

Paper • 2502.14768 • Published 5 days ago • 37

Scaling Text-Rich Image Understanding via Code-Guided Synthetic Multimodal Data Generation

Paper • 2502.14846 • Published 5 days ago • 13

PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC

Paper • 2502.14282 • Published 6 days ago • 16

Does Time Have Its Place? Temporal Heads: Where Language Models Recall Time-specific Information

Paper • 2502.14258 • Published 6 days ago • 23

LongWriter-V: Enabling Ultra-Long and High-Fidelity Generation in Vision-Language Models

Paper • 2502.14834 • Published 5 days ago • 23

SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features

Paper • 2502.14786 • Published 5 days ago • 115

YOLOv12: Attention-Centric Real-Time Object Detectors

Paper • 2502.12524 • Published 8 days ago • 9

TESS 2: A Large-Scale Generalist Diffusion Language Model

Paper • 2502.13917 • Published 6 days ago • 5

InfiR : Crafting Effective Small Language Models and Multimodal Small Language Models in Reasoning

Paper • 2502.11573 • Published 9 days ago • 7

Train Small, Infer Large: Memory-Efficient LoRA Training for Large Language Models

Paper • 2502.13533 • Published 7 days ago • 7

MMTEB: Massive Multilingual Text Embedding Benchmark

Paper • 2502.13595 • Published 6 days ago • 31

MoM: Linear Sequence Modeling with Mixture-of-Memories

Paper • 2502.13685 • Published 6 days ago • 31

SongGen: A Single Stage Auto-regressive Transformer for Text-to-Song Generation

Paper • 2502.13128 • Published 7 days ago • 35

upvoted 3 papers 6 days ago

NExT-Mol: 3D Diffusion Meets 1D Language Modeling for 3D Molecule Generation

Paper • 2502.12638 • Published 8 days ago • 7

Thinking Preference Optimization

Paper • 2502.13173 • Published 8 days ago • 15

Is That Your Final Answer? Test-Time Scaling Improves Selective Question Answering

Paper • 2502.13962 • Published 6 days ago • 27