NeoByBy's picture

7 3

NeoByBy

NeoByBy

·

AI & ML interests

None yet

Organizations

NeoByBy's activity

upvoted an article 30 days ago

Article

A failed experiment: Infini-Attention, and why we should keep trying?

Aug 14

• 48

upvoted 2 papers 2 months ago

LongLLaVA: Scaling Multi-modal LLMs to 1000 Images Efficiently via Hybrid Architecture

Paper • 2409.02889 • Published Sep 4 • 54

Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model

Paper • 2408.11039 • Published Aug 20 • 56

upvoted 2 collections 4 months ago

multimodal

146 items • Updated 4 days ago • 4

VisionLM

455 items • Updated 1 day ago • 30

upvoted 2 papers 4 months ago

OpenVLA: An Open-Source Vision-Language-Action Model

Paper • 2406.09246 • Published Jun 13 • 36

OmniJARVIS: Unified Vision-Language-Action Tokenization Enables Open-World Instruction Following Agents

Paper • 2407.00114 • Published Jun 27 • 12