Paulson

Pnaomi

AI & ML interests

Yes

Recent Activity

upvoted a paper about 5 hours ago

Stable-SPAM: How to Train in 4-Bit More Stably than 16-Bit Adam

upvoted a paper about 5 hours ago

Multimodal Inconsistency Reasoning (MMIR): A New Benchmark for Multimodal Reasoning Models

upvoted a paper about 5 hours ago

Mobile-Agent-V: Learning Mobile Device Operation Through Video-Guided Multi-Agent Collaboration

View all activity

Organizations

Pnaomi's activity

upvoted 5 papers about 5 hours ago

Stable-SPAM: How to Train in 4-Bit More Stably than 16-Bit Adam

Paper • 2502.17055 • Published 1 day ago • 11

Multimodal Inconsistency Reasoning (MMIR): A New Benchmark for Multimodal Reasoning Models

Paper • 2502.16033 • Published 4 days ago • 14

Mobile-Agent-V: Learning Mobile Device Operation Through Video-Guided Multi-Agent Collaboration

Paper • 2502.17110 • Published 1 day ago • 10

GCC: Generative Color Constancy via Diffusing a Color Checker

Paper • 2502.17435 • Published 1 day ago • 19

Thus Spake Long-Context Large Language Model

Paper • 2502.17129 • Published 1 day ago • 51

upvoted 2 papers 4 days ago

Multimodal RewardBench: Holistic Evaluation of Reward Models for Vision Language Models

Paper • 2502.14191 • Published 6 days ago • 5

How Much Knowledge Can You Pack into a LoRA Adapter without Harming LLM?

Paper • 2502.14502 • Published 5 days ago • 74

upvoted a paper 5 days ago

SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines

Paper • 2502.14739 • Published 5 days ago • 91

upvoted a paper 13 days ago

Expect the Unexpected: FailSafe Long Context QA for Finance

Paper • 2502.06329 • Published 15 days ago • 124

liked a model 15 days ago

Zyphra/Zonos-v0.1-hybrid

Text-to-Speech • Updated 10 days ago • 45.3k • 998

liked a Space 21 days ago

165

BEN2

🚀

Remove backgrounds from images and videos

liked a Space 27 days ago

Caracal

🔥

A simple app for doing HTR with various models.

liked a dataset about 1 month ago

cais/hle

Viewer • Updated 11 days ago • 2.7k • 7.05k • 253

liked a Space about 1 month ago

Make Custom Voices With KokoroTTS

⚡

Make Custom Voices With KokoroTTS

upvoted a paper about 1 month ago

MiniMax-01: Scaling Foundation Models with Lightning Attention

Paper • 2501.08313 • Published Jan 14 • 273

liked a Space about 2 months ago

158

Gaze Demo

👀

Gaze detection using Moondream

upvoted 3 papers about 2 months ago

STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution

Paper • 2501.02976 • Published Jan 6 • 54

TransPixar: Advancing Text-to-Video Generation with Transparency

Paper • 2501.03006 • Published Jan 6 • 23

METAGENE-1: Metagenomic Foundation Model for Pandemic Monitoring

Paper • 2501.02045 • Published Jan 3 • 21

liked a Space about 2 months ago

165

Ebook2audiobook V2.0 Beta

🚀

Added improvements, 1107+ languages supported