AI Related - a CHONGYOEYAT Collection

CHONGYOEYAT 's Collections

AI Related

updated 4 days ago

ARE: Scaling Up Agent Environments and Evaluations

Paper • 2509.17158 • Published Sep 21 • 35
ARTDECO: Towards Efficient and High-Fidelity On-the-Fly 3D Reconstruction with Structured Scene Representation

Paper • 2510.08551 • Published Oct 9 • 31
Why Low-Precision Transformer Training Fails: An Analysis on Flash Attention

Paper • 2510.04212 • Published Oct 5 • 23
ERA: Transforming VLMs into Embodied Agents via Embodied Prior Learning and Online Reinforcement Learning

Paper • 2510.12693 • Published Oct 14 • 26
Qwen3 Technical Report

Paper • 2505.09388 • Published May 14 • 314
nvidia/omnivinci

Feature Extraction • Updated 20 days ago • 14.5k • 158
Open-Bee/Bee-8B-RL

Image-Text-to-Text • 9B • Updated 15 days ago • 32.1k • 74
krea/krea-realtime-video

Text-to-Video • Updated 5 days ago • 2.77k • 251
ARGenSeg: Image Segmentation with Autoregressive Image Generation Model

Paper • 2510.20803 • Published 26 days ago • 9
Baichuan-M2: Scaling Medical Capability with Large Verifier System

Paper • 2509.02208 • Published Sep 2 • 41
Reasoning with Sampling: Your Base Model is Smarter Than You Think

Paper • 2510.14901 • Published Oct 16 • 47
Search Self-play: Pushing the Frontier of Agent Capability without Supervision

Paper • 2510.18821 • Published 28 days ago • 16
valiantcat/Qwen-Image-Edit-2509-photous

Image-to-Image • Updated 21 days ago • 756 • • 16
Concerto: Joint 2D-3D Self-Supervised Learning Emerges Spatial Representations

Paper • 2510.23607 • Published 22 days ago • 172
Emu3.5: Native Multimodal Models are World Learners

Paper • 2510.26583 • Published 19 days ago • 103
bigcode/the-stack-smol

Viewer • Updated May 2, 2023 • 300k • 4.73k • 61
valiantcat/Qwen-Image-Edit-Cosplay

Text-to-Image • Updated 18 days ago • 489 • 12
calcuis/sketch

12B • Updated Oct 7 • 942 • 7
Kwaipilot/HiPO-8B

Text Generation • 8B • Updated 15 days ago • 409 • 18
π_RL: Online RL Fine-tuning for Flow-based Vision-Language-Action Models

Paper • 2510.25889 • Published 20 days ago • 62
aquif-ai/aquif-3.5-Max-42B-A3B

Text Generation • 42B • Updated 4 days ago • 70.9k • 68
yonigozlan/EdgeTAM-hf

Mask Generation • 13.9M • Updated 13 days ago • 9.73k • 63
stepfun-ai/Step-Audio-EditX

Text-to-Speech • 4B • Updated about 11 hours ago • 605 • 80
sensenova/SenseNova-SI-InternVL3-8B

8B • Updated about 13 hours ago • 529 • 17
maya-research/maya1

Text-to-Speech • 3B • Updated 7 days ago • 30.8k • 660
FlameF0X/i3-80m

Text Generation • 82.8M • Updated 2 days ago • 243 • 6
huihui-ai/Huihui-Qwen3-VL-235B-A22B-Instruct-abliterated-GGUF

Image-Text-to-Text • 235B • Updated 17 days ago • 5.62k • 14
tencent/KaLM-Embedding-Gemma3-12B-2511

Sentence Similarity • 12B • Updated about 3 hours ago • 8.63k • 21
jinaai/jina-embeddings-v4

Visual Document Retrieval • 4B • Updated Sep 2 • 81.3k • 412
voyageai/voyage-multimodal-3

Updated Nov 1, 2024 • 16
PleIAs/SYNTH

Viewer • Updated 7 days ago • 68M • 28.1k • 131
scb10x/typhoon-ocr-7b

Image-to-Text • 8B • Updated Jul 11 • 8.31k • 76
janhq/Jan-v2-VL-high

Image-Text-to-Text • 9B • Updated 5 days ago • 455 • 63
ServiceNow/GroundNext-7B-V0

Image-Text-to-Text • 8B • Updated 7 days ago • 260 • 20
jzhang533/PaddleOCR-VL-For-Manga

Image-Text-to-Text • 1.0B • Updated 6 days ago • 275 • 105
lightonai/LightOnOCR-1B-1025

Image-to-Text • Updated 6 days ago • 19.2k • 166
numind/NuExtract-2.0-8B

Image-Text-to-Text • 8B • Updated 5 days ago • 3k • 44
Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B

Paper • 2511.06221 • Published 10 days ago • 103
Photoroom/prx-1024-t2i-beta

Text-to-Image • Updated 5 days ago • 481 • 56
ByteDance/Ouro-1.4B

Text Generation • Updated 2 days ago • 5.97k • 50