Computer Vision - a youali Collection

youali 's Collections

LLMs

Multimodal/Vision LLMs

Standalone Neural Modules

Diffusion Modles

RL

Computer Vision

Computer Vision

updated Nov 13, 2023

Florence-2: Advancing a Unified Representation for a Variety of Vision Tasks

Paper • 2311.06242 • Published Nov 10, 2023 • 95
FMViT: A multiple-frequency mixing Vision Transformer

Paper • 2311.05707 • Published Nov 9, 2023 • 9
PolyMaX: General Dense Prediction with Mask Transformer

Paper • 2311.05770 • Published Nov 9, 2023 • 11