connectpool

Follow

🏠

Working from home

Gimme More connectpool

🏠

Working from home

Follow

M.S. student in Multimodal LLMs | Vision-Language Modeling, Multimodal RAG, Efficient VLM Evaluation

0 followers · 1 following

Carnegie Mellon University
Pittsburgh, PA, USA
10:38 (UTC -10:00)

Highlights

Developer Program Member

Popular repositories Loading

multimodal-rag-lab multimodal-rag-lab Public

Compact multimodal RAG baseline with chunking, BM25 retrieval and prompt assembly.

Python
vlm-eval-mini vlm-eval-mini Public

Fast sanity-check evaluator for vision-language model outputs.

Python
vision-token-bridge vision-token-bridge Public

Tiny PyTorch adapter bridging visual features into language-token embeddings.

Python
connectpool connectpool Public

Profile README for MLLM research and open-source roadmap.
SoulNexus SoulNexus Public

Forked from LingByte/SoulNexus

Go
BIRD-RL BIRD-RL Public

Forked from bird-bench/BIRD-RL

Open-Source Agentic RL for SQL Tasks

Python