🧠 AI Visual Assistant with Gemini 2.0 & Streamlit

An interactive multimodal application that allows you to upload or capture screenshots of images and ask intelligent questions about them using Gemini 2.0 Flash.

🚀 Features

Upload or capture screenshots of any window
Intelligent image analysis using Google’s Gemini 2.0 Flash
Streamlit UI for easy interaction
Supports custom queries and AI-generated insights

🖼 Example Use Case

Upload a screenshot of a chart or window

Ask questions like:

"What does this chart represent?" "Summarize the image contents" "Identify key trends or values"

🧠 Powered By

Google Gemini 2.0 Flash via google-genai Streamlit Pillow, PyAutoGUI, PyGetWindow

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
images		images
.gitignore		.gitignore
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

🧠 AI Visual Assistant with Gemini 2.0 & Streamlit

🚀 Features

🖼 Example Use Case

About

Uh oh!

Releases

Packages

Languages

Farhan-Feb/AI-Visual-Assistant-Multimodal

Folders and files

Latest commit

History

Repository files navigation

🧠 AI Visual Assistant with Gemini 2.0 & Streamlit

🚀 Features

🖼 Example Use Case

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages