Smolagents is FUTURE
Huggingface Smolagents are the future.I'll modify that based or shutdown project.
- godot-web-gradio-inapint - https://github.com/akjava/godot-web-gradio-inapint
There's a growing abundance of AI services available for users, including:
- Fast Chat AI APIs: Utilizing ChatGPT and Gemini via their APIs
- Local LLMs: Running LLMs like Ollama locally on a personal computer
- Specialized AI Services: Accessing various AI models hosted on Hugging Face Spaces
- Browser-Ready AI: Leveraging Onnx models that can be loaded directly in the browser
- Remote AI Servers: Utilizing Gradio-based servers hosted on cloud platforms like Google Colab and Paperspace
The goal is to create a user-friendly tool, accessible through a web browser, that can connect these disparate AI services, similar to Langchain or ComfyUI.
Imagine a browser-based platform where users can seamlessly combine different AI models to build custom AI tools.
This would enable functionalities like:
- Uploading an image and automatically generating descriptive captions
- Converting speech to text and summarizing its content
- Translating text and performing sentiment analysis
All within the convenience of a web browser.
In essence, the vision is to develop a user-friendly browser-based platform that empowers users to connect various AI services and build powerful, customized AI tools.
最近、色々なAIサービスが使えるようになってきました。例えば、
- 高速なチャットAI: ChatGPTやGeminiをAPI経由で利用
- 自分のPCで動くAI: Ollamaのようなローカルで動作するLLM
- 特定の機能に特化したAI: Hugging Face Spaceで公開されている様々なAIモデル
- ブラウザで直接動かせるAI: Onnx形式に変換されたAIモデル
- クラウド上で動くAI: Google ColabやPaperspace上でGradioを使って構築したAIサーバー
これらのバラバラのAIサービスを、まるでLangchainやComfyUIのように、ブラウザ上で繋げて、もっと便利に使えるようにしたいと考えています。
イメージとしては、ブラウザ上で色々なAIを組み合わせ、自分だけのAIツールを自由に作れるような感じです。
例えば、
- 画像をアップロードして、その内容を説明するキャプションを自動生成
- 音声をテキストに変換し、その内容を要約
- 文章を翻訳した後、感情分析を行う
といったことが、ブラウザ上で簡単にできるようになります。
このように、様々なAIサービスを繋げて、ブラウザ上で使いやすいAIツールを開発したいという構想です。