English version below ...
Dieses Programm ermöglicht die Interaktion mit Google Gemini AI, um Prompts zu senden und Antworten in verschiedenen Formaten (Markdown, ANSI, HTML) zu empfangen. Das Ziel ist die nahtlose Integration von KI-Funktionen in den Arbeitsablauf des Benutzers durch die Unterstützung verschiedener Eingabe- und Ausgabekanäle sowie einer Historienverwaltung.
Das Programm ist für BSD, Linux, macOS und Windows verfügbar.
Dieses Programm erlaubt die Nutzung verschiedener Modelle der Google Gemini KI-Familie. Viele Parameter des KI-Modells, wie z.B. die Anzahl der Antworten oder die Varianz, können in der Konfiguration angepasst werden.
- Mehrere Eingabequellen (Terminal, Datei-Polling, HTTP).
- Unterstützung für Datei-Uploads als Teil des Prompts.
- Konfigurierbare Ausgabeformate (Markdown, ANSI, HTML).
- Speicherung des Verlaufs (History) für jedes Ausgabeformat.
- Chat-Modus für konversationelle Interaktionen.
- Proxy-Unterstützung für Umgebungen ohne direkten Internetzugang.
- Detaillierte Konfigurationsmöglichkeiten über YAML und Kommandozeilen-Flags.
- Anzeige verfügbarer Gemini-Modelle.
- OS-spezifische Konfigurationen (z.B. für externe Viewer-Applikationen).
- Einbettung von Standard-Konfigurationsdateien und Web-Assets für eine einfache Bereitstellung.
- Gute Benutzerführung durch informative Ausgaben (Konfiguration, Modell-Infos, Usage-Text).
- Verarbeitung von Metadaten aus der Gemini-Antwort (Token-Nutzung, Zitate, Grounding-Infos wie Web-Quellen).
Die Anwendung enthält intern alle für die Nutzung notwendigen Komponenten. Fehlende Komponenten werden beim Start automatisch installiert. Daher ist es ausreichend, die Anwendung in ein beliebiges Verzeichnis zu kopieren und zu starten. Dies ermöglicht eine einfache projektbezogene Nutzung der Anwendung. Die Anwendung kann umfangreich über eine YAML-Datei konfiguriert werden.
Abfragen können über verschiedene Kanäle eingegeben werden: direkt im Terminal, über die Textdatei 'prompt-input.txt', oder über 'localhost' (Port 4242). Für eine komfortablere Prompterstellung und -ausführung kann die Webseite 'prompt-input.html' verwendet werden.
Die Abfrage+Antwort-Paare werden in verschiedenen Formaten ausgegeben: im Terminal (ANSI-farbig), als Markdown-Dateien (für Editoren/Viewer) und als HTML-Seiten (für Browser). Die Browser-Ausgabe bietet umfangreiche Anpassungs- und Nutzungsmöglichkeiten.
Benachrichtigungen informieren optional über den Start und Abschluss der Prompt-Verarbeitung, weil die Antwortgenerierung durch KI einige Zeit in Anspruch nehmen kann.
Dieses Programm kann im Terminal für direkte Eingabe und Ausgabe genutzt werden oder als Controller mit Eingabe per Datei/localhost und Ausgabe in GUI-Programmen.
Hinweise zum Nicht-Chat-Modus (Standard):
- Jeder Prompt wird unabhängig behandelt.
- Die KI erinnert sich nicht an frühere Interaktionen.
- Dateien werden mit jedem Prompt gesendet.
Hinweise zum Chat-Modus (-chatmode Flag):
- Die KI merkt sich den Gesprächsverlauf innerhalb einer Sitzung.
- Dateien werden nur mit dem ersten Prompt gesendet.
Wichtig: Diese Anwendung ist zur Nutzung der Google Gemini KI mit einem persönlichen Gemini API-Key gedacht. Beachten Sie die Hinweise zu Nutzungsbedingungen und Datenschutz im folgenden Abschnitt.
Beachten Sie die Google-Nutzungsbedingungen und die Richtlinie zur unzulässigen Nutzung von generativer KI für Gemini. Weitere Informationen zum Datenschutz finden Sie im Gemini-Apps Privacy Hub.
Wichtig: Die frei verfügbare Version von Google Gemini AI verwendet Ihre Eingabe- und Ausgabedaten zur Verbesserung des Modells. Verarbeiten Sie daher keine privaten oder vertraulichen Daten. Für die kostenpflichtige Version gelten andere Datenschutzrichtlinien.
Siehe auch häufig gestellte Fragen zu Gemini-Apps.
Jedes Gemini-KI-Modell hat ein maximales Output-Token-Limit, welches die Antwortlänge begrenzt. Ein Token entspricht dabei grob zirka 4 Zeichen, 100 Token in etwa 60 bis 80 englischen Wörtern. Wenn das KI-Modell das Output-Token-Limit beispielsweise auf 8192 Tokens definiert, entspricht dies einer maximalen Antwortlänge von 4900 bis 6500 englischen Wörtern.
Für die Nutzung ist ein persönlicher Gemini API-Key von Google erforderlich. Konfigurieren Sie den API-Key als Umgebungsvariable GEMINI_API_KEY
. Für die Internetverbindung kann optional ein Proxy konfiguriert werden.
- Konfiguration des API-Keys im Programm-Environment:
- macOS, Linux:
export GEMINI_API_KEY=Your-API-Key
- Windows:
setx GEMINI_API_KEY Your-API-Key
(erfordert Neustart des Terminals)
- macOS, Linux:
Programmfehler bitte in 'Issues' melden, Diskussionen und Fragen in 'Discussions'. Ausführbare Programme finden Sie im 'Releases'-Bereich.
This program enables interaction with a Google Gemini AI model to send prompts and receive responses in various formats (Markdown, ANSI, HTML). It aims to seamlessly integrate AI capabilities into the user's workflow by supporting various input and output channels along with a history feature.
The program is available for BSD, Linux, macOS, and Windows.
This program allows the use of various models from the Google Gemini AI family. Many parameters of the AI model, such as the number of responses or variance, can be adjusted in the configuration.
- Multiple input sources (terminal, file polling, HTTP).
- Support for file uploads as part of the prompt.
- Configurable output formats (Markdown, ANSI, HTML).
- History storage for each output format.
- Chat mode for conversational interactions.
- Proxy support for environments without direct internet access.
- Detailed configuration options via YAML and command-line flags.
- Display of available Gemini models.
- OS-specific configurations (e.g., for external viewer applications).
- Embedding of default configuration files and web assets for easy deployment.
- Good user guidance through informative outputs (configuration, model info, usage text).
- Processing of metadata from the Gemini response (token usage, citations, grounding info like web sources).
The application internally includes all components required for use. Missing components are automatically installed when the application is started. Therefore, copying the application to a directory and starting it is sufficient. This allows for simple project-related use. The application can be extensively configured via a YAML file.
Prompts can be entered via various channels: directly in the terminal, via the text file 'prompt-input.txt', or through 'localhost' (Port 4242). For more convenient prompt creation and execution, the webpage 'prompt-input.html' can be used.
The output of prompt+response pairs is available in various formats: in the terminal (ANSI colored), as Markdown files (for editors/viewers), and as HTML pages (for browsers). The browser output offers extensive customization and usage options.
Optional notifications inform users about the start and completion of prompt processing, as AI response generation can take some time.
This program can be used in a terminal for direct input and output or as a controller with input via file/localhost and output in GUI programs.
Notes concerning the non-chat mode (default):
- Each prompt is treated independently.
- The AI does not remember previous interactions.
- Files are sent with every prompt.
Notes concerning the chat mode (-chatmode flag):
- The AI remembers the conversation history within a session.
- Files are sent only with the initial prompt.
Important: This application is intended for use with Google Gemini AI using a personal Gemini API key. Please note the terms of service and privacy information in the following section.
Refer to the Google Terms of Service and the Generative AI Prohibited Use Policy for Gemini. For more information on privacy, please visit the Gemini Apps Privacy Hub.
Important: The freely available version of Google Gemini AI uses your input and output data to improve the model. Therefore, do not process any private or confidential data. Different privacy policies apply to the paid version.
See also Gemini Apps FAQ.
Each Gemini AI model has a maximum output token limit, which restricts the response length. One token roughly corresponds to approximately 4 characters, 100 tokens to about 60 to 80 English words. If, for example, the AI model defines the output token limit as 8192 tokens, that corresponds to a maximum response length of 4900 to 6500 English words.
A personal Gemini API key from Google is required for use. Configure the API key as an environment variable GEMINI_API_KEY
. An internet proxy can be optionally configured for the internet connection.
- Configure the API key in the program environment:
- macOS, Linux:
export GEMINI_API_KEY=Your-API-Key
- Windows:
setx GEMINI_API_KEY Your-API-Key
(requires terminal restart)
- macOS, Linux:
Please report program errors in 'Issues'. For discussions and questions, please use 'Discussions'. Executable programs are available in the 'Releases' section.