API-Keys & Provider
LLM-Provider im Überblick API-Keys, Free Tiers, Guthabenmodelle und Google-Colab-Integration
Inhaltsverzeichnis
- Übersicht der LLM-Provider
- Google Colab Integration
- Kostenlose Provider-Empfehlungen
- Lokale Modelle ohne API-Keys
- Sicherheitshinweise
- Weiterführende Links
- Abgrenzung zu verwandten Dokumenten
Übersicht der LLM-Provider
Diese Tabelle bietet eine Übersicht (Stand: 1. Mai 2026) über LLM-Provider, LangChain-Integrationen, Kostenmodelle und kostenlose Einstiegsoptionen. Zahlungsarten wie Kreditkarte, Rechnung, Guthaben oder regionale Wallets ändern sich häufig und werden deshalb nicht als verlässliches Kurskriterium geführt. Maßgeblich ist, ob ein API-Key ohne Abrechnung nutzbar ist oder ob vor der ersten produktiven Nutzung Billing aktiviert werden muss.
| Model Provider | Integration Package | Kostenmodell | Kostenlos nutzbar? | Hinweise / Besonderheiten |
|---|---|---|---|---|
| openai | langchain-openai | Prepaid API-Credits; Mindestaufladung typischerweise 5 USD | Nein, außer ggf. zeitlich begrenztes Startguthaben | Sehr verbreitet, gute LangChain-Unterstützung. Gekaufte Credits verfallen nach einem Jahr und sind nicht erstattbar. |
| anthropic | langchain-anthropic | Prepaid Usage Credits oder Enterprise-Abrechnung | Nein, außer ggf. gewährtes Startguthaben | API- und Workbench-Nutzung laufen über vorab gekaufte Credits; Credit-Verfall nach einem Jahr. |
| azure_openai | langchain-openai | Azure Pay-as-you-go, Azure-Abrechnung oder Enterprise-Vertrag | Nein, ggf. Azure-Guthaben | OpenAI-Modelle über Azure-Ressourcen, häufig relevant für Unternehmen mit bestehender Azure-Umgebung. |
| azure_ai | langchain-azure-ai | Azure Pay-as-you-go, Azure-Abrechnung oder Enterprise-Vertrag | Modell- und Dienstabhängig | Breiter Azure-AI-Zugang; konkrete Kosten hängen vom Dienst und Modell ab. |
| google_vertexai | langchain-google-vertexai | Google-Cloud-Billing, Pay-as-you-go | Nein, ggf. Google-Cloud-Guthaben | Enterprise- und Cloud-Variante für Gemini und weitere Modelle; nicht mit dem kostenlosen Gemini-API-Tier in AI Studio gleichsetzen. |
| google_genai | langchain-google-genai | Gemini API Free Tier oder Paid Tier über Google Cloud Billing | Ja, modell- und regionabhängig | Für Kurse besonders geeignet: API-Key über Google AI Studio, Free Tier mit Rate Limits; im Free Tier können Daten zur Produktverbesserung verwendet werden. |
| bedrock | langchain-aws | AWS Pay-as-you-go, On-Demand, Batch oder Provisioned Throughput | Nein, ggf. AWS-Guthaben | Zugriff auf Modelle verschiedener Anbieter über AWS Bedrock; Kosten entstehen pro Modellnutzung und Token. |
| bedrock_converse | langchain-aws | AWS Pay-as-you-go | Nein, ggf. AWS-Guthaben | Converse-API für einheitlichere Chat-/Conversation-Aufrufe in Bedrock. |
| cohere | langchain-cohere | Trial Key oder Production Key | Ja, Trial Key mit Limits | Trial Keys sind kostenlos, aber begrenzt; Production Keys sind für produktive Nutzung vorgesehen. |
| fireworks | langchain-fireworks | Pay-as-you-go; freie Startcredits für neue Nutzer möglich | Ja, als Startcredits abhängig vom Account | Serverless Inference, Deployments und Fine-Tuning werden nutzungsabhängig abgerechnet. |
| together | langchain-together | Pay-as-you-go / Credits | Ja, abhängig von aktuellen Startcredits | Viele Open-Weight-Modelle und schnelle Inferenz; genaue Free-Credit-Regeln regelmäßig prüfen. |
| mistralai | langchain-mistralai | Experiment Plan oder Scale Plan | Ja, Experiment Plan mit restriktiven Limits | Der kostenlose Experiment Plan dient Evaluation und Prototyping; für produktive Nutzung ist Scale vorgesehen. |
| huggingface | langchain-huggingface | Hub-Zugang, Inference Provider, eigene Tokens oder lokale Modelle | Ja, abhängig vom Modell und Inference-Anbieter | Sehr große Modellvielfalt; Kosten und Limits hängen stark davon ab, ob Hub, Serverless Inference, Dedicated Endpoint oder lokale Ausführung genutzt wird. |
| groq | langchain-groq | Free Tier oder Developer/Production Tier | Ja, Free Tier mit Rate Limits | Sehr schnelle Inferenz für unterstützte Modelle; Free Tier ohne Kreditkarte, aber nicht unbegrenzt. |
| ollama | langchain-ollama | Lokalinstallation | Ja | Keine Cloud-API-Kosten; benötigt lokale oder Colab-Ressourcen und passende Modellgröße. |
| google_anthropic_vertex | langchain-google-vertexai | Google-Cloud-Billing über Vertex AI | Nein, ggf. Google-Cloud-Guthaben | Anthropic-Modelle über Vertex AI; Abrechnung und Verfügbarkeit richten sich nach Google Cloud und Region. |
| deepseek | langchain-deepseek | Guthaben-/Top-up-Modell; Abzug nach Tokenverbrauch | Teilweise, wenn gewährtes Guthaben vorhanden ist | Offizielle Preise werden pro 1M Token ausgewiesen; Nutzung wird vom aufgeladenen oder gewährten Guthaben abgezogen. |
| ibm | langchain-ibm | IBM watsonx.ai / Enterprise-Abrechnung | Teilweise, abhängig vom IBM-Plan | Vor allem für Enterprise- und Governance-Szenarien relevant. |
| nvidia | langchain-nvidia-ai-endpoints | NVIDIA NIM / API-Endpunkte, Credits oder Enterprise | Teilweise, abhängig vom aktuellen NVIDIA-Angebot | OpenAI-kompatible NIM-Endpunkte; stark für selbst gehostete oder GPU-nahe Szenarien. |
| xai | langchain-xai | Free/Promotional Credits, Prepaid Credits oder monatliche Rechnung | Teilweise, wenn Promo- oder Free Credits vorhanden sind | API-Verbrauch wird zuerst gegen Free/Promo-Credits, dann gegen Prepaid Credits und danach ggf. Rechnungslimit gebucht. |
| perplexity | langchain-perplexity | API-Preise nach Modell, Token und Such-/Tool-Nutzung | Nein, ggf. Credits abhängig vom Plan | Besonders relevant für Websuche und Sonar/Agent-APIs; Tool-Aufrufe können zusätzlich zu Modellkosten berechnet werden. |
Google Colab Integration
Sichere API-Key Verwaltung in Colab
Best Practice: Colab Secrets verwenden
LangSmith (EU/US-Endpunkte): Wenn Sie LangSmith nutzen, legen Sie Account und API-Key im EU-Workspace an (
https://eu.smith.langchain.com/) und verwenden Sie alsLANGSMITH_ENDPOINTden EU-API-Endpointhttps://eu.api.smith.langchain.com.
# Installiere benötigte Bibliothek
!pip install langchain-{provider}
So speichern Sie Keys in Colab Secrets:
- Klicken Sie auf das Schlüssel-Symbol 🔑 in der linken Sidebar
- Fügen Sie Ihren API-Key hinzu (z.B.
OPENAI_API_KEY)
Provider-spezifische Installation
OpenAI:
!pip install langchain-openai
from langchain.chat_models import init_chat_model
llm = init_chat_model("openai:gpt-4o-mini", temperature=0.0)
Google Gemini:
!pip install langchain-google-genai
from langchain.chat_models import init_chat_model
llm = init_chat_model("google:gemini-pro", temperature=0.0)
Groq:
!pip install langchain-groq
from langchain.chat_models import init_chat_model
llm = init_chat_model("groq:mixtral-8x7b-32768", temperature=0.0)
Kostenlose Provider-Empfehlungen
Für Anfänger & Studenten
1. Google AI Studio (Gemini)
- ✅ Free Tier für die Gemini API, modell- und regionabhängig
- ✅ Google AI Studio bleibt als Oberfläche kostenlos nutzbar
- ✅ Native Colab-Integration
- ✅ Multimodal (Text, Bild, Audio)
2. Groq
- ✅ Sehr schnell (Hardware-beschleunigt)
- ✅ Großzügige kostenlose Limits
- ✅ Open-Source-Modelle (Llama, Mixtral)
3. Cloudflare Workers AI
- ✅ Kostenloser Einstieg mit Limits
- ✅ Keine Kreditkarte nötig
- ✅ Mehrere Modelle verfügbar
Für Produktivnutzung
OpenAI API
- 💰 Prepaid API-Credits mit Mindestaufladung typischerweise 5 USD
- ✅ Beste Qualität für komplexe Aufgaben
- ✅ Breite LangChain-Unterstützung
Together AI
- 💰 Freemium mit kostenlosen Credits
- ✅ Open-Source-Modelle zu günstigen Preisen
Lokale Modelle ohne API-Keys
Ollama in Google Colab
Für vollständige Kontrolle und keine API-Kosten:
# Ollama in Colab installieren (mit GPU-Unterstützung)
!curl -fsSL https://ollama.com/install.sh | sh
!ollama serve &
!ollama pull llama3
# Mit LangChain verwenden
from langchain_community.llms import Ollama
llm = Ollama(model="llama3")
Vorteile:
- ✅ Keine API-Kosten
- ✅ Vollständige Datenkontrolle
- ✅ Offline-fähig
- ✅ GPU-beschleunigt in Colab
Nachteile:
- ⚠️ Langsamere Performance als Cloud-APIs
- ⚠️ Begrenzte Modellgröße (RAM-Limits)
Sicherheitshinweise
❌ NIEMALS:
- API-Keys in Code oder Notebooks committen
- Keys in öffentlichen Repositories veröffentlichen
- Keys unverschlüsselt in Dateien speichern
✅ IMMER:
.env-Dateien für lokale Entwicklung verwenden- Colab Secrets für Notebooks nutzen
- API-Keys regelmäßig rotieren
- Nutzungslimits überwachen
Weiterführende Links
Abgrenzung zu verwandten Dokumenten
| Dokument | Frage |
|---|---|
| Erste Agenten | Wo starte ich als Entwickler mit API-Keys & Provider? |
| Qualität und Sicherheit | Welche Produktionsstandards gelten für API-Keys & Provider? |
Version: 1.1
Stand: Mai 2026
Kurs: KI-Agenten. Verstehen. Anwenden. Gestalten.