Skip to content

პროვაიდერები

PRX მხარს უჭერს 14 LLM პროვაიდერს, თითოეული ახორციელებს საერთო Provider თვისებას. თვისება აბსტრაქტირებს API ფორმატების, ავტორიზაციის, სტრიმინგის და ინსტრუმენტების გამოძახების განსხვავებებს, წარმოადგენს ერთიან ინტერფეისს როუტერისა და სისტემის დანარჩენი ნაწილისთვის.

მხარდაჭერილი პროვაიდერები

Section titled “მხარდაჭერილი პროვაიდერები”
პროვაიდერიმოდელებიავტორიზაციაშენიშვნები
AnthropicClaude Opus, Sonnet, HaikuAPI გასაღები, OAuth (ავტოგანახლება)ძირითადი პროვაიდერი; OAuth ტოკენის განახლება ავტომატურია
OpenAIGPT-4o, GPT-4.1, o1, o3, o4-miniAPI გასაღებისრული ფუნქციის გამოძახების მხარდაჭერა
OpenAI Codexcodex-miniAPI გასაღებიკოდზე სპეციალიზებული; ინსტრუმენტის გამოყენება Responses API-ით
Google GeminiGemini 2.5 Pro/FlashAPI გასაღებინეიტივ ფუნქციის გამოძახება
DashScope / QwenQwen-Max, Qwen-Plus, Qwen-TurboAPI გასაღებიAlibaba Cloud; თავსებადი API
Ollamaნებისმიერი GGUF მოდელილოკალური (გასაღები არ სჭირდება)ლოკალური ინფერენსი; ინსტრუმენტების გამოძახების გარეშე
OpenRouterნებისმიერი მოდელი OpenRouter-ზეAPI გასაღებიაგრეგატორი; მარშრუტიზაცია 100+ მოდელზე
AWS BedrockClaude, Titan, LlamaIAM სერთიფიკატებიSigV4 ხელმოწერა; საწარმოო გაშლა
GitHub CopilotGPT-4o, ClaudeCopilot ტოკენიVS Code / CLI Copilot ავტორიზაციის გამოყენება
GLM / ZhipuGLM-4, GLM-4VAPI გასაღებიჩინეთის ბაზარი; ხედვის მხარდაჭერა
xAIGrokAPI გასაღებიOpenAI-თავსებადი API
LiteLLMნებისმიერი მოდელი LiteLLM პროქსის უკანAPI გასაღები ან ლოკალურიერთიანი პროქსი; სასარგებლოა მორგებული გაშლებისთვის
vLLMნებისმიერი მოდელი vLLM-ით მოწოდებულილოკალური ბოლო წერტილიმაღალი გამტარუნარიანობის ლოკალური ინფერენსი
HuggingFaceInference API მოდელებიAPI ტოკენიHuggingFace Inference Endpoints

ინსტრუმენტების გამოძახების აბსტრაქცია

Section titled “ინსტრუმენტების გამოძახების აბსტრაქცია”

LLM პროვაიდერები განსხვავდებიან ინსტრუმენტების/ფუნქციების გამოძახების დამუშავებაში. PRX ამას ნორმალიზებს ორი რეჟიმით:

ნეიტივ ინსტრუმენტების გამოძახება

Section titled “ნეიტივ ინსტრუმენტების გამოძახება”

პროვაიდერები, რომლებიც ნეიტივად მხარს უჭერენ სტრუქტურირებულ ინსტრუმენტების გამოძახებას (Anthropic, OpenAI, Google Gemini და ა.შ.), იღებენ ინსტრუმენტების განმარტებებს API მოთხოვნის ნაწილად. პროვაიდერი აბრუნებს სტრუქტურირებულ tool-use ბლოკებს, რომლებსაც PRX აანალიზებს და პირდაპირ ასრულებს.

PromptGuided ინსტრუმენტების გამოძახება

Section titled “PromptGuided ინსტრუმენტების გამოძახება”

პროვაიდერებისთვის ნეიტივ ინსტრუმენტების მხარდაჭერის გარეშე (Ollama, ზოგიერთი vLLM მოდელი), PRX ინსტრუმენტების განმარტებებს ჩასვამს სისტემის პრომპტში ინსტრუქციებთან ერთად, რომ მოდელმა გამოსცეს ინსტრუმენტების გამოძახებები სტრუქტურირებული ტექსტის ფორმატში. შემდეგ PRX აანალიზებს მოდელის გამოსავალს ინსტრუმენტების გამოძახებების ამოსაღებად.

┌──────────────────────────────────┐
│ ინსტრუმენტის გამოძახების ნაკადი │
│ │
│ ინსტრუმენტები განსაზღვრული ──┬── ნეიტივი ──── პროვაიდერის API (სტრუქტურირებული)
│ │
│ └── PromptGuided ── სისტემის პრომპტის ინექცია
│ ── გამოსავლის ანალიზი
└──────────────────────────────────┘

ეს აბსტრაქცია ნიშნავს, რომ ყოველ პროვაიდერს შეუძლია მონაწილეობა აგენტურ ინსტრუმენტების ციკლებში, ნეიტივი მხარდაჭერის მიუხედავად.

ყოველი პროვაიდერი გარშემორტყმულია ReliableProvider-ით, რომელიც ამატებს გამძლეობას:

ავტომატური ხელახალი ცდები

Section titled “ავტომატური ხელახალი ცდები”

წარუმატებელი მოთხოვნები ხელახლა ცდება ექსპონენციალური შეფერხებით. გარსი კლასიფიცირებს შეცდომებს ხელახალი ცდის ქცევის განსასაზღვრად:

შეცდომის კლასიხელახალი ცდაქცევა
მოთხოვნის ლიმიტი (429)დიახპატივს სცემს Retry-After ჰედერს; ექსპონენციალური შეფერხება
სერვერის შეცდომა (5xx)დიახმაქსიმუმ 3 ხელახალი ცდა ჯიტერით
ავტორიზაციის შეცდომა (401/403)არამყისიერი წარუმატებლობა; იწვევს ტოკენის განახლებას OAuth პროვაიდერებისთვის
ტაიმაუტიდიახხელახალი ცდა გაზრდილი ტაიმაუტით
კონტექსტის სიგრძე გადაჭარბებულიარამყისიერი წარუმატებლობა; გამომძახებელმა უნდა შეკვეცოს

პროვაიდერის სარეზერვო ჯაჭვები

Section titled “პროვაიდერის სარეზერვო ჯაჭვები”

როცა პროვაიდერი ამოიწურება (ყველა ხელახალი ცდა წარუმატებელია), ReliableProvider გადავა შემდეგ პროვაიდერზე კონფიგურირებულ ჯაჭვში:

[router.fallback]
chain = ["anthropic/claude-sonnet-4-20250514", "openai/gpt-4o", "google/gemini-2.5-pro"]

როუტერი ცდის ყოველ პროვაიდერ/მოდელის წყვილს თანმიმდევრობით. თუ ძირითადი გაჩერებულია ან ლიმიტირებულია, მოთხოვნა გამჭვირვალედ გადადის შემდეგ ვარიანტზე.

მოდელის სარეზერვო

Section titled “მოდელის სარეზერვო”

ერთი პროვაიდერის ფარგლებში, მოდელის დონის სარეზერვოც მხარდაჭერილია:

[providers.anthropic]
models = ["claude-sonnet-4-20250514", "claude-haiku-4-20250414"]
fallback_order = ["claude-sonnet-4-20250514", "claude-haiku-4-20250414"]

თუ სასურველი მოდელი მიუწვდომელია, PRX ჩამოწევს შემდეგ მოდელზე იმავე პროვაიდერთან, სანამ ცდის ჯვარედინ-პროვაიდერულ სარეზერვოს.

[providers.anthropic]
enabled = true
api_key = "sk-ant-..."
# ან გამოიყენეთ OAuth (ტოკენი ავტომატურად განახლდება)
# oauth_client_id = "..."
# oauth_client_secret = "..."
default_model = "claude-sonnet-4-20250514"
[providers.openai]
enabled = true
api_key = "sk-..."
default_model = "gpt-4o"
[providers.ollama]
enabled = true
base_url = "http://localhost:11434"
default_model = "llama3.1:70b"
tool_mode = "prompt_guided" # ნეიტივი ინსტრუმენტების გამოძახება არ არის

ყოველი პროვაიდერის ჩანაწერი მიუთითებს სერთიფიკატებს, ნაგულისხმევ მოდელს და არჩევით გადაფარვებს ინსტრუმენტების გამოძახების რეჟიმის, ტაიმაუტის და ხელახალი ცდის ლიმიტებისთვის.