Skip to content

Latest commit

 

History

History
297 lines (222 loc) · 24.2 KB

README.jp.md

File metadata and controls

297 lines (222 loc) · 24.2 KB

English | 中文 | 日本語

AIゲートウェイ

1つの高速でフレンドリーなAPIで200以上のLLMに確実にルーティング

Gateway Demo

License Discord Twitter npm version Better Stack Badge

AIゲートウェイは、250以上の言語、ビジョン、オーディオ、画像モデルへのリクエストを統一されたAPIで簡素化します。キャッシング、フォールバック、リトライ、タイムアウト、ロードバランシングをサポートし、最小の遅延でエッジデプロイが可能なプロダクション対応のゲートウェイです。

✅  超高速(9.9倍速)で小さなフットプリント(ビルド後約100kb)
✅  複数のモデル、プロバイダー、キー間でロードバランシング
✅  フォールバックでアプリの信頼性を確保
✅  デフォルトで自動リトライ(指数関数的フォールバック)
✅  リクエストタイムアウトの設定が可能
✅  マルチモーダルでビジョン、TTS、STT、画像生成モデルをサポート
✅  必要に応じてミドルウェアをプラグイン
✅  480Bトークン以上の実績
✅  エンタープライズ対応でセキュリティ、スケール、カスタムデプロイメントをサポート

Tip

⭐️ このリポジトリにスターを付けることで、新しいプロバイダー統合や機能のGitHubリリース通知を受け取ることができます。

star-2

スター履歴

セットアップとインストール

AIゲートウェイを使用するには、ホストされたAPIを使用するか、オープンソースまたはエンタープライズバージョンを自分の環境にセルフホストします。

👉 portkey.aiでホストされたゲートウェイ(最速)

ホストされたAPIは、ジェネレーティブAIアプリケーションのためのAIゲートウェイをセットアップする最速の方法です。私たちは毎日数十億のトークンを処理しており、Postman、Haptik、Turing、MultiOn、SiteGPTなどの企業でプロダクションで使用されています。

Get API Key

👉 オープンソースバージョンのセルフホスト(MITライセンス

ローカルでAIゲートウェイを実行するには、ターミナルで以下のコマンドを実行します。(npxがインストールされている必要があります)または、CloudflareDockerNode.jsなどのデプロイメントガイドを参照してください。

npx @portkey-ai/gateway

あなたのAIゲートウェイはhttp://localhost:8787で実行されています 🚀

👉 エンタープライズバージョンのセルフホスト

AIゲートウェイのエンタープライズバージョンは、組織管理ガバナンスセキュリティなどのエンタープライズ対応機能を提供します。オープンソース、ホスト、エンタープライズバージョンの比較はこちらをご覧ください。

エンタープライズデプロイメントアーキテクチャ、サポートされているプラットフォームについては、エンタープライズプライベートクラウドデプロイメントをご覧ください。

Book an enterprise AI gateway demo


AIゲートウェイを通じたリクエストの作成

OpenAI API & SDKと互換性あり

AIゲートウェイはOpenAI API & SDKと互換性があり、200以上のLLMに信頼性のある呼び出しを拡張します。ゲートウェイを通じてOpenAIを使用するには、クライアントを更新してゲートウェイのURLとヘッダーを含め、通常通りリクエストを行います。AIゲートウェイは、OpenAI形式で書かれたリクエストを指定されたプロバイダーが期待するシグネチャに変換できます。例を表示

Python SDKの使用   

Portkey Python SDKは、OpenAI Python SDKのラッパーであり、他のすべてのプロバイダーに対する追加パラメータのサポートを提供します。Pythonで構築している場合、これはゲートウェイに接続するための推奨ライブラリです

pip install -qU portkey-ai

Node.JS SDKの使用

Portkey JS/TS SDKは、OpenAI JS SDKのラッパーであり、他のすべてのプロバイダーに対する追加パラメータのサポートを提供します。JSまたはTSで構築している場合、これはゲートウェイに接続するための推奨ライブラリです

npm install --save portkey-ai

REST APIの使用

AIゲートウェイは、すべての他のプロバイダーとモデルに対する追加パラメータのサポートを備えたOpenAI互換エンドポイントをサポートします。APIリファレンスを表示

その他の統合

言語 サポートされているSDK
JS / TS LangchainJS
LlamaIndex.TS
Python
Langchain
LlamaIndex
Go go-openai
Java openai-java
Rust async-openai
Ruby ruby-openai

ゲートウェイクックブック

トレンドのクックブック

最新のクックブック

サポートされているプロバイダー

25以上のプロバイダー6以上のフレームワークとのゲートウェイ統合を探索してください。

プロバイダー サポート ストリーム
OpenAI
Azure OpenAI
Anyscale
Google Gemini & Palm
Anthropic
Cohere
Together AI
Perplexity
Mistral
Nomic
AI21
Stability AI
DeepInfra
Ollama
Novita AI

サポートされている200以上のモデルの完全なリストを表示



エージェント

ゲートウェイは、人気のあるエージェントフレームワークとシームレスに統合されます。ドキュメントを読む

フレームワーク 200以上のLLMを呼び出す 高度なルーティング キャッシング ロギングとトレース* オブザーバビリティ* プロンプト管理*
Autogen
CrewAI
LangChain
Phidata
Llama Index
Control Flow
独自のエージェントを構築する

*ホストされたアプリでのみ利用可能です。詳細なドキュメントはこちらをご覧ください。

機能

フォールバック
失敗したリクエストに対して別のプロバイダーやモデルにフォールバックします。トリガーするエラーを指定できます。アプリケーションの信頼性を向上させます。

自動リトライ
失敗したリクエストを最大5回自動的にリトライします。指数関数的バックオフ戦略により、リトライ試行の間隔を空けてネットワークの過負荷を防ぎます。

ロードバランシング
複数のAPIキーやAIプロバイダー間でLLMリクエストを重み付けして分散させ、高可用性と最適なパフォーマンスを確保します。

リクエストタイムアウト

応答しないLLMリクエストを自動的に終了させるために、詳細なリクエストタイムアウトを設定します。

マルチモーダルLLMゲートウェイ
ビジョン、オーディオ(テキストから音声、音声からテキスト)、画像生成モデルを複数のプロバイダーから呼び出すことができます — すべてOpenAIのシグネチャを使用して

ガードレール

指定されたチェックに従ってLLMの入力と出力をリアルタイムで検証します。独自のチェックを作成するか、20以上の事前構築されたガードレールから選択できます。

これらの機能は、x-portkey-configヘッダーまたはSDKのconfigパラメータに追加されたゲートウェイ設定を通じて構成されます。

以下は、上記の機能を示すサンプル設定JSONです。すべての機能はオプションです。

{
	"retry": { "attempts": 5 },
	"request_timeout": 10000,
	"strategy": { "mode": "fallback" }, // または 'loadbalance' など
	"targets": [{
		"provider": "openai",
		"api_key": "sk-***"
	},{
		"strategy": {"mode": "loadbalance"}, // オプションのネスト
		"targets": {...}
	}]
}

次に、APIリクエストに設定を使用します。

ゲートウェイ設定の使用

リクエストで設定オブジェクトを使用する方法については、こちらのガイドをご覧ください。


ゲートウェイエンタープライズバージョン

AIアプリを信頼性将来の互換性を高め、完全なデータセキュリティプライバシーを確保します。

✅  セキュアなキー管理 - ロールベースのアクセス制御とトラッキングのため
✅  シンプルでセマンティックなキャッシング - 繰り返しのクエリを高速に提供し、コストを削減
✅  アクセス制御とインバウンドルール - 接続できるIPと地域を制御
✅  PII削除 - リクエストから自動的に機密データを削除し、意図しない露出を防止
✅  SOC2、ISO、HIPAA、GDPRコンプライアンス - ベストセキュリティプラクティスのため
✅  プロフェッショナルサポート - 機能の優先順位付けとともに

エンタープライズデプロイメントについての相談を予約する


貢献

最も簡単な貢献方法は、good first issueタグの付いた問題を選ぶことです 💪。貢献ガイドラインはこちらをご覧ください。

バグ報告?こちらで提出 | 機能リクエスト?こちらで提出


コミュニティ

世界中の成長するコミュニティに参加して、AIに関するヘルプ、アイデア、ディスカッションを行いましょう。

Rubeus Social Share (4)