![translation](https://cdn.durumis.com/common/trans.png)
これはAIが翻訳した投稿です。
言語を選択
durumis AIが要約した文章
- 企業内部データをLLM学習に必須的に提供しなければならない。
- OpenAI API Key、LangChain、Streamlit、FAISS、ChromaDBなどの技術スタックを使用してPDFファイルを 処理することができます。
- このテーマに関連する多くの資料がありますが、一箇所にまとめられたGitHubリポジトリを参照するのが良いでしょう。
llm 統合 AI アプリケーションを開発していると、企業の内部データにアクセスする必要性がほぼ必須となります。企業の内部データは llm の学習に提供されないため、 このようなデータはさまざまな形式のドキュメントまたはデータベースで管理されます。 まず、PDF 形式のファイルに保存されたものから処理してみましょう。
OpenAI API Key、LangChain、Streamlit を使用します。Streamlit を使用しているため、UI コードが短く、アクセスしやすいです。
ベクトルストアとして FAISS を使用します。
ベクトルストアとして ChromaDB を使用します。ビデオ関連のリポジトリはこれのようです。
YouTuber の GitHub には、他にも参照できるものがあります。
説明もよくされています。時間があれば、説明内容も整理したいです。
UI に対する設定がいくつかあります。
プレビュー機能があります。
他の場所では扱われていない LangChain クラスを扱っています。
テクノロジースタックが少し異なります。
あまりにも多く出てきます。 絞り込みに絞り込んだのですが、それでもたくさんあります。 1 つだけ見たい場合は、これを見て、下記のリポジトリのコードを理解し、残りの関連動画はすべて削除しました。 もうこのトピックは見ません。