- GitHub - AIAnytime/Search-Your-PDF-App: Search Your PDF App using Langchain, ChromaDB, Sentence Transformers, and LaMiNi LM Model. This app is completely powered by Open Source Models. No OpenAI key is required.
- Search Your PDF App using Langchain, ChromaDB, Sentence Transformers, and LaMiNi LM Model. This app is completely powered by Open Source Models. No OpenAI key is required. - AIAnytime/Search-Your-...
LLMと連携したAIアプリを開発していると、企業の内部データにアクセスする必要性がほぼ必須になります。企業の内部データをLLMの学習に提供しないことになります。このようなデータは、様々な形式のドキュメントやデータベースで管理されるでしょう。まずは、PDF形式のファイルに保存されているものから処理してみようということです。
OpenAI API Key、LangChain、Streamlitを使用します。Streamlitを使用しているので、UIコードが短く、アクセスしやすいです。
ベクターストアにはFAISSを使用します。
ベクターストアにはChromaDBを使用します。動画関連のリポジトリはこちらのようです。
YouTuberのGitHubには、他の参照できるものもたくさんあります。
説明も分かりやすくしてくれています。時間が許せば、説明内容も整理したいです。
UIに関する設定がいくつかあります。
プレビュー機能があります。
他の場所では扱っていないLangChainクラスを扱っています。
テクノロジースタックが少し違いますね。
多すぎる。絞り込んで絞り込んだのですが、まだ多いです。一つだけ見ることをお勧めするなら、これを見て、下記のリポジトリのコードを理解し、残りの関連動画は全て削除しました。これ以上このテーマは触れません。
コメント0