Mr. Know-All 2号 – 2023年8月

作成言語: 韓国語
•
基準国家: すべての国家
•
IT（情報技術）

作成: 2024-03-21

作成: 2024-03-21 14:26

LLMと連携したAIアプリを開発していると、企業の内部データにアクセスする必要性がほぼ必須になります。企業の内部データをLLMの学習に提供しないことになります。このようなデータは、様々な形式のドキュメントやデータベースで管理されるでしょう。まずは、PDF形式のファイルに保存されているものから処理してみようということです。

OpenAI API Key、LangChain、Streamlitを使用します。Streamlitを使用しているので、UIコードが短く、アクセスしやすいです。

ベクターストアにはFAISSを使用します。

ベクターストアにはChromaDBを使用します。動画関連のリポジトリはこちらのようです。

GitHub - AIAnytime/Search-Your-PDF-App: Search Your PDF App using Langchain, ChromaDB, Sentence Transformers, and LaMiNi LM Model. This app is completely powered by Open Source Models. No OpenAI key is required.: Search Your PDF App using Langchain, ChromaDB, Sentence Transformers, and LaMiNi LM Model. This app is completely powered by Open Source Models. No OpenAI key is required. - AIAnytime/Search-Your-...

github.com

GitHub - AIAnytime/Search-Your-PDF-App: Search Your PDF App using Langchain, ChromaDB, Sentence Transformers, and LaMiNi LM Model. This app is completely powered by Open Source Models. No OpenAI key is required.

YouTuberのGitHubには、他の参照できるものもたくさんあります。

AIAnytime - Overview: Generative AI Evangelist | Creator of "AI Anytime" YouTube Channel - AIAnytime

github.com

説明も分かりやすくしてくれています。時間が許せば、説明内容も整理したいです。

GitHub - InsightEdge01/ChainlitPDFchatBot: Contribute to InsightEdge01/ChainlitPDFchatBot development by creating an account on GitHub.

github.com

GitHub - InsightEdge01/ChainlitPDFchatBot

UIに関する設定がいくつかあります。

GitHub - InsightEdge01/ChainlitPDFchatBot: Contribute to InsightEdge01/ChainlitPDFchatBot development by creating an account on GitHub.

github.com

プレビュー機能があります。

GitHub - RajKKapadia/DLAI-Langchain: This is a respository for the DeepLearning AI Langchain course.: This is a respository for the DeepLearning AI Langchain course. - RajKKapadia/DLAI-Langchain

github.com

GitHub - RajKKapadia/DLAI-Langchain: This is a respository for the DeepLearning AI Langchain course.

他の場所では扱っていないLangChainクラスを扱っています。

テクノロジースタックが少し違いますね。

多すぎる。絞り込んで絞り込んだのですが、まだ多いです。一つだけ見ることをお勧めするなら、これを見て、下記のリポジトリのコードを理解し、残りの関連動画は全て削除しました。これ以上このテーマは触れません。

https://github.com/mayooear/gpt4-pdf-chatbot-langchain⁠⁠⁠⁠⁠⁠⁠

GitHub - mayooear/gpt4-pdf-chatbot-langchain: GPT4 & LangChain Chatbot for large PDF docs: GPT4 & LangChain Chatbot for large PDF docs. Contribute to mayooear/gpt4-pdf-chatbot-langchain development by creating an account on GitHub.

github.com

GitHub - mayooear/gpt4-pdf-chatbot-langchain: GPT4 & LangChain Chatbot for large PDF docs

durumis AIが要約した記事

LLMベースのAIアプリ開発において、企業内部データへのアクセスが不可欠であり、特にPDFファイル形式のデータ処理のためにLangChain、Streamlit、FAISSまたはChromaDBを活用する方法について説明します。
OpenAI API Key、LangChain、Streamlitなどを活用してUI開発およびベクターストア構築、PDFファイルベースのチャットボット実装などをデモし、様々な関連リポジトリとYouTubeチャンネル情報を提供します。
様々なテクノロジースタックが使用されますが、mayooear/gpt4-pdf-chatbot-langchainリポジトリを中心に学習し、その他の関連情報は除外して、当該テーマに関する学習を完了することを推奨します。

コメント0