Мистер Всезнайка №2 – Август 2023

Язык написания: Корейский
•
Страна: Все страны
•
ИТ

Создано: 2024-03-21

Создано: 2024-03-21 14:26

При работе над приложением ИИ, интегрированным с LLM, доступ к внутренним данным компании практически обязателен. Внутренние данные компании не будут предоставлены для обучения LLM. Эти данные будут храниться в различных форматах документов или баз данных. Давайте начнем с обработки данных, хранящихся в файлах PDF.

Мы будем использовать ключ API OpenAI, LangChain и Streamlit. Так как мы используем Streamlit, код пользовательского интерфейса будет коротким и простым в использовании.

В качестве векторного хранилища будем использовать FAISS.

В качестве векторного хранилища будем использовать ChromaDB. Похоже, что этот репозиторий связан с видео.

GitHub - AIAnytime/Search-Your-PDF-App: Search Your PDF App using Langchain, ChromaDB, Sentence Transformers, and LaMiNi LM Model. This app is completely powered by Open Source Models. No OpenAI key is required.: Search Your PDF App using Langchain, ChromaDB, Sentence Transformers, and LaMiNi LM Model. This app is completely powered by Open Source Models. No OpenAI key is required. - AIAnytime/Search-Your-...

github.com

GitHub - AIAnytime/Search-Your-PDF-App: Search Your PDF App using Langchain, ChromaDB, Sentence Transformers, and LaMiNi LM Model. This app is completely powered by Open Source Models. No OpenAI key is required.

В репозитории ютубера есть и другие материалы для справки.

AIAnytime - Overview: Generative AI Evangelist | Creator of "AI Anytime" YouTube Channel - AIAnytime

github.com

Он также предоставляет хорошие пояснения. Если у меня будет время, я хотел бы систематизировать эти пояснения.

GitHub - InsightEdge01/ChainlitPDFchatBot: Contribute to InsightEdge01/ChainlitPDFchatBot development by creating an account on GitHub.

github.com

GitHub - InsightEdge01/ChainlitPDFchatBot

Существует множество настроек пользовательского интерфейса.

GitHub - InsightEdge01/ChainlitPDFchatBot: Contribute to InsightEdge01/ChainlitPDFchatBot development by creating an account on GitHub.

github.com

Есть функция предварительного просмотра.

GitHub - RajKKapadia/DLAI-Langchain: This is a respository for the DeepLearning AI Langchain course.: This is a respository for the DeepLearning AI Langchain course. - RajKKapadia/DLAI-Langchain

github.com

GitHub - RajKKapadia/DLAI-Langchain: This is a respository for the DeepLearning AI Langchain course.

В нем рассматриваются классы LangChain, которые не рассматриваются в других источниках.

Технологический стек немного отличается.

Их слишком много. Я отфильтровал их, но их все еще много. Если бы мне пришлось рекомендовать только один, я бы посоветовал посмотреть этот и понять код репозитория ниже, а все остальные связанные видео удалить. Больше я не буду рассматривать эту тему.

https://github.com/mayooear/gpt4-pdf-chatbot-langchain⁠⁠⁠⁠⁠⁠⁠

GitHub - mayooear/gpt4-pdf-chatbot-langchain: GPT4 & LangChain Chatbot for large PDF docs: GPT4 & LangChain Chatbot for large PDF docs. Contribute to mayooear/gpt4-pdf-chatbot-langchain development by creating an account on GitHub.

github.com

GitHub - mayooear/gpt4-pdf-chatbot-langchain: GPT4 & LangChain Chatbot for large PDF docs

Краткое содержание от durumis

При разработке AI-приложений на основе LLM доступ к внутренним данным компании является обязательным, особенно когда речь идет об обработке данных в формате PDF. В этом посте мы рассмотрим, как использовать LangChain, Streamlit, FAISS или ChromaDB для решения этой задачи.
Мы продемонстрируем процесс создания пользовательского интерфейса, построения векторного хранилища и реализации чат-бота на основе PDF-файлов, используя OpenAI API Key, LangChain и Streamlit. Также мы предоставим информацию о различных репозиториях и каналах YouTube, связанных с этой темой.
Несмотря на использование различных технологий, мы рекомендуем сосредоточиться на репозитории mayooear/gpt4-pdf-chatbot-langchain и завершить изучение темы, исключив прочие связанные ресурсы.

Комментарии0