- GitHub - AIAnytime/Search-Your-PDF-App: Search Your PDF App using Langchain, ChromaDB, Sentence Transformers, and LaMiNi LM Model. This app is completely powered by Open Source Models. No OpenAI key is required.
- Search Your PDF App using Langchain, ChromaDB, Sentence Transformers, and LaMiNi LM Model. This app is completely powered by Open Source Models. No OpenAI key is required. - AIAnytime/Search-Your-...
При работе над приложением ИИ, интегрированным с LLM, доступ к внутренним данным компании практически обязателен. Внутренние данные компании не будут предоставлены для обучения LLM. Эти данные будут храниться в различных форматах документов или баз данных. Давайте начнем с обработки данных, хранящихся в файлах PDF.
Мы будем использовать ключ API OpenAI, LangChain и Streamlit. Так как мы используем Streamlit, код пользовательского интерфейса будет коротким и простым в использовании.
В качестве векторного хранилища будем использовать FAISS.
В качестве векторного хранилища будем использовать ChromaDB. Похоже, что этот репозиторий связан с видео.
В репозитории ютубера есть и другие материалы для справки.
Он также предоставляет хорошие пояснения. Если у меня будет время, я хотел бы систематизировать эти пояснения.
Существует множество настроек пользовательского интерфейса.
Есть функция предварительного просмотра.
В нем рассматриваются классы LangChain, которые не рассматриваются в других источниках.
Технологический стек немного отличается.
Их слишком много. Я отфильтровал их, но их все еще много. Если бы мне пришлось рекомендовать только один, я бы посоветовал посмотреть этот и понять код репозитория ниже, а все остальные связанные видео удалить. Больше я не буду рассматривать эту тему.
Комментарии0