- GitHub - AIAnytime/Search-Your-PDF-App: Search Your PDF App using Langchain, ChromaDB, Sentence Transformers, and LaMiNi LM Model. This app is completely powered by Open Source Models. No OpenAI key is required.
- Search Your PDF App using Langchain, ChromaDB, Sentence Transformers, and LaMiNi LM Model. This app is completely powered by Open Source Models. No OpenAI key is required. - AIAnytime/Search-Your-...
Ao desenvolver um aplicativo de IA integrado ao LLM, o acesso a dados internos da empresa se torna praticamente obrigatório. No entanto, esses dados internos não serão fornecidos para o treinamento do LLM. Esses dados serão gerenciados em diversos formatos de documentos ou bancos de dados. Começaremos tratando os dados armazenados em arquivos PDF.
Utilizaremos a Chave API do OpenAI, LangChain e Streamlit. Como estamos usando o Streamlit, o código da interface do usuário é conciso, tornando-o fácil de acessar.
Usaremos o FAISS como vetor de armazenamento.
Usaremos o ChromaDB como vetor de armazenamento. O repositório relacionado a vídeos parece ser este.
O GitHub do YouTuber também contém outros materiais de referência.
Ele também fornece boas explicações. Se tiver tempo, gostaria de organizar as informações das explicações também.
Existem várias configurações para a interface do usuário.
Existe um recurso de visualização prévia.
Aborda classes LangChain que não são tratadas em outros lugares.
A pilha de tecnologias é um pouco diferente.
Há muitos, mesmo após a filtragem. Se você tiver que escolher apenas um, recomendo que veja este e entenda o código do repositório abaixo, e exclua todos os outros vídeos relacionados. Não veja mais nada sobre este tópico.
Comentários0