- GitHub - AIAnytime/Search-Your-PDF-App: Search Your PDF App using Langchain, ChromaDB, Sentence Transformers, and LaMiNi LM Model. This app is completely powered by Open Source Models. No OpenAI key is required.
- Search Your PDF App using Langchain, ChromaDB, Sentence Transformers, and LaMiNi LM Model. This app is completely powered by Open Source Models. No OpenAI key is required. - AIAnytime/Search-Your-...
Lors de la création d'une application IA liée à un LLM (grand modèle linguistique), l'accès aux données internes de l'entreprise est presque indispensable. Étant donné que les données internes de l'entreprise ne seront pas fournies pour l'apprentissage du LLM, ces données seront gérées dans divers formats de documents ou bases de données. Commençons par traiter les fichiers stockés au format PDF.
Nous utiliserons la clé API OpenAI, LangChain et Streamlit. L'utilisation de Streamlit permet d'avoir un code d'interface utilisateur court, ce qui le rend facile d'accès.
Nous utiliserons FAISS comme vecteur store.
Nous utiliserons ChromaDB comme vecteur store. Le référentiel lié aux vidéos semble être celui-ci.
Le référentiel GitHub du youtubeur contient également d'autres éléments de référence.
Il fournit également de bonnes explications. Si le temps me le permet, j'aimerais également résumer le contenu des explications.
Il existe plusieurs paramètres pour la configuration de l'interface utilisateur.
Il existe une fonction d'aperçu.
Il traite des classes LangChain qui ne sont pas traitées ailleurs.
La pile technologique est légèrement différente.
Il y en a beaucoup. J'ai filtré et filtré, mais il en reste encore beaucoup. Si je devais en recommander un, je dirais de regarder celui-ci, de comprendre le code du référentiel ci-dessous et de supprimer toutes les autres vidéos liées à ce sujet. Je n'y reviendrai plus.
Commentaires0