![translation](https://cdn.durumis.com/common/trans.png)
Ceci est un post traduit par IA.
Mr. Know-All 2 – Août 2023
- Langue de rédaction : Coréen
- •
-
Pays de référence : Tous les pays
- •
- Technologies de l'information
Choisir la langue
Texte résumé par l'IA durumis
- Les données internes de l'entreprise doivent être obligatoirement fournies pour l'apprentissage des LLM.
- La pile technologique, comprenant OpenAI API Key, LangChain, Streamlit, FAISS et ChromaDB, peut être utilisée pour traiter les fichiers PDF.
- Il existe de nombreuses ressources sur ce sujet, mais il est préférable de consulter un référentiel GitHub bien organisé.
Lorsqu'on utilise une application d'IA intégrant un LLM, l'accès aux données internes de l'entreprise est presque indispensable. Les données internes de l'entreprise ne seront pas fournies pour l'apprentissage du LLM. Ces données seront gérées dans différents formats de documents ou bases de données. Commençons par traiter les fichiers stockés au format PDF.
Nous utiliserons l'API OpenAI, LangChain et Streamlit. L'utilisation de Streamlit permet d'avoir un code d'interface utilisateur court et donc facile à aborder.
Nous utiliserons FAISS comme vecteur de stockage.
Nous utiliserons ChromaDB comme vecteur de stockage. Le référentiel lié aux vidéos semble être celui-ci.
Le github du youtubeur contient d'autres éléments de référence.
La description est bien faite. J'aimerais organiser le contenu de la description si j'en ai le temps.
Il existe plusieurs paramètres de configuration pour l'interface utilisateur.
Il y a une fonction d'aperçu.
Il traite des classes LangChain qui ne sont pas abordées ailleurs.
La pile technologique est légèrement différente.
Il y en a trop. J'ai filtré et filtré, mais il y en a encore beaucoup. Si vous ne deviez en regarder qu'un seul, je vous recommande celui-ci, puis comprenez le code du référentiel ci-dessous, et j'ai supprimé toutes les autres vidéos associées. Je ne regarderai plus ce sujet.