![translation](https://cdn.durumis.com/common/trans.png)
Dit is een door AI vertaalde post.
Mr. Know-All 2 – Augustus 2023
- Taal van de tekst: Koreaans
- •
-
Referentieland: Alle landen
- •
- Informatietechnologie
Selecteer taal
Samengevat door durumis AI
- Interne bedrijfsgegevens moeten noodzakelijkerwijs worden verstrekt om LLM's te trainen.
- Met behulp van technologische stacks zoals OpenAI API-sleutel, LangChain, Streamlit, FAISS, ChromaDB, enz. kunnen PDF-bestanden worden verwerkt.
- Er zijn veel bronnen beschikbaar over dit onderwerp, maar het is aan te raden om een goed georganiseerde GitHub-repository te raadplegen.
Wanneer je een AI-app integreert met een LLM, is het bijna altijd nodig om toegang te krijgen tot interne bedrijfsgegevens. Je zult waarschijnlijk niet alle interne bedrijfsgegevens willen gebruiken om de LLM te trainen. Deze gegevens worden meestal beheerd in documenten of databases in verschillende formaten. Laten we beginnen met het verwerken van bestanden die zijn opgeslagen in PDF-formaat.
We gebruiken de OpenAI API Key, LangChain en Streamlit. Omdat we Streamlit gebruiken, is de UI-code kort en gemakkelijk te benaderen.
We gebruiken FAISS als vectorstore.
We gebruiken ChromaDB als vectorstore. Dit lijkt de repository te zijn die gerelateerd is aan video's.
Er zijn veel andere dingen om te refereren op de GitHub van de YouTuber.
De uitleg is ook goed. Ik wil de uitleg op een gegeven moment ook opschrijven.
Er zijn verschillende instellingen voor de UI.
Er is een voorvertoningsfunctie.
Het behandelt LangChain-klassen die niet worden behandeld op andere plaatsen.
De technologie-stack is anders.
Er zijn er veel te veel. Ik heb gefilterd en gefilterd, maar er zijn er nog steeds veel. Als je er maar één wilt bekijken, bekijk dan deze en begrijp de code in de repository hieronder. Ik heb alle gerelateerde video's verwijderd. Ik ga niet meer naar dit onderwerp kijken.