Ez egy AI által fordított bejegyzés.
Mr. Know-All 2. szám – 2023. augusztus
- Írás nyelve: Koreai
- •
- Referencia ország: Minden ország
- •
- Informatika
Válasszon nyelvet
A durumis AI által összefoglalt szöveg
- A vállalati belső adatokat elengedhetetlenül meg kell adni az LLM-hez való betanításhoz.
- Az OpenAI API Key, a LangChain, a Streamlit, a FAISS és a ChromaDB technológiai verem segítségével feldolgozhatjuk a PDF-fájlokat.
- Bár sok forrás érhető el ehhez a témához, érdemes egy jól szervezett GitHub-tárhoz fordulni.
Ha egy LLM-hez kapcsolt AI-alkalmazást fejlesztünk, szinte elkerülhetetlen, hogy a vállalati belső adatokhoz hozzáférjünk. A vállalati belső adatokat nem szabad az LLM betanítására felhasználni. Ezek az adatok különböző formátumú dokumentumokban és adatbázisokban tárolódnak. Kezdjük azzal, hogy feldolgozzuk a PDF-fájlban tárolt adatokat.
Az OpenAI API kulcsát, a LangChaint és a Streamlitet használjuk. A Streamlit használatának köszönhetően a felhasználói felület kódja rövid, így könnyen hozzáférhető.
A FAISS-t használjuk vektor-adatbázisként.
A ChromaDB-t használjuk vektor-adatbázisként. Ez a megfelelő adattár videókhoz.
A YouTuber GitHubján számos más hasznos információ található.
Jó magyarázatok is találhatók. Idővel szeretném összegyűjteni ezeket a magyarázatokat.
A felhasználói felülethez kapcsolódó beállítások széles skálája van.
Van egy előnézeti funkció.
A LangChain olyan osztályaival foglalkozik, amelyeket más forrásokban nem találunk.
A technológiai verem kissé eltér.
Túl sok van. Szűrtem és szűrtem, de még mindig sok. Ha csak egyet kellene választanom, akkor ezt nézd meg, értelmezd a tárházban található kódot, és töröld a többi kapcsolódó videót. Ne nézd tovább ezt a témát.