![translation](https://cdn.durumis.com/common/trans.png)
Questo è un post tradotto da IA.
Mr. Know-All 2 – Agosto 2023
- Lingua di scrittura: Coreana
- •
-
Paese di riferimento: Tutti i paesi
- •
- Tecnologia dell'informazione
Seleziona la lingua
Testo riassunto dall'intelligenza artificiale durumis
- I dati interni aziendali devono essere forniti in modo essenziale per l'addestramento di modelli linguistici di grandi dimensioni.
- È possibile elaborare i file PDF utilizzando una pila tecnologica che include la chiave API OpenAI, LangChain, Streamlit, FAISS e ChromaDB.
- Esistono molti materiali relativi a questo argomento, ma è meglio fare riferimento a un repository GitHub ben organizzato in un unico luogo.
Quando si lavora con app AI collegate a LLM, l'accesso ai dati interni dell'azienda è quasi sempre obbligatorio. I dati interni dell'azienda non saranno forniti per l'addestramento LLM. Questi dati saranno gestiti in diversi formati di documenti o database. Per cominciare, elaboriamo i dati archiviati nei file PDF.
Utilizziamo OpenAI API Key, LangChain e Streamlit. Poiché stiamo usando Streamlit, il codice dell'interfaccia utente è breve e facile da capire.
Usiamo FAISS come vettore di memorizzazione.
Usiamo ChromaDB come vettore di memorizzazione. Questo sembra essere il repository correlato ai video.
Ci sono anche altri elementi di riferimento su GitHub dello YouTuber.
Fornisce anche una buona spiegazione. Se ho tempo, voglio riassumere anche il contenuto della spiegazione.
Ci sono diverse impostazioni relative all'interfaccia utente.
Ha una funzione di anteprima.
Tratta le classi LangChain che non sono trattate in altre parti.
Lo stack tecnologico è diverso.
Ne escono troppi. Anche dopo aver filtrato, sono ancora tanti. Se dovessi consigliare solo uno da guardare, questo è quello che consiglio: dopo aver visto questo, capisci il codice del repository qui sotto e cancella tutti gli altri video correlati. Non guardare più questo argomento.