![translation](https://cdn.durumis.com/common/trans.png)
यह एक AI अनुवादित पोस्ट है।
भाषा चुनें
durumis AI द्वारा संक्षेपित पाठ
- कॉर्पोरेट डेटा को LLM प्रशिक्षण के लिए आवश्यक रूप से प्रदान किया जाना चाहिए।
- OpenAI API Key, LangChain, Streamlit, FAISS, ChromaDB जैसे तकनीकी स्टैक का उपयोग करके PDF फाइलों को संसाधित किया जा सकता है।
- इस विषय से संबंधित कई संसाधन उपलब्ध हैं, लेकिन एक अच्छी तरह से संगठित GitHub रिपॉजिटरी को संदर्भित करना उचित है।
LLM एकीकृत AI ऐप का उपयोग करते समय, आंतरिक कंपनी डेटा तक पहुँचने की आवश्यकता लगभग अनिवार्य होती है। आंतरिक कंपनी डेटा का उपयोग LLM प्रशिक्षण के लिए नहीं किया जाएगा। यह डेटा विभिन्न प्रकार के दस्तावेजों या डेटाबेस में संग्रहीत किया जाता है। आइए हम सबसे पहले PDF फ़ाइलों में संग्रहीत डेटा को संभालने का प्रयास करते हैं।
OpenAI API कुंजी, LangChain, Streamlit का उपयोग किया जाता है। चूँकि Streamlit का उपयोग किया जा रहा है, UI कोड संक्षिप्त है और आसानी से सुलभ है।
वेक्टर स्टोर के रूप में FAISS का उपयोग किया जाता है।
ChromaDB का उपयोग वेक्टर स्टोर के रूप में किया जाता है। वीडियो से संबंधित रिपॉजिटरी यह है।
यूट्यूबर के गिटहब में संदर्भित करने के लिए कई और चीजें हैं।
स्पष्टीकरण भी अच्छा दिया गया है। यदि समय मिलता है, तो मैं स्पष्टीकरण सामग्री को भी व्यवस्थित करना चाहता हूं।
UI के लिए कई सेटिंग हैं।
पूर्वदृश्य सुविधा है।
यह अन्य जगहों पर शामिल नहीं किए गए LangChain वर्गों को शामिल करता है।
तकनीकी स्टैक थोड़ा अलग है।
बहुत अधिक सामग्री है। मैंने इसे फ़िल्टर किया है, लेकिन अभी भी बहुत कुछ है। अगर मैं एक की सिफारिश करता हूं, तो इसे देखें, नीचे दिए गए रिपॉजिटरी कोड को समझें, और शेष संबंधित वीडियो हटा दें। इस विषय पर अब और कुछ न देखें।