- GitHub - AIAnytime/Search-Your-PDF-App: Search Your PDF App using Langchain, ChromaDB, Sentence Transformers, and LaMiNi LM Model. This app is completely powered by Open Source Models. No OpenAI key is required.
- Search Your PDF App using Langchain, ChromaDB, Sentence Transformers, and LaMiNi LM Model. This app is completely powered by Open Source Models. No OpenAI key is required. - AIAnytime/Search-Your-...
Saat mengembangkan aplikasi AI yang terintegrasi dengan LLM, akses ke data internal perusahaan hampir selalu menjadi kebutuhan mutlak. Namun, data internal perusahaan tidak akan diberikan untuk melatih LLM. Data ini akan dikelola dalam berbagai bentuk dokumen atau basis data. Sebagai langkah awal, mari kita mulai dengan memproses data yang tersimpan dalam format file PDF.
Kita akan menggunakan OpenAI API Key, LangChain, dan Streamlit. Karena menggunakan Streamlit, kode UI-nya akan singkat dan mudah dipahami.
FAISS akan digunakan sebagai vektor store.
ChromaDB akan digunakan sebagai vektor store. Repositori yang terkait dengan video sepertinya ini.
Di GitHub milik YouTuber tersebut, terdapat banyak referensi lain yang dapat dipelajari.
Penjelasannya juga sangat bagus. Jika ada waktu, saya ingin merangkum penjelasan tersebut.
Terdapat berbagai pengaturan terkait UI.
Tersedia fitur pratinjau.
Kelas-kelas LangChain yang tidak dibahas di tempat lain dibahas di sini.
Tumpukan teknologinya agak berbeda.
Terlalu banyak, meskipun sudah saya saring, masih banyak. Jika harus memilih satu, saya sarankan untuk mempelajari ini, memahami kode repositori di bawahnya, dan menghapus semua video terkait lainnya. Saya tidak akan mempelajari topik ini lagi.
Komentar0