![translation](https://cdn.durumis.com/common/trans.png)
นี่คือโพสต์ที่แปลด้วย AI
นายรู้ไปหมดทุกอย่าง ฉบับที่ 2 – สิงหาคม 2566
- ภาษาที่เขียน: ภาษาเกาหลี
- •
-
ประเทศอ้างอิง: ทุกประเทศ
- •
- เทคโนโลยีสารสนเทศ
เลือกภาษา
สรุปโดย AI ของ durumis
- ข้อมูลภายในองค์กรจำเป็นต้องถูกจัดหาเพื่อการฝึกฝน LLM
- สามารถจัดการไฟล์ PDF ได้โดยใช้เทคโนโลยีสแตก เช่น OpenAI API Key, LangChain, Streamlit, FAISS และ ChromaDB
- มีแหล่งข้อมูลมากมายเกี่ยวกับหัวข้อนี้ แต่การอ้างอิง GitHub repo ที่รวบรวมอย่างดีในที่เดียวจะเป็นประโยชน์
เมื่อคุณใช้งานแอปพลิเคชัน AI ที่เชื่อมต่อกับ LLM คุณมักจะต้องมีการเข้าถึงข้อมูลภายในองค์กร ซึ่งเป็นสิ่งที่จำเป็น สำหรับการฝึกฝน LLM ขององค์กร แต่ข้อมูลนี้จะไม่ถูกเปิดเผย ดังนั้นข้อมูลเหล่านี้จึงถูกจัดเก็บในรูปแบบเอกสารหรือฐานข้อมูล ที่หลากหลาย รูปแบบแรกที่เราจะพิจารณาคือไฟล์ที่อยู่ในรูปแบบ PDF
เราจะใช้ OpenAI API Key, LangChain และ Streamlit เนื่องจากเราใช้ Streamlit UI จึงมีโค้ดที่สั้นและง่ายต่อการเข้าถึง
เราใช้ FAISS เป็น vector store
เราใช้ ChromaDB เป็น vector store ซึ่งเป็นที่เก็บข้อมูลที่เกี่ยวข้องกับวิดีโอ
ช่อง YouTube มีข้อมูลอ้างอิงอื่น ๆ อีกมากมาย
คำอธิบายนั้นดีมาก ฉันต้องการรวบรวมคำอธิบายถ้ามีเวลา
มีการตั้งค่า UI หลายอย่าง
มีฟังก์ชันการแสดงตัวอย่าง
ครอบคลุมคลาส LangChain ที่ไม่ได้กล่าวถึงในที่อื่น
เทคโนโลยีสแตกต่างออกไป
มีมากเกินไป ฉันกรองแล้วกรองอีก แต่ก็ยังมีอีกมากมาย ฉันแนะนำให้ดูอันนี้ ดูโค้ดที่อยู่ในที่เก็บข้อมูลด้านล่าง และลบวิดีโอที่เกี่ยวข้องทั้งหมด ฉันไม่ดูหัวข้อนี้อีกแล้ว