![translation](https://cdn.durumis.com/common/trans.png)
Esta é uma postagem traduzida por IA.
Mr. Know-All 2 - Agosto de 2023
- Idioma de escrita: Coreana
- •
-
País de referência: Todos os países
- •
- TI
Selecionar idioma
Texto resumido pela IA durumis
- Os dados internos da empresa devem ser fornecidos como entrada obrigatória para o treinamento de LLM.
- É possível tratar arquivos PDF usando a pilha de tecnologia como OpenAI API Key, LangChain, Streamlit, FAISS e ChromaDB.
- Existem muitos recursos disponíveis relacionados a este tópico, mas é aconselhável consultar um repositório do Github bem organizado para referência.
Quando você está trabalhando com um aplicativo de IA conectado a um LLM, quase sempre é necessário acessar dados internos da empresa. Os dados internos da empresa não serão fornecidos para treinamento do LLM. Esses dados serão gerenciados em vários formatos de documentos ou bancos de dados. Primeiro, vamos tentar processar os que estão armazenados em arquivos PDF.
Usaremos a Chave de API do OpenAI, LangChain e Streamlit. Como estamos usando o Streamlit, o código da interface do usuário é curto e fácil de acessar.
Usaremos o FAISS como um vetor de armazenamento.
Usaremos o ChromaDB como um vetor de armazenamento. Este parece ser o repositório relacionado ao vídeo.
Há muitas outras coisas para consultar no GitHub do YouTuber.
Ele também fornece uma boa explicação. Se tiver tempo, gostaria de organizar o conteúdo da explicação.
Existem várias configurações para a interface do usuário.
Ele tem uma função de visualização.
Ele aborda classes de cadeia de linguagem que não são abordadas em outros lugares.
A pilha tecnológica é um pouco diferente.
Existem muitos deles. Eu filtrei e filtrei, mas ainda existem muitos. Se você tiver que escolher apenas um, eu recomendaria assistir a este e entender o código do repositório abaixo e, em seguida, excluí todos os outros vídeos relacionados. Não vou mais assistir a este tópico.