Este é um projeto simples que consiste em dois arquivos Python e um arquivo de aplicativo.
-
read_pdf.py: Este arquivo contém uma classe
readPDF
que é capaz de ler um arquivo PDF e extrair o texto de suas páginas. Ele usa a bibliotecaPyPDF2
para processar os arquivos PDF. -
summarize_text.py: Este arquivo contém uma classe
summaryText
que é capaz de sumarizar um texto longo em uma versão mais concisa. Ele utiliza o modelogemini-1.5-flash
para isso. É importante notar os parâmetros contidos neste módulo, que vão impactar de que forma o usuário receberá a sua resposta. -
app.py: Este arquivo é um exemplo de como usar a classe
summaryText
para ler um PDF e sumarizar o texto de suas páginas.
Para usar este projeto, você precisa instalar as dependências listadas no arquivo requirements.txt. Você pode fazer isso executando o seguinte comando:
pip install -r requirements.txt
Depois de instalar as dependências, você pode executar o arquivo app.py
para ler um PDF e sumarizar seu conteúdo.