Spaces:

luanpoppe
/

vella-backend

Running

App Files Files Community

luanpoppe commited on Nov 26, 2024

Commit

3143cff

1 Parent(s): ca8a144

feat: adicionando busca pelo modelo de um usuário para entrar no system prompt final

Browse files

Files changed (3) hide show

_utils/resumo_completo_cursor.py +29 -16
resumos/serializer.py +4 -6
setup/environment.py +3 -1

_utils/resumo_completo_cursor.py CHANGED Viewed

@@ -16,6 +16,9 @@ import numpy as np
 from rank_bm25 import BM25Okapi
 import logging
 from cohere import Client
 def reciprocal_rank_fusion(result_lists, weights=None):
     """Combine multiple ranked lists using reciprocal rank fusion"""
@@ -85,21 +88,20 @@ class DocumentSummarizer:
     def load_and_split_document(self, pdf_path: str) -> List[DocumentChunk]:
         """Load PDF and split into chunks with metadata"""
         loader = PyPDFLoader(pdf_path)
-        pages = loader.load()
         chunks = []
         char_count = 0
         for page in pages:
             text = page.page_content
-            # Split the page content
-            page_chunks = self.text_splitter.split_text(text)
             for chunk in page_chunks:
                 chunk_id = str(uuid.uuid4())
-                start_char = text.find(chunk)
                 end_char = start_char + len(chunk)
-                doc_chunk = DocumentChunk(
                     content=chunk,
                     page_number=page.metadata.get('page') + 1,  # 1-based page numbering
                     chunk_id=chunk_id,
@@ -119,7 +121,7 @@ class DocumentSummarizer:
         return chunks
-    def create_vector_store(self, chunks: List[DocumentChunk]) -> Chroma:
         """Create vector store with metadata"""
         texts = [chunk.content for chunk in chunks]
         metadatas = [{
@@ -136,7 +138,7 @@ class DocumentSummarizer:
         )
         return vector_store
-    def rerank_chunks(
         self,
         chunks: List[Dict],
         query: str,
@@ -180,7 +182,7 @@ class DocumentSummarizer:
             logging.error(f"Reranking failed: {str(e)}")
             return chunks[:k]  # Fallback to original ordering
-    def generate_summary_with_sources(
         self,
         vector_store: Chroma,
         query: str = "Summarize the main points of this document"
@@ -256,7 +258,7 @@ class DocumentSummarizer:
         return structured_output
-    def get_source_context(self, chunk_id: str, window: int = 100) -> Dict:
         """Get extended context around a specific chunk"""
         metadata = self.chunk_metadata.get(chunk_id)
         if not metadata:
@@ -270,7 +272,7 @@ class DocumentSummarizer:
 class ContextualRetriever:
     def __init__(self, config: RetrievalConfig, claude_api_key: str, claude_context_model):
-        self.config = config
         self.claude_client = Anthropic(api_key=claude_api_key)
         self.logger = logging.getLogger(__name__)
         self.bm25 = None
@@ -293,12 +295,12 @@ class ContextualRetriever:
                 max_tokens=100,
                 messages=[{"role": "user", "content": prompt}]
             )
-            return response.content[0].text
         except Exception as e:
             self.logger.error(f"Context generation failed for chunk {chunk.chunk_id}: {str(e)}")
             return ""
-    def contextualize_chunks(self, full_text: str, chunks: List[DocumentChunk]) -> List[ContextualizedChunk]:
         """Add context to all chunks"""
         contextualized_chunks = []
         for chunk in chunks:
@@ -315,7 +317,7 @@ class ContextualRetriever:
         return contextualized_chunks
 class EnhancedDocumentSummarizer(DocumentSummarizer):
-    def __init__(self, openai_api_key: str, claude_api_key: str, config: RetrievalConfig, embedding_model, chunk_size, chunk_overlap, num_k_rerank, model_cohere_rerank, claude_context_model, system_prompt, gpt_model, gpt_temperature):
         super().__init__(openai_api_key, os.environ.get("COHERE_API_KEY"), embedding_model, chunk_size, chunk_overlap, num_k_rerank, model_cohere_rerank)
         self.config = config
         self.contextual_retriever = ContextualRetriever(config, claude_api_key, claude_context_model)
@@ -323,6 +325,7 @@ class EnhancedDocumentSummarizer(DocumentSummarizer):
         self.system_prompt = system_prompt
         self.gpt_model = gpt_model
         self.gpt_temperature = gpt_temperature
     def create_enhanced_vector_store(self, chunks: List[ContextualizedChunk]) -> Tuple[Chroma, BM25Okapi, List[str]]:
         """Create vector store and BM25 index with contextualized chunks"""
@@ -453,18 +456,27 @@ class EnhancedDocumentSummarizer(DocumentSummarizer):
             prompt_template = self.system_prompt
             prompt = PromptTemplate(
                 template=prompt_template,
-                input_variables=["context"]
             )
             llm = ChatOpenAI(
                 temperature=self.gpt_temperature,
                 model_name=self.gpt_model,
                 api_key=self.openai_api_key,
             )
-            response = llm.predict(prompt.format(context="\n\n".join(contexts)))
             # Split the response into paragraphs
             summaries = [p.strip() for p in response.split('\n\n') if p.strip()]
@@ -515,7 +527,8 @@ def get_llm_summary_answer_by_cursor_complete(serializer, listaPDFs):
         claude_context_model=serializer["claude_context_model"],
         system_prompt=serializer["system_prompt"],
         gpt_model=serializer["model"],
-        gpt_temperature=serializer["gpt_temperature"]
     )
     # # Load and process document

 from rank_bm25 import BM25Okapi
 import logging
 from cohere import Client
+import requests
+from setup.environment import api_url
+from rest_framework.response import Response
 def reciprocal_rank_fusion(result_lists, weights=None):
     """Combine multiple ranked lists using reciprocal rank fusion"""
     def load_and_split_document(self, pdf_path: str) -> List[DocumentChunk]:
         """Load PDF and split into chunks with metadata"""
         loader = PyPDFLoader(pdf_path)
+        pages = loader.load() # Gera uma lista de objetos Document, sendo cada item da lista referente a UMA PÁGINA inteira do PDF.
         chunks = []
         char_count = 0
         for page in pages:
             text = page.page_content
+            page_chunks = self.text_splitter.split_text(text) # Quebra o item que é um Document de UMA PÁGINA inteira em um lista onde cada item é referente a um chunk, que são pedaços menores do que uma página.
             for chunk in page_chunks:
                 chunk_id = str(uuid.uuid4())
+                start_char = text.find(chunk) # Retorna a posição onde se encontra o chunk dentro da página inteira
                 end_char = start_char + len(chunk)
+                doc_chunk = DocumentChunk( # Gera o objeto do chunk com informações adicionais, como a posição e id do chunk
                     content=chunk,
                     page_number=page.metadata.get('page') + 1,  # 1-based page numbering
                     chunk_id=chunk_id,
         return chunks
+    def create_vector_store(self, chunks: List[DocumentChunk]) -> Chroma: # Esta função nunca está sendo utilizada
         """Create vector store with metadata"""
         texts = [chunk.content for chunk in chunks]
         metadatas = [{
         )
         return vector_store
+    def rerank_chunks( # Esta função nunca está sendo utilizada
         self,
         chunks: List[Dict],
         query: str,
             logging.error(f"Reranking failed: {str(e)}")
             return chunks[:k]  # Fallback to original ordering
+    def generate_summary_with_sources( # Esta função nunca está sendo utilizada
         self,
         vector_store: Chroma,
         query: str = "Summarize the main points of this document"
         return structured_output
+    def get_source_context(self, chunk_id: str, window: int = 100) -> Dict: # Esta função nunca está sendo utilizada
         """Get extended context around a specific chunk"""
         metadata = self.chunk_metadata.get(chunk_id)
         if not metadata:
 class ContextualRetriever:
     def __init__(self, config: RetrievalConfig, claude_api_key: str, claude_context_model):
+        self.config = config # Este self.config no momento não está sendo utilizada para nada dentro desta classe. Analisar se deveria estar sendo utilizada.
         self.claude_client = Anthropic(api_key=claude_api_key)
         self.logger = logging.getLogger(__name__)
         self.bm25 = None
                 max_tokens=100,
                 messages=[{"role": "user", "content": prompt}]
             )
+            return response.content[0].text # O response.content é uma lista pois é passada uma lista de mensagens, e também retornado uma lista de mensagens, sendo a primeira a mais recente, que é a resposta do model
         except Exception as e:
             self.logger.error(f"Context generation failed for chunk {chunk.chunk_id}: {str(e)}")
             return ""
+    def contextualize_chunks(self, full_text: str, chunks: List[DocumentChunk]) -> List[ContextualizedChunk]: # Pega um chunk e apenas adiciona uma propriedade de contexto a ela, sendo esta propriedade a resposta da função acima, que chama um Model do Claude para dizer o contexto de um chunk
         """Add context to all chunks"""
         contextualized_chunks = []
         for chunk in chunks:
         return contextualized_chunks
 class EnhancedDocumentSummarizer(DocumentSummarizer):
+    def __init__(self, openai_api_key: str, claude_api_key: str, config: RetrievalConfig, embedding_model, chunk_size, chunk_overlap, num_k_rerank, model_cohere_rerank, claude_context_model, system_prompt, gpt_model, gpt_temperature, id_modelo_do_usuario):
         super().__init__(openai_api_key, os.environ.get("COHERE_API_KEY"), embedding_model, chunk_size, chunk_overlap, num_k_rerank, model_cohere_rerank)
         self.config = config
         self.contextual_retriever = ContextualRetriever(config, claude_api_key, claude_context_model)
         self.system_prompt = system_prompt
         self.gpt_model = gpt_model
         self.gpt_temperature = gpt_temperature
+        self.id_modelo_do_usuario = id_modelo_do_usuario
     def create_enhanced_vector_store(self, chunks: List[ContextualizedChunk]) -> Tuple[Chroma, BM25Okapi, List[str]]:
         """Create vector store and BM25 index with contextualized chunks"""
             prompt_template = self.system_prompt
+            url_request = f"{api_url}/modelo/{self.id_modelo_do_usuario}"
+            resposta = requests.get(url_request)
+            if (resposta.status_code != 200):
+                return Response({"error": "Ocorreu um problema. Pode ser que o modelo não tenha sido encontrado. Tente novamente e/ou entre em contato com a equipe técnica"})
+            modelo_buscado = resposta.json()["modelo"]
             prompt = PromptTemplate(
                 template=prompt_template,
+                input_variables=["context", "modelo_usuario"]
             )
             llm = ChatOpenAI(
                 temperature=self.gpt_temperature,
                 model_name=self.gpt_model,
                 api_key=self.openai_api_key,
             )
+            response = llm.predict(prompt.format(context="\n\n".join(contexts), modelo_usuario=modelo_buscado))
             # Split the response into paragraphs
             summaries = [p.strip() for p in response.split('\n\n') if p.strip()]
         claude_context_model=serializer["claude_context_model"],
         system_prompt=serializer["system_prompt"],
         gpt_model=serializer["model"],
+        gpt_temperature=serializer["gpt_temperature"],
+        id_modelo_do_usuario=serializer["id_modelo_do_usuario"]
     )
     # # Load and process document

resumos/serializer.py CHANGED Viewed

@@ -37,17 +37,14 @@ system_prompt = """
             Context: {context}
             Key points:
             """
 user_message = "What are the main points of this document?"
 class ResumoCursorCompeltoSerializer(ResumoCursorSerializer):
-    # files = serializers.ListField(child=serializers.FileField(), required=True)
     system_prompt = serializers.CharField(required=False, default=system_prompt)
     user_message = serializers.CharField(required=False, default=user_message)
-    # model = serializers.CharField(required=False, default=default_model)
-    # hf_embedding = serializers.CharField(required=False, default="all-MiniLM-L6-v2")
-    # chunk_size = serializers.IntegerField(required=False, default=1000)
-    # chunk_overlap = serializers.IntegerField(required=False, default=200)
     num_chunks_retrieval = serializers.IntegerField(default=5)
     embedding_weight = serializers.FloatField(default=0.5)
     bm25_weight = serializers.FloatField(default=0.5)
@@ -57,4 +54,5 @@ class ResumoCursorCompeltoSerializer(ResumoCursorSerializer):
     model_cohere_rerank = serializers.CharField(required=False, default="rerank-english-v2.0")
     more_initial_chunks_for_reranking = serializers.IntegerField(default=20)
     claude_context_model = serializers.CharField(required=False, default="claude-3-haiku-20240307")
-    gpt_temperature = serializers.FloatField(default=0)

             Context: {context}
+            Modelo do usuário: {modelo_usuario}
             Key points:
             """
 user_message = "What are the main points of this document?"
 class ResumoCursorCompeltoSerializer(ResumoCursorSerializer):
     system_prompt = serializers.CharField(required=False, default=system_prompt)
     user_message = serializers.CharField(required=False, default=user_message)
     num_chunks_retrieval = serializers.IntegerField(default=5)
     embedding_weight = serializers.FloatField(default=0.5)
     bm25_weight = serializers.FloatField(default=0.5)
     model_cohere_rerank = serializers.CharField(required=False, default="rerank-english-v2.0")
     more_initial_chunks_for_reranking = serializers.IntegerField(default=20)
     claude_context_model = serializers.CharField(required=False, default="claude-3-haiku-20240307")
+    gpt_temperature = serializers.FloatField(default=0)
+    id_modelo_do_usuario = serializers.IntegerField(required=True)

setup/environment.py CHANGED Viewed

@@ -1,2 +1,4 @@
 default_model = "gpt-4o-mini"
-# default_model = "gpt-4o"

 default_model = "gpt-4o-mini"
+# default_model = "gpt-4o"
+api_url = "https://luanpoppe-vella-backend.hf.space"