Spaces:

cesar
/

DemoProfeIA

Sleeping

App Files Files Community

cesar commited on Jan 26

Commit

85b6c95

verified ·

1 Parent(s): 1b22788

Update app.py

Browse files

Files changed (1) hide show

app.py +38 -25

app.py CHANGED Viewed

@@ -42,27 +42,33 @@ def extraer_texto(pdf_path: str) -> str:
     return texto_total
 def parsear_con_llm(texto_pdf: str, model: GenerativeModel) -> dict:
-    # Instrucciones para parsear:
-    prompt = f"""
-    Eres un parser de texto.
-    A continuación tienes el contenido de un PDF con un examen (o respuestas).
-    Debes extraer todas las preguntas y sus respuestas.
-    Considera que las palabras podrían estar en mayúsculas, minúsculas o plural
-    (por ejemplo 'Pregunta', 'PREGUNTA', 'Preguntas', 'RESPUESTA', 'RESPUESTAS', etc.).
-    Devuélvelas en formato JSON puro, sin explicación adicional.
-    Usa este formato de salida:
-    {{
-      "Pregunta 1": "Texto de la respuesta",
-      "Pregunta 2": "Texto de la respuesta"
-    }}
-    Si hay preguntas sin respuesta, pon la respuesta como cadena vacía.
-    Si no hay ninguna pregunta, devuelve un JSON vacío: {{}}
-    Texto PDF:
-    {texto_pdf}
     """
     part_text = Part.from_text(prompt)
     response = model.generate_content(
@@ -85,7 +91,9 @@ def comparar_preguntas_respuestas(dict_docente: dict, dict_alumno: dict) -> str:
     for pregunta, resp_correcta in dict_docente.items():
         resp_alumno = dict_alumno.get(pregunta, None)
         if resp_alumno is None:
-            retroalimentacion.append(f"**{pregunta}**\nNo fue asignada al alumno.\n")
         else:
             retroalimentacion.append(
                 f"**{pregunta}**\n"
@@ -102,21 +110,25 @@ def revisar_examen(json_cred, pdf_docente, pdf_alumno):
         texto_docente = extraer_texto(pdf_docente.name)
         texto_alumno = extraer_texto(pdf_alumno.name)
         model = GenerativeModel(
             "gemini-1.5-pro-001",
             system_instruction=["Eres un parser estricto."]
         )
         dict_docente = parsear_con_llm(texto_docente, model)
         dict_alumno = parsear_con_llm(texto_alumno, model)
         feedback = comparar_preguntas_respuestas(dict_docente, dict_alumno)
         if len(feedback.strip()) < 5:
             return "No se encontraron preguntas o respuestas válidas."
         summary_prompt = f"""
-        Eres un profesor experto. Te muestro la comparación de preguntas y respuestas:
         {feedback}
         Por favor, genera un breve resumen del desempeño del alumno
         sin inventar preguntas adicionales.
@@ -144,8 +156,9 @@ interface = gr.Interface(
     ],
     outputs=gr.Markdown(),
     title="Revisión de Exámenes con LLM (Permisivo)",
-    description="Sube credenciales, el PDF del docente y del alumno; se emplea un LLM para encontrar 'Pregunta/Respuesta' aun con variaciones."
 )
 interface.launch(debug=True)

     return texto_total
 def parsear_con_llm(texto_pdf: str, model: GenerativeModel) -> dict:
     """
+    Usa el LLM para extraer preguntas y respuestas:
+    - Considera que 'Explicá' o 'Explica' o 'Explique' es una pregunta,
+      aunque no diga 'Pregunta:'.
+    - Reconoce 'RESPUESTA', 'RESPUESTAS', con o sin dos puntos,
+      como inicio de la respuesta.
+    """
+    prompt = f"""
+Eres un parser de texto.
+Te entrego el contenido de un PDF con una pregunta o varias,
+y su(s) respuesta(s). Usa estas reglas para interpretarlo:
+1. Si ves 'Explicá', 'Explica', 'Explique', 'Teniendo en cuenta que...'
+   o algo similar, asúmelo como una pregunta.
+   Si no hay 'Pregunta:' literal, aun así consideralo pregunta.
+2. Las respuestas podrían estar marcadas como 'RESPUESTAS', 'RESPUESTA', 'RESPUESTAS:', etc.
+3. Devuelve un JSON con la estructura:
+{{
+  "Pregunta 1": "Texto de la respuesta"
+}}
+   Si hay más de una pregunta, enumerarlas como 'Pregunta 2', etc.
+4. Si no hay nada reconocible, devuelve {{}}.
+Texto PDF:
+{texto_pdf}
+Devuelve solo el JSON, sin explicaciones ni texto extra.
+"""
     part_text = Part.from_text(prompt)
     response = model.generate_content(
     for pregunta, resp_correcta in dict_docente.items():
         resp_alumno = dict_alumno.get(pregunta, None)
         if resp_alumno is None:
+            retroalimentacion.append(
+                f"**{pregunta}**\nNo fue asignada al alumno.\n"
+            )
         else:
             retroalimentacion.append(
                 f"**{pregunta}**\n"
         texto_docente = extraer_texto(pdf_docente.name)
         texto_alumno = extraer_texto(pdf_alumno.name)
+        # 1) Instanciar el modelo
         model = GenerativeModel(
             "gemini-1.5-pro-001",
             system_instruction=["Eres un parser estricto."]
         )
+        # 2) Convertir PDF Docente y Alumno en dict {Pregunta X: Respuesta X}
         dict_docente = parsear_con_llm(texto_docente, model)
         dict_alumno = parsear_con_llm(texto_alumno, model)
+        # 3) Comparar y generar feedback
         feedback = comparar_preguntas_respuestas(dict_docente, dict_alumno)
         if len(feedback.strip()) < 5:
             return "No se encontraron preguntas o respuestas válidas."
+        # 4) Generar un resumen
         summary_prompt = f"""
+        Eres un profesor experto de bioquímica. Te muestro la comparación de preguntas y respuestas:
         {feedback}
         Por favor, genera un breve resumen del desempeño del alumno
         sin inventar preguntas adicionales.
     ],
     outputs=gr.Markdown(),
     title="Revisión de Exámenes con LLM (Permisivo)",
+    description=("Sube credenciales, el PDF del docente y del alumno; "
+                 "se emplea un LLM para encontrar 'Explicá' y 'RESPUESTAS' etc. "
+                 "y evitar alucinaciones.")
 )
 interface.launch(debug=True)