File size: 5,192 Bytes
a9ec957
 
 
 
2624cd9
a9ec957
 
 
 
 
 
2624cd9
 
 
 
a9ec957
 
2624cd9
a9ec957
2624cd9
 
a9ec957
 
2624cd9
a9ec957
 
 
 
2624cd9
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
---
base_model: unsloth/qwen2.5-3b-instruct-bnb-4bit
language:
- en
- es
license: apache-2.0
tags:
- text-generation-inference
- transformers
- unsloth
- qwen2
- trl
- sft
datasets:
- Agnuxo/Agente-Director
---

# Uploaded model

[<img src="https://github.githubassets.com/assets/GitHub-Mark-ea2971cee799.png" width="100"/><img src="https://github.githubassets.com/assets/GitHub-Logo-ee398b662d42.png" width="100"/>](https://github.com/Agnuxo1)
- **Developed by:** [Agnuxo](https://github.com/Agnuxo1/Explicaci-n-Debate-PDF)
- **Developed by:** Agnuxo
- **License:** apache-2.0
- **Finetuned from model :** unsloth/qwen2.5-7b-bnb-4bit

This qwen2 model was trained 2x faster with [Unsloth](https://github.com/unslothai/unsloth) and Huggingface's TRL library.

[<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth)


# Lector y Debatidor de Documentos 📚🗣️

Este modelo es parte de un sistema de lectura y debate de documentos que utiliza dos modelos de lenguaje para generar explicaciones y simular debates sobre el contenido de documentos PDF y TXT.

## Descripción del Modelo

El sistema utiliza dos modelos principales:

1. **Agente-GPT (Profesor)**: `Agnuxo/Agente-GPT-Qwen-2.5-7B-Spanish_16bit`
   - Basado en Qwen 2.5 7B, adaptado para español
   - Función: Explicar documentos y generar preguntas para el debate

2. **Agente-Llama (Periodista)**: `Agnuxo/Agente-Llama-3.1-Spanish_16bit`
   - Basado en Llama 3.1, adaptado para español
   - Función: Responder preguntas y participar en el debate con un estilo periodístico

## Uso Previsto

Este modelo está diseñado para:
- Analizar y explicar documentos en español
- Generar debates simulados sobre el contenido de los documentos
- Proporcionar una experiencia interactiva de aprendizaje y discusión

## Limitaciones y Sesgos

- Los modelos están optimizados para el idioma español y pueden tener un rendimiento limitado en otros idiomas.
- La calidad del debate depende de la calidad y relevancia del documento de entrada.
- Pueden existir sesgos inherentes a los datos de entrenamiento utilizados.

## Consideraciones Éticas

- El sistema no debe utilizarse para generar o propagar información falsa o engañosa.
- Los usuarios deben ser conscientes de que las respuestas son generadas por IA y pueden requerir verificación humana.

## Métricas de Evaluación

- Perplexidad: [Valor]
- Precisión en tareas de comprensión de lectura: [Valor]

## Entrenamiento

Los modelos fueron fine-tuned utilizando el dataset `Agnuxo/Spanish-Debate-Dataset`, que contiene:
- Transcripciones de debates en español
- Artículos periodísticos y académicos
- Resúmenes de documentos en diversos campos

# Explicación-Debate-PDF-VOZ
Programa en local para subir documentos PDF o TXT en cualquier idioma, con Opción de consuta, explicación y Debate sobre el documento entre dos LLM GPT y Llama, con salida de voz en Español.

## 🖥️ Interfaz de Usuario

La interfaz gráfica incluye:

- 💬 Área de chat para mostrar el debate
- 🎛️ Controles de velocidad de voz
- 🔢 Ajustes de límite de tokens
- 📂 Botón para cargar documentos
- ▶️ Botones para iniciar explicación o debate


## 🧠 Modelos de IA

El programa utiliza dos modelos de lenguaje:

- 🧑‍🏫 **Profesor-GPT**: Basado en "GPT"
- 👩‍🎤 **Periodista LLAMA**: Basado en "Meta-Llama-3.1-8B"


## 🎙️ Síntesis de Voz

Se utilizan dos modelos de TTS:

- 🇪🇸 Modelo español para el Profesor-GPT
- 🇦🇷 Modelo con acento argentino para la Periodista LLAMA


## 📝 Notas Adicionales

- El programa convierte números y fórmulas a texto para mejorar la síntesis de voz.
- Se incluyen controles para ajustar la velocidad de reproducción de voz.
- La interfaz permite una fácil navegación y control del proceso de lectura y debate.


---

Desarrollado por [Francisco Angulo de Lafuente]

# 📚 Lector y Debatidor de Documentos

![Banner](https://github.com/Agnuxo1/Explicaci-n-Debate-PDF)

## 🌟 Características Principales

- 📖 Lectura de documentos PDF y TXT
- 🗣️ Explicación del contenido en español
- 🎭 Debate simulado entre dos IA
- 🔊 Síntesis de voz para las respuestas
- 🖥️ Interfaz gráfica moderna y fácil de usar

## 🛠️ Tecnologías Utilizadas

- Python
- PyQt5 para la interfaz gráfica
- Transformers para modelos de lenguaje
- TTS para síntesis de voz
- PyPDF2 para lectura de PDFs

## 🚀 Cómo Funciona

El programa ofrece una experiencia interactiva de lectura y debate de documentos:

1️⃣ **Carga de Documentos**: Sube fácilmente archivos PDF o TXT.

2️⃣ **Explicación del Contenido**: Una IA explica el documento de forma clara y concisa.

3️⃣ **Debate Simulado**: Dos IA, un "Profesor-GPT" y una "Periodista LLAMA", debaten sobre el contenido.

4️⃣ **Síntesis de Voz**: Las respuestas se convierten en audio para una experiencia más inmersiva.

5️⃣ **Interacción del Usuario**: Participa en el debate añadiendo tus propios comentarios o preguntas.

## Citación

Si utilizas este modelo en tu investigación, por favor cita: