|
--- |
|
base_model: unsloth/qwen2.5-3b-instruct-bnb-4bit |
|
language: |
|
- en |
|
- es |
|
license: apache-2.0 |
|
tags: |
|
- text-generation-inference |
|
- transformers |
|
- unsloth |
|
- qwen2 |
|
- trl |
|
- sft |
|
datasets: |
|
- Agnuxo/Agente-Director |
|
--- |
|
|
|
# Uploaded model |
|
|
|
[<img src="https://github.githubassets.com/assets/GitHub-Mark-ea2971cee799.png" width="100"/><img src="https://github.githubassets.com/assets/GitHub-Logo-ee398b662d42.png" width="100"/>](https://github.com/Agnuxo1) |
|
- **Developed by:** [Agnuxo](https://github.com/Agnuxo1/Explicaci-n-Debate-PDF) |
|
- **Developed by:** Agnuxo |
|
- **License:** apache-2.0 |
|
- **Finetuned from model :** unsloth/qwen2.5-7b-bnb-4bit |
|
|
|
This qwen2 model was trained 2x faster with [Unsloth](https://github.com/unslothai/unsloth) and Huggingface's TRL library. |
|
|
|
[<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth) |
|
|
|
|
|
# Lector y Debatidor de Documentos 📚🗣️ |
|
|
|
Este modelo es parte de un sistema de lectura y debate de documentos que utiliza dos modelos de lenguaje para generar explicaciones y simular debates sobre el contenido de documentos PDF y TXT. |
|
|
|
## Descripción del Modelo |
|
|
|
El sistema utiliza dos modelos principales: |
|
|
|
1. **Agente-GPT (Profesor)**: `Agnuxo/Agente-GPT-Qwen-2.5-7B-Spanish_16bit` |
|
- Basado en Qwen 2.5 7B, adaptado para español |
|
- Función: Explicar documentos y generar preguntas para el debate |
|
|
|
2. **Agente-Llama (Periodista)**: `Agnuxo/Agente-Llama-3.1-Spanish_16bit` |
|
- Basado en Llama 3.1, adaptado para español |
|
- Función: Responder preguntas y participar en el debate con un estilo periodístico |
|
|
|
## Uso Previsto |
|
|
|
Este modelo está diseñado para: |
|
- Analizar y explicar documentos en español |
|
- Generar debates simulados sobre el contenido de los documentos |
|
- Proporcionar una experiencia interactiva de aprendizaje y discusión |
|
|
|
## Limitaciones y Sesgos |
|
|
|
- Los modelos están optimizados para el idioma español y pueden tener un rendimiento limitado en otros idiomas. |
|
- La calidad del debate depende de la calidad y relevancia del documento de entrada. |
|
- Pueden existir sesgos inherentes a los datos de entrenamiento utilizados. |
|
|
|
## Consideraciones Éticas |
|
|
|
- El sistema no debe utilizarse para generar o propagar información falsa o engañosa. |
|
- Los usuarios deben ser conscientes de que las respuestas son generadas por IA y pueden requerir verificación humana. |
|
|
|
## Métricas de Evaluación |
|
|
|
- Perplexidad: [Valor] |
|
- Precisión en tareas de comprensión de lectura: [Valor] |
|
|
|
## Entrenamiento |
|
|
|
Los modelos fueron fine-tuned utilizando el dataset `Agnuxo/Spanish-Debate-Dataset`, que contiene: |
|
- Transcripciones de debates en español |
|
- Artículos periodísticos y académicos |
|
- Resúmenes de documentos en diversos campos |
|
|
|
# Explicación-Debate-PDF-VOZ |
|
Programa en local para subir documentos PDF o TXT en cualquier idioma, con Opción de consuta, explicación y Debate sobre el documento entre dos LLM GPT y Llama, con salida de voz en Español. |
|
|
|
## 🖥️ Interfaz de Usuario |
|
|
|
La interfaz gráfica incluye: |
|
|
|
- 💬 Área de chat para mostrar el debate |
|
- 🎛️ Controles de velocidad de voz |
|
- 🔢 Ajustes de límite de tokens |
|
- 📂 Botón para cargar documentos |
|
- ▶️ Botones para iniciar explicación o debate |
|
|
|
|
|
## 🧠 Modelos de IA |
|
|
|
El programa utiliza dos modelos de lenguaje: |
|
|
|
- 🧑🏫 **Profesor-GPT**: Basado en "GPT" |
|
- 👩🎤 **Periodista LLAMA**: Basado en "Meta-Llama-3.1-8B" |
|
|
|
|
|
## 🎙️ Síntesis de Voz |
|
|
|
Se utilizan dos modelos de TTS: |
|
|
|
- 🇪🇸 Modelo español para el Profesor-GPT |
|
- 🇦🇷 Modelo con acento argentino para la Periodista LLAMA |
|
|
|
|
|
## 📝 Notas Adicionales |
|
|
|
- El programa convierte números y fórmulas a texto para mejorar la síntesis de voz. |
|
- Se incluyen controles para ajustar la velocidad de reproducción de voz. |
|
- La interfaz permite una fácil navegación y control del proceso de lectura y debate. |
|
|
|
|
|
--- |
|
|
|
Desarrollado por [Francisco Angulo de Lafuente] |
|
|
|
# 📚 Lector y Debatidor de Documentos |
|
|
|
![Banner](https://github.com/Agnuxo1/Explicaci-n-Debate-PDF) |
|
|
|
## 🌟 Características Principales |
|
|
|
- 📖 Lectura de documentos PDF y TXT |
|
- 🗣️ Explicación del contenido en español |
|
- 🎭 Debate simulado entre dos IA |
|
- 🔊 Síntesis de voz para las respuestas |
|
- 🖥️ Interfaz gráfica moderna y fácil de usar |
|
|
|
## 🛠️ Tecnologías Utilizadas |
|
|
|
- Python |
|
- PyQt5 para la interfaz gráfica |
|
- Transformers para modelos de lenguaje |
|
- TTS para síntesis de voz |
|
- PyPDF2 para lectura de PDFs |
|
|
|
## 🚀 Cómo Funciona |
|
|
|
El programa ofrece una experiencia interactiva de lectura y debate de documentos: |
|
|
|
1️⃣ **Carga de Documentos**: Sube fácilmente archivos PDF o TXT. |
|
|
|
2️⃣ **Explicación del Contenido**: Una IA explica el documento de forma clara y concisa. |
|
|
|
3️⃣ **Debate Simulado**: Dos IA, un "Profesor-GPT" y una "Periodista LLAMA", debaten sobre el contenido. |
|
|
|
4️⃣ **Síntesis de Voz**: Las respuestas se convierten en audio para una experiencia más inmersiva. |
|
|
|
5️⃣ **Interacción del Usuario**: Participa en el debate añadiendo tus propios comentarios o preguntas. |
|
|
|
## Citación |
|
|
|
Si utilizas este modelo en tu investigación, por favor cita: |
|
|
|
|