README.md · lfernandopg/Proyecto-Transformers at 61db543464968fb82ec5c79fdf78063e125b9706

metadata

title: Proyecto Transformers
emoji: 🌖
colorFrom: blue
colorTo: purple
sdk: streamlit
sdk_version: 1.17.0
app_file: app.py
pinned: false
license: mit

Características

Este modelo es utilizado para la clasificación de descripciones de trabajos, a traves de una arquitectura de transformers, el usuario tiene la capacidad de introducir un texto en ingles sobre la descripcion de algunos de los siguientes trabajos:

Accountant
Actuary
Biologist
Chemist
Civil engineer
Computer programmer
Data scientist
Database administrator
Dentist
Economist
Environmental engineer
Financial analyst
IT manager
Mathematician
Mechanical engineer
Physician assistant
Psychologist
Statistician
Systems analyst
Technical writer
Web developer

El modelo mostrará la predicción con mayor probabilidad de ser correcta.

Construcción del modelo

Este modelo es una versión de distilbert-base-uncased, donde se utilizó la tecnica de 'fine-tuning', reentrenando el modelo con los datos de entrenamiento relacionados a nuestro fin, en este caso se tienen 21 categorias a clasificar, donde se obtuvieron los siguientes resultados:

Train Loss: 1.3322
Train Accuracy: 0.5469
Validation Loss: 2.5269
Validation Accuracy: 0.2944
Epoch: 4

Se utilizo como optimizador 'Adam' con un 'learning_rate = 5e-5' y una metrica basada en precision.

El modelo fue subido directamente a huggingface el cual se encuentra en: https://huggingface.co/lfernandopg/Proyecto-Transformers

El notebook donde fue desarrolado el modelo es el siguiente: https://huggingface.co/spaces/lfernandopg/Proyecto-Transformers/blob/main/Model.ipynb

Fuente de Datos

El dataset utilizado fue recolectado haciendo uso de la siguiente pagina web: 'https://www.onetonline.org/find/all' en donde se encuentran detalles acerca de las tareas y deberes que se deben desempeñar en los trabajo que forman parte de la lista. El archivo csv donde se encuetran los datos de entranamiento que se usaron para reentrenar el modelo es el siguiente: https://huggingface.co/spaces/lfernandopg/Proyecto-Transformers/blob/main/train_data.csv

Propuesta de valor

Este modelo puede ser de utilidad para empresas o personas que deseen conocer si alguna habilidad, tarea o deber pertenece a algún trabajo u ocupación en especifico, además puede ser usado para consultar de algun curriculum vitae cumple con realmente con los requerimiento para encargo en cuestión.