lfernandopg's picture
Update README.md
61db543
|
raw
history blame
2.47 kB
metadata
title: Proyecto Transformers
emoji: 馃寲
colorFrom: blue
colorTo: purple
sdk: streamlit
sdk_version: 1.17.0
app_file: app.py
pinned: false
license: mit

Caracter铆sticas

Este modelo es utilizado para la clasificaci贸n de descripciones de trabajos, a traves de una arquitectura de transformers, el usuario tiene la capacidad de introducir un texto en ingles sobre la descripcion de algunos de los siguientes trabajos:

  • Accountant
  • Actuary
  • Biologist
  • Chemist
  • Civil engineer
  • Computer programmer
  • Data scientist
  • Database administrator
  • Dentist
  • Economist
  • Environmental engineer
  • Financial analyst
  • IT manager
  • Mathematician
  • Mechanical engineer
  • Physician assistant
  • Psychologist
  • Statistician
  • Systems analyst
  • Technical writer
  • Web developer

El modelo mostrar谩 la predicci贸n con mayor probabilidad de ser correcta.

Construcci贸n del modelo

Este modelo es una versi贸n de distilbert-base-uncased, donde se utiliz贸 la tecnica de 'fine-tuning', reentrenando el modelo con los datos de entrenamiento relacionados a nuestro fin, en este caso se tienen 21 categorias a clasificar, donde se obtuvieron los siguientes resultados:

  • Train Loss: 1.3322
  • Train Accuracy: 0.5469
  • Validation Loss: 2.5269
  • Validation Accuracy: 0.2944
  • Epoch: 4

Se utilizo como optimizador 'Adam' con un 'learning_rate = 5e-5' y una metrica basada en precision.

El modelo fue subido directamente a huggingface el cual se encuentra en: https://huggingface.co/lfernandopg/Proyecto-Transformers

El notebook donde fue desarrolado el modelo es el siguiente: https://huggingface.co/spaces/lfernandopg/Proyecto-Transformers/blob/main/Model.ipynb

Fuente de Datos

El dataset utilizado fue recolectado haciendo uso de la siguiente pagina web: 'https://www.onetonline.org/find/all' en donde se encuentran detalles acerca de las tareas y deberes que se deben desempe帽ar en los trabajo que forman parte de la lista. El archivo csv donde se encuetran los datos de entranamiento que se usaron para reentrenar el modelo es el siguiente: https://huggingface.co/spaces/lfernandopg/Proyecto-Transformers/blob/main/train_data.csv

Propuesta de valor

Este modelo puede ser de utilidad para empresas o personas que deseen conocer si alguna habilidad, tarea o deber pertenece a alg煤n trabajo u ocupaci贸n en especifico, adem谩s puede ser usado para consultar de algun curriculum vitae cumple con realmente con los requerimiento para encargo en cuesti贸n.