MathematicsCommunity hosting publication
You are watching the latest version of this publication, Version 1.
article

Clasificador Naive como herramienta de decisión en la contratación de personal académico del TESCo

11 Jan 2023| By
Leopoldo Leopoldo Viveros-Rosas ,
+ 3
José Antonio José Antonio Vega-González
0 Views
0 Comments
Disciplines
Applied mathematics
Keywords
BayesClasificadorDecisionesNaive
Abstract

Se utiliza el modelo clasificador Naive como propuesta de herramienta para dar claridad en la decisión sobre las alternativas en la contratación de personal académico del Tecnológico de Estudios Superiores de Coacalco (TESCo). Se considera una base de datos de 232 personas como personal académico de las cuales se utilizan 180 para el cálculo de probabilidades, mismas que se prueban con el resto de la base de datos. Se calculan las probabilidades conjuntas y se utilizan para evaluar el clasificador. El modelo permite asignar probabilidades para cada uno de los nuevos prospectos de contratación de personal académico.

Preview automatically generated from the publication file.

 

Viveros-Rosas Leopoldo#, Díaz-Téllez Rebeca*; Pérez-Torres José Roberto&;

Chew-Hernández Mario Luis# y Vega-González José Antonio ^;

#Subdirección de Estudios Profesionales “B” – TESCo, México.

*División de Ingeniería en Gestión Empresarial – TESCo, México.

^División de Ingeniería Civil – TESCo, México.

& División de Ingeniería en Sistemas Computacionales – TESCo, México

Avenida 16 de Septiembre Número 54, Cabecera Municipal, Coacalco Estado de México C.P 55700

leopoldo@tesco.edu.mx , rebeca.sub.a@tesco.edu.mx , jose.roberto@tesco.edu.mx,

mario@tesco.edu.mx. a.vega@tesco.edu.mx,

 

Mathematical Subject Classification: 90B50.

Introducción

El TESCo fue creado el 4 de septiembre de 1996, teniendo como objetivos [1]:

I. Formar profesionales e investigadores aptos para la aplicación y generación de conocimientos, con capacidad crítica y analítica en la solución de los problemas, con sentido innovador que incorpore los avances científicos y tecnológicos al ejercicio responsable de la profesión de acuerdo con los requerimientos del entorno, el estado y el país;

II. Realizar investigaciones científicas y tecnológicas que permitan el avance del conocimiento, el desarrollo de la enseñanza tecnológica y el mejor aprovechamiento social de los recursos naturales y materiales que contribuyan a la elevación de la calidad de vida comunitaria;

III. Colaborar con los sectores público, privado y social en la consolidación del desarrollo tecnológico y social de la comunidad;

IV. Realizar programas de vinculación con los sectores público, privado y social que contribuyan a la consolidación del desarrollo tecnológico y social del ser humano;

V. Realizar el proceso enseñanza-aprendizaje con actividades curriculares debidamente planeadas y ejecutadas; y

VI. Promover la cultura nacional y universal especialmente la de carácter tecnológico.

De los objetivos de creación del TESCo, se desprende la necesidad de contar con personal académico que coadyuve a lograr los objetivos planteados.

De acuerdo con [2] los tres métodos más usados en aprendizaje automático en tareas de clasificación son redes bayesianas, árboles de decisión y redes neuronales artificiales, además, como lo menciona [3] el objetivo principal de las técnicas de reconocimiento de formas, aplicadas a un problema general de clasificación, consiste en asignar a un objeto o fenómeno físico una de las diversas categorías o clases previamente especificadas.

También [3] indica que las redes bayesianas modelan un fenómeno mediante un conjunto de variables y las relaciones de dependencia entre ellas, con el modelo creado se pueden hacer inferencias bayesianas estimando las probabilidades posteriores de las variables no conocidas, con base a las variables conocidas.

Por su parte [4] menciona que el clasificador Naive -Bayes, es un modelo efectivo de clasificación por su simplicidad, resistencia al ruido, poco tiempo de procesamiento y alto poder predictivo. Además, se menciona que la tarea del clasificador es etiquetar (clasificar) correctamente un conjunto de datos en uno de los grupos o clases previamente definidas, así, un clasificador bayesiano es una función que asigna a un objeto u observación en la clase con mayor probabilidad.

Se mencionan algunas aplicaciones encontradas de los algoritmos de clasificación.

En [5] se aplica el método Naive Bayes a textos en redes sociales para clasificar los sentimientos sobre las elecciones; las categorías fueron (positivo, negativo o neutral). Se utilizan 50 datos de entrenamiento y 10 datos de prueba.

También en [6] se implementa minería de texto y sentimientos basados ​​en documentos en datos de Twitter que son reprocesados a través de técnicas de aprendizaje automático utilizando el método Naive Bayes.

Por su parte [7], describen el uso del clasificador Naive Bayes para asignar probabilidades de pertenencia a individuos fuentes, según la ubicación de la fuente, las propiedades de rayos X y las propiedades visuales/infrarrojas.

Además, [8] utilizan el método Naive Bayes para la detección de intrusos en un sistema de Red Informático; el algoritmo implementado muestra una precisión del 84.42%.

Por último, en [9] se utiliza un enfoque propuesto llamado técnica Master-Slaves para mejorar la clasificación del texto árabe, se implementan cuatro clasificadores diferentes en el cuerpo recopilado; el clasificador Naive Bayes fue implementado como Maestro y los demás como Esclavos.

Problema

Por cuestiones de manejo de información, se desarrolla un cambio en el recuento de la base de datos del personal académico del TESCO. Se considera una plantilla de 232 trabajadores bajo la dirección académica. De acuerdo con [10], el personal docente se debe encontrar dentro de las categorías de:

  • Profesor de Asignatura A

  • Profesor de asignatura B

  • Profesor de tiempo completo asociado A

  • Profesor de tiempo completo asociado B

  • Profesor de tiempo completo asociado C

  • Profesor de tiempo completo Titular A

En la Tabla 1, se muestra la distribución del personal en cada una de las categorías.

Tabla I

Personal por categorías del personal académico.

Categoría Porcentaje Personal
Asignatura A 10% 23
Asignatura B 20% 46
Asociado A 30% 70
Asociado B 20% 46
Asociado C 15% 35
Titular A 5% 12

En la Tabla II se muestran las características curriculares del personal académico.

Tabla II

Características curriculares del personal académico.

Categoría Características Curriculares
Experiencia profesional

Menos de 5 años

Entre 5 y 10 años

Mas de 10 años

Experiencia laboral

Menos de 5 años

Entre 5 y 10 años

Mas de 10 años

Título de licenciatura

Si

No

Posgrado

Si

No

Perfil deseable

Si

No

SNI

Si

No

Debido al cambio constante de personal académico, se requiere una herramienta que permita dar claridad en la decisión sobre la contratación del nuevo personal académico que ayude en la asignación de la categoría correspondiente de acuerdo con las características curriculares del nuevo personal.

Desarrollo

En la Figura 1 se muestra la estructura para el clasificador del problema planteado.

Diagrama Descripción generada automáticamente

Fig. 1. Estructura para clasificador

Donde

Ci = Categorías

i = 1, Asignatura A

i = 2, Asignatura B

i = 3, Asociado A

i = 4, Asociado B

i = 5, Asociado C

i = 6, Titular A

a1j = Experiencia Docente

j = 1, Menos de 5 años

j = 2, Entre 5 y 10 años

j = 3, Mas de 10 años

a2j = Experiencia Profesional

j = 1, Menos de 5 años

j = 2, Entre 5 y 10 años

j = 3, Mas de 10 años

a3j = Título de licenciatura

j = 1, Si

j = 2, No

a4j= Posgrado

j = 1, Si

j = 2, No

a5j= Perfil deseable

j = 1, Si

j = 2, No

a6j = SNI

j = 1, Si

j = 2, No

De acuerdo con el Teorema de Bayes, la probabilidad de que una observación (a1j, a2j, a3j, a4j, a5j, a6j) pertenezca a la clase Ci se calcula con la ecuación 1.

$P\left( C = c_{i} \middle| a_{1i},a_{2i},\ a_{3i},a_{4i},\ a_{5i},\ a_{6i} \right) = \frac{P(C = c)(P(a_{1i},a_{2i},\ a_{3i},a_{4i},\ a_{5i},\ a_{6i}|C = c)}{P(a_{1i},a_{2i},\ a_{3i},a_{4i},\ a_{5i},\ a_{6i})}$ (1)

Se consideran 180 elementos de la plantilla adscrita a la dirección académica para desarrollar las distribuciones de probabilidad, se estiman los parámetros de las distribuciones de probabilidad que se describen en la red de la Figura 1.

En la Tabla III se muestran los resultados de los datos curriculares observados.

Tabla III

Datos curriculares observados

Considerando que la estimación de la distribución de probabilidad de la categoría P(Ci) y de la distribución condicional P(aij /Ci) se basa en la frecuencia relativa de ocurrencia de los correspondientes sucesos, el valor para las probabilidades estimadas será:

$P\left( a_{ij} \right|C_{i}) = \frac{n(a_{ij},C = c)}{n(C = c)}$ (2)

De la Tabla III se puede observar que todos los casos de la característica curricular a32 (Título de licenciatura = no) no cuenta con ningún elemento motivo por el cual se decide eliminar dicha categoría. También se observa que algunas características curriculares no cuentan con elementos, pero no en todos los casos, por lo que se aplica el corrector de Laplace [11], el cual evita que se asigne una probabilidad nula para que no se elimine por completo la probabilidad final.

Aplicando el corrector de Laplace y la ecuación 2 a la Tabla III, se tienen los resultados de las probabilidades conjuntas, que se muestran en la Tabla IV.

Tabla IV.

Probabilidades Conjuntas

De igual forma, de la misma Tabla III se obtienen la distribución de probabilidad para cada una de las categorías que se muestran en la Tabla V.

Tabla V

Probabilidades por Categoría

En la Tabla VI se muestran las 72 combinaciones posibles para las características curriculares del personal académico del TESCo.

Resultados

Con los resultados de las probabilidades conjuntas que se muestran en la Tabla IV se prueba el clasificador, evaluando las probabilidades para los 52 elementos de la base de datos que no se ocuparon para el desarrollo de este.

Se ilustra el cálculo para la alternativa

P(Ci|a11,a21a41a51a61)=

 ∝ P(Ci)P(a11|Ci)P(a21|Ci)P(a41|Ci)P(a51|Ci)P(a61|Ci) (3)

Donde α es la constancia de proporcionalidad.

Sustituyendo la ecuación (3) para cada una de las alternativas se obtiene

Asignatura A

$\propto \left( \frac{16}{195} \right)\left( \frac{1}{2} \right)\left( \frac{3}{8} \right)\left( \frac{1}{8} \right)\left( \frac{1}{8} \right)\left( \frac{1}{8} \right) = \frac{1}{33280} \propto$ (4)

Asignatura B

$\propto \left( \frac{38}{195} \right)\left( \frac{10}{19} \right)\left( \frac{21}{38} \right)\left( \frac{1}{19} \right)\left( \frac{1}{37} \right)\left( \frac{1}{19} \right) = \frac{14}{3299179}$ ∝ (5)

Asociado A

$\propto \left( \frac{11}{39} \right)\left( \frac{24}{55} \right)\left( \frac{32}{55} \right)\left( \frac{10}{13} \right)\left( \frac{11}{13} \right)\left( \frac{2}{55} \right) = 0.0017 \propto$ (6)

Asociado B

$\propto \left( \frac{6}{65} \right)\left( \frac{1}{3} \right)\left( \frac{1}{2} \right)\left( \frac{11}{15} \right)\left( \frac{3}{5} \right)\left( \frac{1}{9} \right) = \frac{11}{14625} \propto$ (7)

Asociado C

$\propto \left( \frac{19}{65} \right)\left( \frac{10}{19} \right)\left( \frac{29}{57} \right)\left( \frac{5}{6} \right)\left( \frac{43}{54} \right)\left( \frac{2}{57} \right) = 0.0018 \propto$ (8)

Titular A

$\propto \left( \frac{11}{195} \right)\left( \frac{4}{11} \right)\left( \frac{6}{11} \right)\left( \frac{8}{11} \right)\left( \frac{7}{11} \right)\left( \frac{4}{11} \right) = 0.0019 \propto$ (9)

Normalizando las ecuaciones anteriores.

$\propto \left( \frac{1}{33280} + \frac{14}{3299179} + 0.0017 + \frac{11}{14625} + 0.0018 + 0.0019 \right) = 1$ (10)

Por lo tanto

α = 161.644 (11)

Donde α es el valor necesario para que se cumpla la ecuación (10).

Tabla VI

Características Curriculares

Con el valor de α mostrado en la ecuación 11 se obtienen las siguientes probabilidades para cada una de las categorías dependiendo de las características curriculares de la ecuación 3

P(Asignatura A |ai1) = 0.006 (12)

P(Asignatura B |ai1) = 0.002 (13)

P(Asociado A |ai1) = 0.274 (14)

P(Asociado B |ai1) = 0.122  (15)

P(Asociado C |ai1) = 0.290 (15)

P(Titular A |ai1) = 0.306 (16)

Con el procedimiento descrito en las ecuación. 3 a la 16 se aplica a los 52 datos de prueba, obteniendo los resultados que se muestran en la Tabla VII.

Tabla VII

Evaluación del Clasificador

Categoría Elementos de Prueba Clasificados Correctamente Porcentaje
Asignatura A 4 2 50%
Asignatura B 10 4 40%
Asociado A 15 9 60%
Asociado B 4 3 75%
Asociado C 15 8 53%
Titular A 4 2 50%

Conclusiones

Se puede observar que el clasificador cuenta con una eficacia promedio superior al 50%, sobre todo en las categorías de Asociado A, B y C. Para que mejore la eficacia del clasificador se debe pedir que se analicen otras características curriculares que permitan dar mayor claridad en la evaluación de prospectos de personal académico para el TESCo.

Figures (5)

Publication ImagePublication ImagePublication ImagePublication ImagePublication Image

No comments published yet.

Preprint
Submitted by11 Jan 2023
Download Publication

No reviews to show. Please remember to LOG IN as some reviews may be only visible to specific users