You are on page 1of 6

FACULTAD DE CIENCIAS E INGENIERÍA

ESCUELA PROFESIONAL DE INGENIERÍA DE SISTEMA E


INFORMÁTICA

TRABAJO DE INVESTIGACIÓN DE
ESTADÍSTICA Y PROBABILIDADES

APORTACIONES DESDE LA MINERÍA DE DATOS


AL PROCESO DE CAPTACIÓN DE MATRÍCULA
EN INSTITUCIONES DE EDUCACIÓN SUPERIOR
PARTICULARES

PRESENTADO POR:
LUNAREJO APONTE, LUIS
FERNANDEZ CARRANZA, GUILLERMO
RODRÍGUEZ, JEREMY
VENTOCILLA GOMERO, FANNY

DOCENTE:
LIC. NEYRA LOPEZ WALTER JESUS

LIMA – PERÚ
2018
IDENTIFICACIÓN DE PROBLEMA
¿De qué manera la MD puede aportar la optimización del proceso de captación de
matrícula en las IES particulares?
IDENTIFICACIÓN DE OBJETIVO GENERAL
Analizar la forma en que la minería de datos (MD) permite optimizar el proceso de
captación de matrícula en las IES particulares.
RESUMEN EJECUTIVO
Con la intensión de diseñar el proceso de captación de matrícula para las IES
particulares, se analizara situaciones actuales de las instituciones educativas
Superiores (IES) con su proceso de captación de matrículas y la aplicación del método
de MD disminuyendo errores con el software Rapid Miner en lo que se muestra que es
posible mejorar el proceso de captación para las IEP particulares.
El crecimiento acelerado de educación superior en el mundo es una realidad evidente
en el 2005 el 24% de la población mundial está matriculado en la educación terciaria,
en el 2012 ascendió al 32% lo que se vio un 8% de aumento en siete años. Entre el
periodo 2008 y 2012 tanto instituciones públicas como privadas incrementaron un
crecimiento de 50%, el número de IES. En el 2008 33% fueron atendidos por IES
particulares, mientras que el sistema público capto el 67%, de la misma forma en el año
2014 el 31% por IES particulares y el 69% por sistemas públicos.
Por lo anterior por la ardua competencia de captación de matrícula de IES particulares
como públicas y la suma de crecimientos de oferta y captación de sistema público la MD
ante la situación descrita impone una importante oportunidad para hacer más eficiente
su proceso de matrícula. La minería de datos representa una oportunidad de
optimización de proceso de captación de matrícula en IES particulares, así como el
diseño de un modelo predictivo de gestión de matrícula.

PANORAMA DE LA EDUCACIÓN SUPERIOR PARTICULAR EN MÉXICO


En el 2012, el 43% de la población de América Latina se encontraba matriculado en
educación superior, México en el mismo año registraba el 29% de participación en este
rubro, parece que en América Latina se optado principalmente por vía de apertura del
sector privado.
En la tabla 1 se observa que las IES particulares han ganado cada vez más terreno y
matricula se muestra de que México y Argentina tiene una alto crecimiento de
instituciones (72% y 53%) y un bajo crecimiento en matricula (33% y 24%).
El mercado para la captación de matrícula, si bien aumenta, se reparte con preferencia
hacia el sistema público; el proceso de expansión acelerado del sector privado en el
ramo educativo, de las últimas décadas, no ha estado asenso de críticas. Numerosos
estudios denuncian que el crecimiento de IES particulares han puesto en riesgo la
calidad educativa superiores según la BD de la COPAES, existe actualmente 3 mil307
programas acreditados de los cuales solo 883 son programas de IES particular, lo cual
representa apenas el 27%, es decir solo 1% cuenta con al menos un programa
acreditado por COPAES.
Resulta indispensable generar estrategias que permitan a las IES particulares atraer
prospectos del reducido y saturado mercado de la actualidad, por lo que las
investigaciones que aporten a la mejora del proceso de captación de matrícula son
fundamentales para la sobrevivencia de IES particulares.
EL PROCESO DE CAPTACIÓN DE MATRÍCULA DE LAS IES PARTICULARES
El proceso de captación de matrícula tiene por objetivo captar la mayor cantidad de
alumnos para que se inscriban en la IES. De ellos se obtienen sus datos y se almacenan
en la BD de prospectos de la IES particular.
Las personas responsables de la captación también deben de hacer seguimiento a estos
prospectos para lograr que se inscriban. Existen retos que implica el captar matricula en
la actualidad:
1. La recolección de los datos sobre los prospectos deben ser protegidos por lo que
se debe tratar con mucho cuidado ya que se utilizara en la modelación.
2. La recolección debe ser eficiente ya que se pueden registrar datos que no son
válidos.
3. Los datos de los prospectos son dinámicos y deben ser actualizados
constantemente.
4. Las BD contienen mucha información lo cual requiere de un eficiente trabajo.
5. Los reportes que se extraen de las BD muestran información que apoya
principalmente la identificación y el seguimiento de contactos con el prospecto.
MINERÍA DE DATOS
Para afrontar los retos de la captación de la matrícula, se pueden apoyar en el uso de
la tecnología de información, la realidad virtual se vuelto un componente principal de
organizaciones contemporáneas.
El uso de tecnología denominada sociedad de la información donde cada minuto se
generan cantidades descomunales de datos los cuales se organizan en BD generando
silos de información almacenada. A este gran volumen se le conoce como big data.
La organización en la BD se realiza a través de agrupación de caracteres que forman
campos y al juntarse forman registros. Este conjunto de registros forman un archivo y
cuando estos se relacionan con otros se forman las BD.
La MD es justamente ese conjunto de herramientas que facilitan la obtención de
conocimiento valioso; se puede entender la MD como una especie de ariete que rompe
la impenetrable fortaleza de los silos de la información. El objetivo es generar modelos
que permitan comprender y predecir el comportamiento de los procesos a partir de los
registros almacenados en las BD. La MD inicia con los datos, a los cuales se les aplican
métodos computacionales especializados para descubrir estructuras y patrones
inicialmente ocultos (Kotu y Deshpande, 2015).
Los métodos son conocidos como algoritmos. Uno de estos son los árboles de decisión
que permiten crear modelos de predicción. Consisten en una técnica que clasifica casos
basados en las variables conocidas como predictoras. Cada variable y su posible valor
se muestran en un nodo del árbol (Van Der Aalst, 2012).
Los árboles de decisión son un tipo de aprendizaje supervisado en analítica predictiva.
Un aprendizaje supervisado significa que uno de sus atributos es definido como variable
de respuesta, por lo que el modelo generado ofrece un esquema predictivo de dicha
variable de respuesta en términos de las variables de entrada, los arboles de decisiones
se utilizan para hacer predicciones sobre un atributo en particular.
Como muchos modelos predictivos, el árbol de decisión requiere trabajar con un
porcentaje de la BD para la construcción del modelo, este porcentaje se conoce como
data de entrenamiento y el otro porcentaje para la evaluación del modelo, que se conoce
como data de prueba.

Minería de datos y captación de matrícula en la IES

Resultados: Modelo predictivo de gestión de matrícula


Este árbol de decisión se observan colores en cada cuadro de predicción. Estos colores
representan el número de sujetos clasificados en forma correcta en la data de prueba.
Cuanto más azul la barra, más confiable es la predicción. En esta BD se observó un
56% de precisión en la predicción de “inscritos” y un 44% para la predicción de “no
inscritos”.

El árbol fue generado con el 60% de la BD y, posteriormente se prueba su capacidad


predictiva en el restante 40%. Se debe extraer el conjunto de reglas de inducción que
se encuentra en el árbol de decisiones.
Las reglas generadas en el árbol de decisión permite realizar predicciones concretas
para nueva BD en base previa es decir se actualizara en cada ciclo de proceso y cada
vez más exacta.
En la figura 3 se muestra el análisis de proceso de matrícula de una IES particular, este
modelo integra todo los elementos generados a lo largo del proceso que son:
Capturar de datos del prospecto.- debe ser válida y confiable no se debe almacenar
datos erróneos para ello es muy importante la tecnología; también se debe capturar
datos de entrevistas, correos electrónicos y comentarios en redes sociales.
Almacenamiento de datos.-Se debe almacenar y organizar en una BD por ello es
necesario un software que permita la aplicación de operaciones sobre los datos.
Construcción del árbol de decisiones.-El árbol de decisiones debe de ser construida
basada en la BD refinada se debe probar para medir su efectividad.
Generación de reglas del modelo.- Se interpreta el árbol de decisión para generar las
reglas del modelo. Se debe enunciar una regla generalizada que resuma en una
expresión qué sujetos prospectos tienen mayor probabilidad de que se inscriban
Sistema de información predictivo.- El sistema de información debe de estar basada
en la regla del modelo y la de la BD para que pueda generar la lista de sujetos
prospectos que se predice se inscriban en la IES particular.
Estrategias de medida.- Al conocer los sujetos del prospecto que provee el sistema de
información, se debe diseñar estrategias específicas enfocadas a ellos para lograr sus
inscripción esta debe derivar en objetivos, metas y planes de trabajo de lo contrario no
se lograra el existo.
Inscritos.- Los estudiantes inscritos forman parte de los datos de entrada para la BD.
La interacción son secuencias o ciclos que consideran la retroalimentación de la BD en
dos momentos distintos el primero al general las reglas y el segundo al finalizar un ciclo.
IDENTIFICACIÓN DE VARIABLES ESTADÍSTICAS

POBLACIÓN Estudiantes de las instituciones educativas superiores.

MUESTRA 80 estudiantes.

UNIDAD DE
Cada estudiante de las instituciones educativas superiores.
ANÁLISIS

Número de estudiantes que se matriculan cada año en IES


VARIABLE
particulares.

TIPO VARIABLE Cuantitativa discreta.

You might also like