• Primera Universidad Latinoamericana en ofrecer esta maestría
  • Jornadas de Data Mining
  • Primera Universidad Latinoamericana en ofrecer esta maestría
Previous Next

Especialistas

La realización de un trabajo final es un requisito para completar la carrera de Especialista en Exploración de Datos y Descubrimiento del Conocimiento. Estos trabajos son monografías cortas en los que se analiza algún conjunto de datos seleccionado por cada alumno combinando metodologías aprendidas en los diferentes cursos de la carrera.

Para realizar el trabajo final integrador de la Carrera de Especialización se recomienda utilizar como punto de partida alguno de los trabajos prácticos realizados en alguna de las materias del primer año para luego extenderlo con técnicas aprendidas en otras materias. También se recomienda consultar a alguno de los profesores del primer año acerca de la temática y la forma de encarar el trabajo.

Requisitos mínimos que debe cumplir el trabajo final

1. Debe ser de elaboración individual.
2. Debe integrar metodologías y conocimientos adquiridos en diferentes materias del primer año.
3. Se debe elaborar y presentar un informe que contenga, cómo mínimo: presentación del problema a resolver, presentación sintética de la solución propuesta, descripción del conjunto de datos utilizado, resultado de las pruebas y variantes realizadas que justifiquen la elección del modelo utilizado, descripción general de las tareas realizadas y problemas encontrados y; exposición detallada de la solución propuesta.
4. El documento a entregar debe cumplir con los requisitos normales de un “informe profesional” y debe incluir además un resumen ejecutivo, ideas para futuros desarrollos, bibliografía y referencias. Se pueden utilizar anexos para incorporar información complementaria detallada. 

Evaluación del Trabajo

1. La evaluación la realizará un docente de la Maestría y podrá ser confirmada por un segundo docente.
2. Se podrán pedir pruebas de integridad y autoría, es decir, se le podrá exigir al autor la presentación de los componentes (software, datos, logs, etc.) que acrediten el informe presentado.
3. La evaluación incluirá la compleción de las pautas descritas precedentemente, la corrección del informe, su originalidad y la correcta aplicación de las prácticas enseñadas en durante el primer año de la Maestría.

A continuación se muestran los textos completos de varios de estos trabajos:

  • Carbono en Biomasa Microbiana
    Pablo Facundo Andreoni

    El propósito de este trabajo es analizar la relación existente entre las variables geográficas, medioambientales y físico-químicas del suelo con la biomasa microbiana contenida en el mismo e indagar acerca de la factibilidad del modelado predictivo en este sentido.

  • Análisis de bajas/permanencias de líneas de telefónia móvil
    Dawoon Choi

    El presente trabajo tiene como objetivo principal aplicar técnicas de minería de datos sobre una base de datos que almacena información relacionada al uso de líneas móviles (dadas de alta en el mismo rango de periodo) y el estado de activación (baja / permanencia) luego de un tiempo determinado, de una operadora de telefonía móvil.

  • Extracción de Tópicos de un sitio Web de Noticias
    Adrián Kowal

    El presente práctico tiene por objetivo el agrupamiento y clasificación de Noticias de la página Web de un diario por medio de técnicas de Text Mining. La Minería de Textos se utiliza para poder extraer información a partir de datos poco estructurados o no estructurados como los documentos de textos. Para dicho análisis, los mismos se agrupan en un “corpus” el cual debe ser lo suficientemente amplio como para representar toda la variedad del lenguaje utilizado en cada una de las distintas secciones del diario. Para el procesamiento del corpus se utilizó el modelo de Bolsa de Palabras (BOW). Para esto se utilizó el paquete de R “tm” el cual provee funciones para el tratamiento de los textos.

  • Nomao Challenge
    Gabriel Moncarz

    Nomao es un motor de búsqueda de lugares, donde la gente utiliza diferentes medios de comunicación (celulares, tablets, computadoras portátiles, etc.) para guardar información de distintos destinos (restaurantes, hoteles, bares, etc.). Cada dispositivo tiene diferentes características y en ocasiones el mismo lugar es almacenado con datos distintos, similares o equivalentes (por ejemplo, "av.", "avenida", "Avenue"), como también datos erróneos o faltantes. El Desafío Nomao consiste en identificar si los datos pertenecientes a dos destinos geográficos se refieren al mismo lugar o no. El presente trabajo hace un análisis de distintos clasificadores, para terminar proponiendo un ensamble con una capacidad predictiva superior al 98%.

  • Modelado de la cantidad de años que las personas dedican a sus estudios
    Victoria Busto

    Entender los factores que determinan el nivel educativo de los individuos es de gran importancia para los gobiernos y sociedades. Este trabajo utiliza 14 variables socio-económicas de un estudio de 1980 realizado en Estados Unidos y que incluyó a 4.739 individuos. El objetivo es encontrar los factores que determinan cuántos años se dedicarán a educación secundaria y universitaria.

  • Análisis de los niveles de ozono en la ciudad de Houston según las condiciones meteorológicas entre los años 1998 y 2004
    María Lucrecia López

    El objetivo de este trabajo es comprender cuáles son las variables más influyentes en el nivel de ozono una ciudad con altos niveles de contaminación, y si las condiciones fueron variando con el paso de los años. Además, se intenta estimar la probabilidad de que un día presente elevadas concentraciones de ozono dadas sus condiciones meteorológicas.