En este programa van a utilizar el nivel de teoría de los algoritmos bayesianos visto en clase. El data set en el que van a trabajar se encuentra en la web de UCI Machine Learning Repository y el archivo se llama agaricus-lepiota.data que pueden descargar de la liga: https://archive.ics.uci.edu/dataset/73/mushroom.
Este archivo refiere las características cualitativas de diferentes especies de hongos (mushroom) y la clase tiene dos valores:
- p = poisonous (venenoso)
- e = edible (comestible)
La cual corresponde a la primera columna del archivo. El número de variables o atributos es de 22.
La idea principal es que el usuario introduzca un nuevo registro con los 22 atributos y el programa diga si ese nuevo registro corresponde a un hongo comestible o a uno venenoso.
La segunda parte del programa es lo que ya han hecho anteriormente, calcular:
- Exactitud
- Precisión
- Sensibilidad
para decir si este algoritmo bayesiano es o no una buena metodología de clasificación para este conjunto de datos en particular.