本部分为课程作业项目文件,包括《数据挖掘》和《优化算法》两门课程。
数据挖掘实践
1.数据获取与预处理:从UCI、Kaggle、Python爬虫或其它公开渠道获取。对数据集进行探索和预处理,包括但不限于缺失值处理、去重、异常值处理、归一化处理、特征编码、降维等。
2.至少使用三种分类算法,计算Confusion-matrix,进行算法比较分析
3.至少使用三种回归算法,计算MSE,进行算法比较分析
4.至少使用三种聚类算法,图形化显示聚类效果
1. 数据集及预处理
2. 模型构建
3. 模型评估与分析
优化算法
使用一种优化算法对分类器参数进行训练,给出训练过程和结果。