基于Spark的通用大数据分析和展示平台-王铭辉_王寅骅
杨诗鹏   Mon Nov 12 2018 15:42:54 GMT+0800 (中国标准时间) [ 报告 ]     浏览次数:2174

一、系统目标 仿照RapidMiner的AutoModel模块,并做成Web形式。提供 1. 经典样例数据、 2. 数据导入(从电脑导入/从数据库导入)、 3. 预测分析、 4. 聚类分析、 5. 列选择、 6. 模型选择、 7. 参数自动/手动调整、 8. 结果图表展示 等功能。 二、目前做的 1、服务器搭建完毕,使用flask框架 2、数据导入功能(完成了文件导入,从数据库导入还没做) 3、测试了flask框架中运行pyspark的可行性 三、接下来要做的 1、数据导入(从数据库导入) 2、数据预处理(缺失值等) 3、解决标题问题 4、数据上传之后马上展示出来 四、结合导师建议 研究机器学习工作流(ML Pipelines)、给用户提供一系列选择处理后再run模型。


附件: 基于spark的通用数据分析和展示平台.pdf [登录 后查看]

更多 [ 报告 ] 文章

请先 登录, 查看相关评论.