MOCOM举办“数据分析和挖掘”学术研讨会
赖永炫   Sun Jul 02 2017 11:03:37 GMT+0800 (中国标准时间) [ 新闻 ]     浏览次数:3241

MOCOM实验室“数据分析和挖掘学术研讨会”于6月30日在软件学院顺利举行。研讨会邀请到了福建师范大学数学与信息学院陈黎飞教授、苏州大学计算机科学与技术学院李直旭、刘冠峰副教授等校外专家。研讨会在科研1楼306多功能厅举行,会议由赖永炫副教授主持。软件学院师生共三十余人参加了会议。

 

报告1:Model-based Built-in Feature Selection with Applications

讲座摘要:内置式(或嵌入式)特征选择是介于传统过滤式(filter)和封装式(wrapper) 之间的一种特征约简方法,它将特征选择嵌入在目标机器学习模型中,从而将特征选择转换为内置在目标学习任务中的一种优化问题,近年来在相关领域研究中获得广泛关注。本讲座将阐明内置式特征选择的基本原理,重点讨论基于概率模型的实现方法。结合近年的研究成果,还将介绍该型方法在高维数据、类数据、符号序列等复杂数据监督学习及无监督学习任务中的具体应用。

陈黎飞个人简介

博士,福建师范大学数学与信息学院教授、博士生导师。1993年本科毕业于电子科技大学计算机及应用专业,2008年获厦门大学基础数学专业(人工智能基础)博士学位,2011-2012年间在加拿大Sherbrooke大学计算机科学系从事博士后研究。主要从事统计机器学习、数据挖掘、模式识别等方面理论及应用的研究,主持国家自然科学基金面上项目2项、省属高校科研专项重点项目等省部级项目3项。在IEEE TKDE、IEEE TNNLS、Data Mining and Knowledge Discovery、Pattern Recognition、软件学报等期刊及IJCAI、AAAI、ICDM、CIKM等学术会议上发表研究论文100多篇,出版学术专著2部。曾获福建省高等教育教学成果一等奖、福建省自然科学优秀学术论文三等奖及国际会议优秀论文奖等。目前兼任加拿大Sherbrooke大学计算机科学系Adjunct professor、中国人工智能学会机器学习专业委员会通讯委员、福建省人工智能学会常务理事。

 

 

报告2:Trust-Oriented Graph Simulation with Multiple Constraints

讲座摘要:Graph Pattern Matching (GPM) plays a significant role in social network analysis, which has been widely used in, for example, experts finding, social community mining and social position detection. In this talk, we first conceptually extend Bounded Simulation to Multi-Constrained Simulation (MCS), and propose a novel NP-Complete Multi-Constrained Graph Pattern Matching (MCGPM) problem. Then, to address the efficiency issue in large scale MC-GPM, we propose a new concept called Strong Social Component (SSC), consisting of participants with strong social consisting of participants with strong social connections. We also propose an approach to identify SSCs, and propose a novel index method and a graph compression method for SSC. Moreover, we devise a heuristic algorithm to identify MC-GPM results effectively and efficiently without decompressing graphs.

刘冠峰简介:

2013年毕业于澳大利亚 Macquarie 大学,获得计算机博士学位。 博士论文获得当年澳大利亚最佳博士论文提名。2013年1月至2013年8月就职于Macquarie大学 (Research Fellow)。并于2013年9月入职苏州大学。目前主要从事大数据分析、机器人视觉识别、数据挖掘与人工智能等领域的研究工作。曾参与多项澳洲科研基金项目研究。目前主持国家自然科学基金项目一项、博士后特别资助项目一项、博士后面上项目一项、参与国家自然科学基金重点项目一项、国家自然科学基金面上项目一项。在AAAI、TKDE、ICDE、TSC、FGCS、WWWJ、ICWS等重要国际期刊与知名国际会议上发表论文近40篇。

 

 

报告3:大数据时代的数据质量问题

讲座摘要:在当今大数据时代,拥有可靠、准确、及时的高质量数据是充分发挥大数据所赋予的机遇和优势的基本前提。然而如何对大量“脏”数据进行自动清洗成为数据工程领域最重要最艰巨的课题之一。以往提出的数据清洗方法往往由于相关领域知识不足而对很多脏数据束手无策。在我们的研究工作中,期望借助日益成熟的众包技术以及Web中蕴含的海量领域知识大幅度提升关系数据库中数据清洗的质量和效率,同时通过几种方法的智能交互尽量降低所投入众包人力成本。本次报告我们首先回顾一下数据清洗领域的主要问题和以往方法流派,之后简要介绍我们在基于众包技术以及Web海量领域知识的数据清洗方向所作出的一些前瞻性研究工作。

李直旭个人简介

澳大利亚昆士兰大学计算机科学博士,现为苏州大学计算机科学与技术学院副教授,硕士生导师。研究方向为数据质量,众包技术,大数据应用,信息检索与信息抽取等。CCF学会数据库专委会通讯委员,人工智能学会智能服务专委会委员。IEEE TKDE, WWWJ等国际期刊及ICDE, CIKM, DASFAA, WISE 等国际会议特约审稿人,目前已发表论文40余篇,其中被SCI收录10篇。

 

 

 


自动标签  : 数据   学术   MOCOM   陈黎飞   李直旭   研究   方法   大学计算机科学   国家自然科学基金   论文   大学   数据清洗   特征选择   国际会议    

更多 [ 新闻 ] 文章

请先 登录, 查看相关评论.