文章列表

一种基于Gradient Boosting的公交车运行时长预测论文介绍_曹辉彬

本次报告的主要内容包括:车辆轨迹数据的处理与分析、模型的整体架构以及实验。
[报告] Thu Oct 31 2019 14:13:35 GMT+0800 (中国标准时间)

CCF NDBC2019 参会分享_杨诗鹏

本次报告根据NDBC2019上的研究生科研辅导班的内容围绕“如何写好科研论文”展开。
[报告] Thu Oct 31 2019 13:57:48 GMT+0800 (中国标准时间)

基于区块链的音乐数字版权交易平台技术汇报_邱学良_谢河富

本次报告的主要内容包括: 1、区块链简介 2、主流的区块链技术 3、Hyperledger Fabric简介 4、Hyperledger Fabric的部署 5、基于Fabric的平台设计
[报告] Thu Jul 04 2019 11:44:18 GMT+0800 (中国标准时间)

18-19学年的总结

期末将至。近期除了毕业生的论文答辩、准备考题,批改实验、打印考卷等常规事情,就是在填18-19学年的工作考核表。因为学院需要计算老师的工作量,且量化到了一个课时、一篇论文、一个项目,然后加总为一个工作业绩的分数……都是繁琐的事情。看过毕业生在答辩现场的战战兢兢,也看了照相时候的神采飞扬。我想,仅依靠课程数量和学时,是看不出工作成果的;更应该看的,是教学的过程,是学生们学到的东西,以及他们主观的感受。就如同学生毕业了,问他们四年收获了什么。答案不应该是他们上了多少门课,获得了多少学分绩点,而是他们感受的思想的进步,能力的提升,和实践经验的获取。这应该是老师思考课堂,思考工作的起点。 #### **一、课堂** 这个学年我上了4门课程,平均每周7个理论课时,3个实验课时(如下表)。课时不少,在软件学院算是中等偏上的工作量。 | 课程名称 | 授课对象 | 学生数 | | ------------ | -------- | ------ | | C#编程语言 | 大二 | 31 | | 人工智能概论 | 大四 | 62 | | 中间件技术 | 大三 | 61 | | 中间件技术 | 大三 | 41 | | 人机交互技术 | 大二 | 76 | 这些课程,属于大二到大四的专业通修或选修课程。在我看来,专业课应基于几个简单的理念展开:1)介绍思想和新技术;2)提高动手的能力;3)巩固基础知识;4)提高自学能力。同时,根据课程的不同,采取了不同的考核侧重点: > 《c#语言》是低年级编程语言课,重点考察编程语言的特性、语法,以及利用它编写数据结构和算法的能力; > > 《人工智能》和《中间件》是高年级选修课或通修课,重点考察基本理念的掌握,思想的理解。同时,学生的编程能力也提高了,可以进行一些算法和系统的开发; > > 《人机交互》是数字媒体低年级的入门课程,重点介绍交互的概念、界面设计的原则,同时让学生入门web前端技术(html、css、js)。 授课和课程安排,也是基于这些理念来设计的。 说到这个学期改进的点,一个重点是对《实验报告》进行了调整。以前的实验报告是给老师看的;而这次特意改变了实验报告的对象,让同学们写成教程(tutorial)的形式,以博客的方式来写实验报告。同学们就当做给一个高中生,循序渐进的讲解实验,讲解技术。我写了两个文档:《如何写好一个技术教程》、《实验报告/教程写作说明》,让学生自己去看,自己去依照例子去写。 写教程的理念是这样的: > 一个好的技术教程,将有很强的生命力。它将影响很多人,也节省很多人的时间。而通过写作输出,写的过程中作者本人也将梳理自己的思维,深化对内容的理解。表达自己,输出知识,既是一种认知上的升华,也能极大的提高个人的沟通能力。 > > 多写,多练习,多输出,就是在不断的打磨你的写作能力,你的技术教程也将越发精彩,更有价值。 很多同学也认同了这个理念,写出来的教程也质量非常高,同时,也把自己的教程放到博客、github等与其他人共享,作为一个技术文档广泛传播。这种文字和技术输出的快乐,很多同学都体会到了。 第二个改变,是增加了2-3次的学生报告课。通过布置作业,让学生有机会在讲台上展示自己的作业、技术报告或者项目。比如,在人机交互的课程布置了一个报告题目:如何做好做一个PPT?要求用PPT的方式来进行展现和解说。我一直认为,做PPT是学生锻炼表达能力、培养换位思考意识的一种非常有效的手段。这种方式给学生提供了一个做PPT的机会,也是一个做Presentation的舞台。同时,我也会指出做ppt时候的常见错误,让学生在大四答辩或者以后工作的时候,学会如何做展示。 第三个改进是对所有的实验课,不仅仅给出一个的实验内容。而是特意设计2-4个实验,根据学号随机的分配学生选题。这一方面是减少学生作业间互相copy的概率,更重要的是让实验的素材更加丰富。同学们可以思考未分配到的题目的实现方法和方式。 #### 二、毕业设计 非常欣慰的是,这次毕业设计我带了7个大四的学生,总体上感觉都非常不错。其中,2个同学出国,4个同学工作,1个同学继续读研。其中去华为的两个同学,拿到了给本科生的最高等级的offer,可见他们的动手和综合能力都是比较强的。 毕业设计是大学阶段最后的训练。那么,训练什么呢?在我看来,软件工程的同学,训练的是综合的动手能力、算法能力、写作能力,以及做事情的态度和方法。 吸取了之前几届做毕设的教训,我倾向于让每个学生独立承担题目;或者一个项目不超过2个同学。这样有利于真正的做到权责明确。而且,尽量做到每周或者每两周开一次会。这样下来,每个学生在毕设过程中,会提交将近二十次的周报。写周报是这一年来我对毕设同学的要求。给出周报的填写说明,同学们按模板填写即可。这个过程证明是有效果的。师生沟通更好,开会效率也更高了,同学也养成了自觉反省、量化时间和工作的好习惯。同时,我也要求毕业生按一定的要求提交毕业设计材料。这是工作的闭环思维,希望大家做任何事情都能做到善始善终。 最后毕业设计的成果,我是相对比较满意的。感谢有这么好的毕业生,他们付出了汗水,收获了学位,也为大学四年画了一个圆满的句号。唯一的遗憾是,在考虑优辩的时候,大家都太谦让了。可能是觉得毕业答辩,得个优或者良没有什么差异;或者对自己所做的事情,没有太大的信心,觉得自己达不到优的水平。我倒是希望同学们可以多一些野心和雄心,多一些ambition,把事情做得更优更好。或许这样,才是在实践厦门大学"止于至善"的校训。 #### 三、几个可改进的点 1. 提高学生的注意力 我的课堂一般比较松散和自由。不太关注点名,没有关注到课堂的纪律。很多学生把电脑带到了课堂,一边听课一边盯着自己的手机或者电脑屏幕。我其实不太确定他们是否真的在听课。按照我个人的经验,课题上的确有需要电脑的时候。比如,听课时候碰到了一个概念或名词,想网络搜索下。但更多时候,可能就是学生上网的惯性,沉迷网络无法自拔的结果。因此,还是应该树立一个规则,push同学们,让他们提高注意力,认真思考和听课。 在这个碎片化的时代,课堂的45分钟是唯一几个需要整段时间投入的场合。如果这个也被其他干扰和碎片化了, 则可以预见,上课的效果肯定是不好的。拟在以后的课堂里要求:课堂尽量不看电脑和手机;如果要看,控制在5分钟以内。 2. 增加学生间的互动互评 本学期,在课堂上做过一些尝试,让听讲的同学们给正在进行Presentation的同学打分,并给出修改的意见。本来计划的是让同学们互相评价对方的实验,给出分数。但是在操作性上,工作量比较大,暂时搁浅。但我觉得有机会可以构建一个系统,让算法自动匹配互评的同学,并进行分数的自动汇总。这种互动式的评价和评测,可提高学生的积极性,也可以减轻老师批改作业的负担。 3. 多与学生互动 和学生的交互仅限于课堂上,课后交流也不多。因此,只能记住少数的几个同学的名字,这其中还包括一些在我实验室做事情的同学。这是以后可以改进的点。有很多的机会,可以和更多的同学建立起关联的。比如,在期中的时候,花点时间(比如1个小时)做个关于课堂和课程的座谈会,增加师生的了解。但或许是太忙,这个学期和同学们的交流不算多。 时间过隙,学生的一学期,一年,都无比珍贵。师生之情,师生之间的联系与关联,是老师这个职业的副产品。等10年20年后回忆起来,当如美酒一般醇香。 一个学年的时间总是过得太快,马上就是期末考。祝同学们考个好成绩 ,也希望每个5月或者6月,都可以有这样的闲情逸致,随意的写写与大学课题相关的事情。
[课堂] Sat Jun 22 2019 22:39:17 GMT+0800 (中国标准时间)

该如何考试和被考试

大学的考试很多,考不好,会挂课;考得好,可以得奖学金,更容易升学。每次考完,都是几家欢乐几家愁。当然,考试和考试是不一样的。大学读书的时候,看过一些同学考前突击一晚,就能拿个90分。这些课程通常比较水,是一些软课。而有些硬核的课程,是不可能这样去突击的。总体而言,我不太喜欢那样的软课,不喜欢那种考试和考卷,总觉得轻易的抹平了平时兢兢业业上课、切实掌握了知识的同学的努力。因为有了这样的考试体验,也是这样考试着过来的。等到当了老师,我会比较关注考试和试卷的区分度问题。考试的区分度,涉及到课程的公平和公正问题。虽然考卷无法衡量所学到的全部知识,但公平公正的原则是大家必须遵守的。公平的核心,是用同一把尺子来丈量学生。就是说,要难大家难,要容易大家容易;考卷自身的设计倒成了其次的问题。

但是,绝对的公平总是很难获得。在大多数情况下,公平其实是一个稀缺品。大学被称为象牙塔,除了有脱离社会、不问世事之意,还有就是老师和同学都比较理想化,都会往公平和公正的方向去追求。所以,个人认为,维护考试和课程的相对公平和公正性,是老师应到追求的。让付出和回报成正比;让掌握了课程知识的同学获得更多的收获;让不认真的同学,受到一个负的反馈(惩罚)。我有时候也把考试当做学生最后的课程学习。因为复习的过程,是同学们最认真学习的时候。带着一个模糊的、大概的目标去复习,学生所学的东西会更多。他们会带着自己的理解去猜,去押题:哪些地方是知识点?哪些地方可能考?哪些地方不太容易成为考题?……诸如此类的思考,其实是一种训练和判断。

很多人可能都有这样的经验:认真努力的思考,押对了题,获得了一个高分,那种满足和喜悦,真是畅快无比。这类似于,你做了一个正确的判断,获得了奖励;你做了一个错误的预测,获得了惩罚。因此,我有时候想,一些专科类的学校,老师划了大量的所谓的重点,甚至把题目都透露给学生,这对于学生其实是一种羞辱和机会损失。因为,这些学校的老师,都以为学生们素质差,能力差,就应该给题目划重点才能得到分数;反过来,学生们都以为机械的背题,背重点就可以高分了。因此也失去了一个很好的判断和提升自我认知的机会。因此,我的课程尽量避免划太详细的重点,避免太容易过的考试。我想去维护一个相对公平的评价。

当然,我也无法避免"熟悉者偏差“。对那些我比较熟悉,经常一起讨论交流、经常报告、态度良好的同学,我都愿意帮助他们。可能在潜意识里,每个人都会认为:他们都挺认真的,也很上进,为何不帮帮他们?这对于那些不这么积极、不那么喜欢和人交流的同学,可能是一种不公平。但是,反过来想,这不就是人性吗?人比较喜欢自己熟悉的人,而熟悉的人也更容易成为你的朋友,亘古不变。这些同学展现出来的积极参与、主动交流、好学上进,不也是一种争取的表现吗?这么想,我也就不那么紧张这种熟悉者偏差了。但课程的公平公正,是最基础的底座。

课程的分数对学生很重要。从5年、10年的时间纬度上讲,分数的重要性会慢慢的被抹平,也可能被放大。对一些人来讲,这次的分数低了,不妨碍他们在未来所取得的成就。因为他们有积极的成长性思维,相信任何时候,都可以进步,可以选择更好的机会。对另一些人来讲,这次的分数低了,他便错失了机会,相当于被动的选择了一条道路;而他又无法扭转这个道路,只能朝着依赖的路径越走越远。我希望我教过的同学们,都努力成为前者。

等到了社会,你又发现:显式的考试和考卷很少了,甚至就没有了。但那个时候,才是真正考验你的时候。因为,社会对你的评判和评价无处不在,但不会有老师再给你一个分数了。生活只会给你一些零星,隐隐约约的反馈。你需要做的,是及时的、用心的去收集这些反馈。思考,反省,行动,方能不断进步。

[课堂] Sat Jun 22 2019 21:34:31 GMT+0800 (中国标准时间)

第三届CCF智能感知与城市计算前沿论坛笔记

[报告] Thu Jun 06 2019 13:33:36 GMT+0800 (中国标准时间)

Hetero-Edge论文介绍_陶玉娇

由于边缘应用程序的高度异构型使得传统云计算不能有效适用于边缘应用程序。因此,边缘计算面临一个全新的挑战:如果有效地编排这些异构资源以满足应用程序的需要,降低延迟。 如果边缘云由GPUs和CPUs组成,主要面临以下三个问题: 1) 何时在GPUs上提供请求,何时使用CPUs?如果划分工作才能最有效地利用现有资源? 2) 将作业划分为多个流水线和并行任务之后,我们如何将它们映射到适当的计算结点,以最小化它们的总体延迟 3) 由于边缘云的多样性,我们如何避免某一任务明显落后于均匀环境? 针对一中所提出的三个问题,论文中提出了一种资源编排方案: 1) 将任务的资源需求与底层节点的资源相匹配 2) 将任务的工作负载与底层节点的资源相匹配 3) 适当分割处理能力差异很大的处理器(GPU和CPU) 此篇论文将从两个立体声视频流中进行实施3D场景重建来探讨一个可能的异构边缘云的资源编排方案。
[报告] Wed May 08 2019 15:58:00 GMT+0800 (中国标准时间)

Aloe论文介绍_孟戈

论文提出了一种物联网应用上的自动收缩和自稳定编排框架(Aloe) ,通过用现有COTS设备和软件套件设计,目的是解决当前物联网应用的链路故障等导致的较高流延迟问题,并且该框架具有一定容错性。
[报告] Wed May 08 2019 14:21:49 GMT+0800 (中国标准时间)

论文阅读:Adaptive Dynamic Bipartite Graph Matching A Reinforcement Learning Approach_杨诗鹏_熊安书

本次报告介绍了论文Adaptive Dynamic Bipartite Graph Matching A Reinforcement Learning Approach,主要有以下几方面: 01、摘要 02、问题描述 03、批量的动态二分图匹配 04、马可夫决策过程 05、Q-learning 06、Restricted Q-learning 07、实验
[报告] Sat Apr 27 2019 08:42:21 GMT+0800 (中国标准时间)

Cplex介绍_徐易凡_孟戈

本次报告主要给大家介绍了什么是Cplex,以及Cplex的安装使用步骤,然后介绍了cplex的两种使用方式,并且重点介绍了如何用java来调用cplex进行规划问题的求解,希望能让大家有所启发!
[报告] Thu Apr 04 2019 15:13:58 GMT+0800 (中国标准时间)

如何阅读论文_赖永炫

本次报告的主要内容如下: 1、为什么要学习阅读论文? 2、阅读论文“三段法”: (1)第一遍阅读论文理解论文的大概的idea; (2)第二遍阅读论文掌握论文的内容; (3)第三遍阅读论文深入地去理解论文。
[报告] Thu Apr 04 2019 14:29:10 GMT+0800 (中国标准时间)

arduino开发与应用_林益达_刘守宇

本次报告主要对Arduino开发板做一个简单的介绍,并展示了一些传感器在Arduino上实现数据的收集和处理。
[报告] Thu Mar 28 2019 17:51:46 GMT+0800 (中国标准时间)

弹性公交系统介绍_孟戈

本次报告主要对弹性公交的问题定义和项目框架做出简介,同时介绍了项目目前完成进度及相关功能的实现细节,并对接下来的项目计划作出概括。
[报告] Thu Mar 21 2019 16:26:17 GMT+0800 (中国标准时间)

寒假工作介绍:Road2Vec和北京繁忙路段绘制_苏畅

本次报告简要介绍了Word2Vec以及Road2Vec的原理、如何使用gensim.model.Word2Vec训练路段向量、networkx库以及对于北京路网繁忙地段的绘制。同时提出了一些可以更进一步探讨的问题。
[报告] Fri Mar 08 2019 21:08:35 GMT+0800 (中国标准时间)

叫车需求预测_崔少岩

本次报告介绍叫车需求预测的相关内容,了解在未来一定的时间段和地区范围内的用户轿车的需求数量,是平衡出租车服务的关键。使用了线性模型和全连接神经网络尝试解决这个问题。总结了遇到的一些问题,分析后对未来的工作做了一些规划。
[报告] Thu Mar 07 2019 16:56:28 GMT+0800 (中国标准时间)

基于Spark的通用大数据分析和展示平台技术汇报_王铭辉_王寅骅

本次报告主要内容: 1.介绍了系统目前完成的模块:登录模块、数据集模块、模型算子模块、数据分析模块、模型保存模块 2.介绍系统要继续完成的模块:结果展示模块、部分bug解决、双击数据集展示的说明、替换缺失值字符串类型的列、列名缺失用col1.col2补上、保存模型到服务器、网格搜索有报错、res点有时候出不来、spark分布式。 3.Flask介绍: (1)安装:$ sudo pip install Flask (2)route()装饰器把一个函数绑定到对应的 URL 上。 (3)要给 URL 添加变量部分,可以把这些特殊的字段标记为 ,这个部分(4)将会作为命名参数传递到你的函数。或者可以用指定一个可选的转换器。 (5)默认情况下,路由只回应 GET 请求,但是通过route()装饰器传递 methods 参数可以改变这个行为。 (6)使用url_for()给指定函数构造url。 (7)使用render_template()渲染模板。 4.Spark介绍: (1)Spark Mllib:MLlib是Spark的机器学习(Machine Learning)库。它被分为如下两个包:spark.mllib :包含基于RDD的原始算法API ;spark.ml :提供了基于DataFrames 高层次的API。MLlib目前支持4种常见的机器学习问题: 分类、回归、聚类和协同过滤。 (2)Pipeline:工作流将多个工作流阶段(转换器和估计器)连接在一起,形成机器学习的工作流,并获得结果输出。构建方法见PPT。 (3)机器学习算法:决策树举例:决策树(decision tree)是一种基本的分类与回归方法。决策树学习通常包含三个过程:A.特征选择:选取对训练数据具有分类能力的特征。B.决策树生成:选择信息增益最大的特征作为结点的特征,由该特征的不同取值建立子结点,再对子结点递归地调用以上方法C.决策树剪枝:防止出现过拟合
[报告] Thu Mar 07 2019 16:51:09 GMT+0800 (中国标准时间)

培养研究生的方式

近年来我开始开始带研究生了。回顾自己的研究生求学生涯,观察我的导师,同事,以及所认识的朋友带学生的方法和方式。我一直在思考一个问题:如何带好研究生,让他们在短暂的几年时光里有所收获,有所成长;同时,导师/课题组也能有所收获,双方都受益于这个过程。

我把对于研究生培养过程的一些想法写于此,与大家交流。希望本文能够给那些有志于读研究生的同学以一点启发。

1. 师生关系是一种美好的互动关系

这个是我目前为止的认识。我很幸运,想起来硕博期间的导师,想起教过我的老师,内心是充满温暖的。可能我选择的导师都是很Nice的人。毕业多年了,我的同门还是很尊敬他们,愿意和他们保持联络。这种关系,是我思考师生关系的起点。我倾向于把师生关系放在十年、二十年、三十年的维度去思考:培养一个学生,其实为社会培养一个栋梁之才;这个成就感,在很多的时候,是教师这个职业最大的意义和报酬。

研究生(或博士生)导师,不同于本科的教学老师,也不同于高中的老师。师生关系更像是一个“一对一”的学徒关系,有更多的个人交流和时间上的相互投入。因此,研究生期间的师生关系,是一种较为密切的互动关系。人是多变量的系统,人与人的交互涉及的变量也比较多。时至今日,学生的培养过程仍旧被看做是一个黑盒子。输入变量是学生、老师的属性,输出是学生的能力和品性。但实际上,变量远不止这些,还存在很多的隐藏变量和外部变量。比如,学校的平台、社会环境等都是影响的变量;而老师的能力和品性,其实也是输出量的一部分。在这个过程中,学生和老师既是输入变量,也是输出变量。学生的培养过程在深刻的塑造学生,也在影响着老师,影响着学校,影响着社会。 所以,当老师愿意更多的去成就学生,帮助他们,为他们争取资源的时候,其实也是老师成就自己的时候。好的培养过程会让社会收益,让生活更加和谐美好。

2. 学生因人而异,目标意识很重要

一个人的内在目标和驱动力,是决定一个人能否“成功”的重要指标。这里的成功加了引号,想表达的是“成功”并不只是世俗意义上名和利的成功。在我看来,成功并无固定模式,每个人兴趣和志向不太相同,所以成功的标准也不太相同。即便如此,社会对于成功是有一个大体的认同标准的。一个人的事业做的好不好,通过横向比较和历史的纵向比较,是有一个大概客观标准的。

但总是横向比较,也容易导致“人比人气死人”。人的机遇不同禀赋不同,因此,只是看结果其实没有太多的参考价值。有一个我比较认可的关于成功的定义是:在施加于你的各种限制条件下,达到个人潜力的充分发挥,实现自我的目标。在“什么是成功”的议题上,个人提倡应达到“自我认同”和“社会认同”的基本统一。即参考社会的成功标准,同时也在心里有一个“内部积分卡”。规划自己的人生道路,定义可达目标,并按照这个目标去努力实现;最后实现了,获得了喜悦和成就,这就是你的成功。

因此,我希望能够身体力行。和学生一起规划目标,目标落实到年、月、周、天。如果每天、每周、每月、每年的目标都实现了,那么我们就是在不断的向自己的成功靠近。

3. 老师站在前沿,学生能发挥潜力

研究生培养也考验导师的水平。虽然说“师傅领进门,修行在个人”,学生个人的努力和天赋,占据了很多的权重。但不可否认,一个好的老师,在学生成长过程中,很可能就是那个关键的1%或者10%。这也是为什么学生们在选择导师的时候,总希望找一个好的,适合自我发展的导师。

一般的统计结果而言,好大学出来的学生优秀的比例高;好的老师带出的学生的优秀的概率也比较高。好大学有了大学排名和专业排名,那什么样的老师才算好老师呢?这个评价标准包括了太多的方面了。可以从道德方面评价,从性格方面评价,可以从学术水平评价。从学科和学术的角度来看,我觉得老师应该能够站在前沿,为学生指引方向。他不一定是学科大牛(真正的大牛不多),但至少知道大牛们在哪里,学科关注的焦点在哪里。做到这一点,其实也不容易。它要求老师在专业能力的基础上不断学习,跟进最新的科研和技术。在此基础上,导师为学生提供指导,一起探索新发现,实现新的想法。这个过程,其实是师生共同进步的过程。理想的最终结果,应该是双赢,老师的专业水平提升了,学生的水平也跟着提升。当学生的能力和潜力都得到最大的发挥,就应该有“青出于蓝而胜于蓝”的结果。

值得指出的是,研究生培养周期是2到3年。当前研究的热点,可能以后不再是热点,但这个过程中,学生经历的完整的“把一个课题做好,把一件事情做好”的过程,领悟到的做人做事的态度和方法,很有可能会极大的影响学生的未来之路。爱因斯坦说过,“教育就是当一个人把在学校所学全部忘光之后剩下的东西”。这个说法,也符合研究生的培养过程。

4. 刻意练习,慢就是快

“刻意练习”是最近流行的一个概念。我直接拿过来用,觉得很切合研究生的成长过程。首次提出“刻意练习”这个概念的是心理学家 K. Anders Ericsson。核心假设是,专家级水平是逐渐地练出来的,而有效进步的关键在于找到一系列的小任务让受训者按顺序完成。刻意练习被证明是很多领域成功的方法论和关键。对于研究生的培养而言,也不例外。

于“工学”研究生而言,最重要的能力就是工程能力和动手实践的能力。具体到软件和计算机专业,就是编程和解决问题的能力。这种能力也是目前企业最为迫切需要的能力;而创新性研究的能力,则被认为是博士阶段的培养目标。因此,学生可以用“刻意练习”的概念,去逐步增强自己的能力。一般地,我会列出一个研究方向的知识点,我称之为“知识点地图”。地图上有具体的知识点,一些是需要精通的,一些是需要了解的;一些是需要仔细看书研读的,一些是要要学会,但可以网上便利获取的。我会要求让学生按图索骥,有意识的去巩固和掌握这些知识点。这个过程中,培养的是学生学习的能力和自我驱动的能力。这些知识点所代表的能力,最终也能够让他们轻松的找到理想的工作。

“知识地图”上的内容和知识点不少。急躁的学生容易放弃;而沉下心来慢慢学习,肯下功夫的同学,最后能力一定可以大大提升。这个过程,就是练习的过程。所设计的知识点,不是1天可以完成,不是1周可以完成,甚至不是一个月可以完成的,而是2年或者3年要完成的。这个时间跨度,要求学生能够合理的评估自己的时间,能够做目标分解,能够循序渐进,能够以慢为快,用笨办法夯实基础,达到最好的学习效果。

5. 实际主义的研究

什么是“科研”,怎样才算是在做研究呢?

我也是大学毕业后,懵懵懂懂的跟着老师和学长们开始所谓的研究生涯的。04年开始读研,算起来也有14年了。科研到底是什么?有人觉得科研就是在研究理论,写论文;有人觉得研究就是做实验,做项目,诸如此类。其实这些观点都对,因为不同学科的科研表象上看,是有些差异的。理论研究和工程技术研究,都是研究,但需要的资源、人的才智、和所使用的工具可能很不一样。

对计算机相关学科而言,大多数是在研究更优化、更高效的算法,设计一些更好的系统。浅显一点看,大概是除了编程、实验、把一个demo做出来之外,还能基于数学、概率、复杂性分析之类的理论,进行抽象和拔高。计算机的一些顶级的学生会议,也经常涉及这些理论的创新。但也有些时候,一些复杂的公式和算法,只是为了抽象、装饰、和解释一些东西,不完全了解也没有关系。毕竟,计算机和软件本身是一个大的学科群,包括硬件、嵌入式、图像图像、操作系统、信息安全、数据科学等等。即便数据科学,也是一个大类,与数据库、数据挖掘、机器学习、知识图谱等等互相关联。我们所在的软件和计算机学科渗透非常广,在各个行业,各个领域的应用相当宽泛。一个人或者团队,也不可能在任何方向都是行家高手。因此,更可能的情况是,仅在2-3个领域研究得比较深入,而其他的领域,也只是知道个大概。

幸运的是,计算机和软件专业目前是个热门学科,与工业衔接非常紧密。这个学科背后其所代表的信息产业和互联网行业,是一个拥有巨大产值的行业。耳熟能详的几个高科技企业Google、Facebook、腾讯、阿里等等,都是工业界里研究和产业同时做得很好,科研与实际业务深度融合的巨无霸公司。近年来不断地蹦出来的新概念,比如物联网、大数据、人工智能、区块链等等,都是来自于这个学科群。因此,虽然身处高校,老师和同学们也有大量的机会与工业界进行交流合作。在这个过程中,我也慢慢的梳理一些想法:

1) 科研是细致分工的活,工科科研尤其分工明确,平台作战。一个研究者成果列表,其实代表的不仅仅是他个人的能力,更是他背后站着的科研平台,研究生、博士生、学术人脉等各方面资源的综合反映。一个研究者的背后,其实是一个实验室的师生团队。

2) 工业和学术研究的界限正逐渐模糊。至少在计算机领域,目前的学术研究和工业研究,其实是相互促进相互融合的。

3)技术只有通过产业和转化,才能带来更大的价值。技术研发是一种投入,是成本。只有通过技术转化,提升生产效率,产生为用户接受的新产品,才可能真正的创造价值。

从个人的兴趣出发,从所处的平台和环境来看,我还是更加愿意继续在学术研究和工业研发之间做个衔接,在这个越来越靠拢的“产-学”中间地带穿行,做一些真正有用的,对企业和社会有帮助的研究和研发。同时,这个过程中培养的学生,也可以真正的学到知识和实用的技术,拥有可以安身立命的技能,拥有更好的前途。我的实际主义的研究观点,大体基于对计算机和软件学科、一些科研研究院的、以及所在厦大软件学院现状的一些认识。以后有机会,可以更加详细的谈谈这个话题。

 

6. 进取精神和开放心态

厦大的校训是“自强不息,止于至善”。

“自强不息”指自觉地积极向上、奋发图强、永不懈怠。最早见于《周易·乾》:“天行健,君子以自强不息”。 “止于至善”,语出《礼记·大学》:

“大学之道,在明明德,在亲民,在止于至善”。指通过不懈的努力,以臻尽善尽美而后才停止,也就是说不达到十分完美的境界决不停止自己的努力。所谓“明明德”,即彰明自己天赋灵明的德性,也就是通过学习和实践发掘光大个人内在的优良品德。所谓“亲民”,即亲近、爱恤人民,时刻为人民的利益着想。

好的格言总是普遍性的,放在很多场合都能用上。在培养学生,激励进取,努力奋斗,高目标严要求方面,我们的校训总是灼灼生辉,激励一代又一代的厦大人。

在这里,我想说校训之外的另一层意思,就是开放的心态。做学问和做研究,大概是一个”大胆假设,小心求证“的过程。必然会涉及到对他人意见,他人成功,他人方法的甄选和对比上。而这个”大胆假设“过程,特别需要有开放的心态和创新的精神。就是一开始,不给自己的思维加太多的束缚。在选题上,方法上大胆的去假设,然后去验证和实现,方可能有好的成果出来。同时,在对待同行批评、老师评价等方面,也不妨抱着开放的心态去接收。特别是对于自己不了解的人和事,不要轻易下断言。对于自己的的观点,梳理形成这个观点的过程是否是经得起推敲,是否符合逻辑、是否是可信任的。如果你发现自己的一个观点,其实经不起推敲,或者被证明与事实不符的时候,要有足够的开放心态去改正,要有勇气去承认之前的错误。

开放的心态,永远是一个学习者的姿势,永远从自己的错误,从周围的人,从所处的环境中学习,学习,再学习。

 

 

研究生培养的过程和方式,因老师而异,因学生而异。目前,该文只是《研究生培养的方式》思考的一部分。所涉及的内容并不全面,有些观点还可能是错的。但是,我希望能够不断的改进,不断的补充,直到感觉满意为止。希望可以和同学们一起努力,做到最好的自己,达成个人的目标。在最美好的时光里,有最美好的收获。

[随笔] Fri Jan 04 2019 17:09:06 GMT+0800 (中国标准时间)

城市车辆感知_徐易凡

移动传感和通信技术的最新进展引发了利用移动传感器网络作为大规模和细粒度城市传感的解决方案。这种感知模式通常被称为机会感知、参与式感知、移动人群感知或以人/人为中心的感知。特别是,车辆传感器网络(VSNs)正在成为一种有效监测物理世界的新工具,特别是在城市地区,有大量的车辆将配备各种传感器。机会车辆感知是利用嵌入在车辆或智能手机中的各种传感器来收集无处不在的数据以进行大规模城市感知的新理念。然而现有的工作缺乏对这种传感系统中覆盖问题的深入研究,例如: (1)如何定义和测量覆盖? (2)覆盖质量与车辆数量之间有什么关系? (3)如何选择最小的车辆数量来达到特定的覆盖质量?等等
[报告] Mon Dec 24 2018 15:22:02 GMT+0800 (中国标准时间)

echarts入门_冷琪瑶

作为前端开发人员来说,把庞大复杂的数据以一种很舒服、很直观的方式给别人展现出来,是一项很常见的工作。但是如何制作直观、生动、可交互的图表呢?Echarts为我们提供了一个很好的接口。 ECharts是使用 JavaScript 实现的开源可视化库,可以流畅的运行在 PC 和移动设备上,兼容当前绝大部分浏览器(IE8/9/10/11,Chrome,Firefox,Safari等),底层依赖轻量级的矢量图形库ZRender,提供直观,交互丰富,可高度个性化定制的数据可视化图表。它拥有丰富的可视化图表类型,支持多个坐标系,提供深度的交互式数据探索和绚丽的特效,以及基于GL实现的三维可视化,同时优化了移动端的交互,细粒度的按需打包使得移动端的体积大大减小。
[报告] Mon Dec 24 2018 15:13:54 GMT+0800 (中国标准时间)

快速使用Linux_叶颖津

本次报告主要简单地介绍如何安装以及使用Linux,以及特别的Linux使用案例如使用make指令、使用shell脚本、使用ssh指令等。在报告的最后提供了益于学习使用Linux的几个线上指南、以及在windows系统上学习使用Linux和链接ssh服务器的解决方案。
[报告] Wed Dec 19 2018 12:53:51 GMT+0800 (中国标准时间)

深度学习相关论文分享_张璐

本次报告介绍了三篇深度学习方向的论文,分别为《When Will You Arrive? Estimating Travel Time Based on Deep Neural Networks》、《LC-RNN: A Deep Learning Model for Traffic Speed Prediction》、《Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction》。三篇论文利用CNN、LSTM、ResNet解决了旅行时长、路段速度与区域人流量变化的预测问题中的时间依赖、空间依赖与外部因素影响的问题。
[报告] Wed Dec 19 2018 12:53:08 GMT+0800 (中国标准时间)

出租车模拟程序简介_孟戈

这次报告主要介绍了出租车模拟运行的整个大体流程,包括出租车位置和状态的更新,出租车和请求的匹配,请求集合的更新主要三个部分,并对程序设计中一些关键类做了介绍。
[报告] Wed Dec 19 2018 12:52:03 GMT+0800 (中国标准时间)

知识图谱技术概览-黄一鑫-曹辉彬

本次介绍从知识图谱的构建步骤入手,介绍了知识表示,知识抽取,知识存储,知识推理涉及的部分相关技术。 知识抽取介绍了结构化,半结构化,非结构化三种不同数据来源的抽取方法,重点介绍了面向非结构化的知识抽取。这一部分的技术多涉及机器学习,自然语言处理等方面的知识,需要更进一步地进行了解. 知识推理以OWL本体语言为基础.此次介绍了基于Tableaux运算的方法和基于产生式规则的方法.知识推理有较多开源的工具可以使用.
[报告] Tue Dec 11 2018 22:50:10 GMT+0800 (中国标准时间)

PyTorch简介_苏畅

本次报告从PyTorch的前世今生讲起,相比于当下最流行的TensorFlow,PyTorch有它的优点(如动态图的使用)和缺点(相比TensorFlow还有许多不完善的地方),随着它的不断迭代,它也在变得更好,也有越来越多的人开始了解、使用PyTorch。 Tensor是PyTorch中最基本的概念,它是被处理的数据的载体,可以被看作一个多维的数组,同时能进行反向传播。 深度学习结构大致包括以下Data Preparation、Creating Learnable Parameters、Network Model、Loss、Optimizer五个结构。我们让训练数据通过神经网络得到预测结果,通过Loss函数评估当前参数的效果,反向传播后,用Optimizer优化,循环反复。神经网络有许多复杂的结构(其中还有激活函数的概念),我们只介绍了如何搭建最简单的一两种网络,Loss函数和Optimizer都有很多不同的实现方式,我们需要通过实际情况进行选择。
[报告] Tue Dec 04 2018 22:47:47 GMT+0800 (中国标准时间)