1. 论坛名称
如何办好数据专业?
2. 论坛组织机构
主席: 李战怀(西北工业大学)
钱卫宁(华东师范大学)
联系人:王伟(华东师范大学)
3. 论坛简介
    在国家推动“互联网+”行动计划并将“大数据”上升为国家战略的大背景下,面向培养具有创新精神,具备数据科学思维,具备实施数据管理和分析、应用的专门技术能力的人才,为信息技术、金融、电 信、能源、电力、安全、互联网等技术和应用领域输送专业技术人才,为数据科学与工程相关领域的研究输送具备扎实理论知识基础和较强动手实践能力的研究生,我国高校纷纷设立“数据专业”。截止2018年,教育部已经批准285所高校设立“数据科学与大数据技术”本科专业。各个高校基于自身专业特长、历史背景、师资力量、办学条件,对数据专业建设进行了广泛的积极探索。本论坛将提供参与高校数据专业建设的教师和企业专业技术人员一个交流、讨论和学习平台,对数据专业培养目标、培养计划、课程设置和设计、实践方法、支撑平台建设等方面开展研讨,为“数据专业”建设提供参考性意见。
    论坛的研讨主题包括:
(1)数据专业的培养目标
(2)数据专业的培养计划与课程体系
(3)如何上好数据专业导论课程?
(4)数据专业与CS、SE、AI等专业的区别与联系
(5)数据专业的平台、工具使用和实践课建设
4. 论坛日程
5. 论坛特邀报告
特邀报告:数据学院在数据科学与工程教育上的实践和思考
特邀报告摘要:
华东师范大学数据学院致力于培养数据领域的科学家和架构师。一名合格的科学家和架构师需要具备足够的知识、技能和协作能力。传统的计算机教育特别强调知识,对技能的培养并不充分,对协作能力的培养则明显不足。数据学院自成立以来,同等重视知识和技能的培养,并为之制定了独特的培养方案。学院同时在考虑如何提升学生的协作能力,让他们能够快速掌握应用领域的基本知识,能够和领域专家进行良好沟通与合作。本次报告实际上是抛砖引玉,激发大家对现实需求的思考和讨论。
特邀专家简介:
周烜,华东师范大学数据科学与工程学院,教授、副院长。2001年本科毕业于复旦大学,2005年在新加坡国立大学取得博士学位,2005年至2010年期间先后在德国 L3S 研究中心和澳大利亚联邦科工组织从事科研工作,随后在中国人民大学信息学院任教6年,最后于2017年3月加入华东师范大学。周烜的研究兴趣包括数据库系统和信息检索技术。他曾参与和负责多个国内外的科研项目和工业合作项目,开发各种数据管理系统。
Session 1: 特色课程建设
报告题目:高校大数据实训课程建设经验分享
报告摘要:
大数据专业作为典型的“新工科”专业,在课程体系建设方面还处于摸索阶段。厦门大学数据库实验室作为全国高校知名的大数据教学团队,在过去五年集中精力建设了大数据入门课程及其配套教材《大数据技术原理与应用》、大数据进阶课程及其配套教材《Spark编程基础》以及高校大数据实训课程系列案例教材,初步形成了从入门到进阶再到实训课程的大数据教材体系。报告中,讲者将结合实验室打造“高校大数据实训课程样板工程”的实践经验,介绍高校大数据实训课程的教学方法和课程资源,包括课程设计目的要求、选题原则、设计内容、教学方法、授课过程、资源平台、教学管理平台等,为全国高校更好开展大数据实训课程建设提供参考。
报告人简介:
林子雨,男,1978年出生,博士(毕业于北京大学),现为厦门大学计算机科学系助理教授,国内高校知名大数据教师,
2013年度和2017年度厦门大学奖教金获得者,荣获2018年度厦门大学高等教育成果特等奖和2018年度福建省高等教育成果三等奖,
厦门大学数据库实验室负责人,厦门大学云计算与大数据研究中心主要建设者和骨干成员。中国计算机学会数据库专业委员会委员,
中国计算机学会信息系统专业委员会委员。曾任厦门大学信息科学与技术学院院长助理、晋江市发展和改革局副局长。
中国高校首个“数字教师”提出者和建设者,2009年至今,“数字教师”大平台累计向网络免费发布超过500万字高价值的研究和教学资料,累计网络访问量超过500万次。
编著出版了国内高校第一本系统介绍大数据知识的专业教材《大数据技术原理与应用》,并成为京东、当当网等网店畅销书籍。
建设了国内高校首个大数据课程公共服务平台,为教师教学和学生学习大数据课程提供全方位、一站式服务,年访问量超过100万次,
成为国内高校知名大数据教学品牌。主要研究方向为数据库、数据仓库、大数据,
并以第一作者身份在《软件学报》《计算机学报》和《计算机研究与发展》等国家重点期刊以及国际学术会议上发表多篇学术论文。
作为项目负责人主持的科研项目包括1项国家自然科学青年基金项目(No.61303004)、
1项福建省自然科学青年基金项目(No.2013J05099)和1项中央高校基本科研业务费项目(No.2011121049),
作为项目负责人主持的教改课题包括1项2016年福建省教改课题和1项2016年教育部产学合作育人项目,同时,作为课题负责人完成了国家发改委城市信息化重大课题、
国家物联网重大应用示范工程区域试点泉州市工作方案、2015泉州市互联网经济调研等课题。
报告题目:数据库系统概论课程建设40年回顾
报告摘要:
该报告主要介绍中国人民大学数据库系统概论课程建设40年以及教材建设35年的历程,近年来数据库系统概论MOOC课程建设情况,数据库系统概论实验平台建设,以及数据库系统概论SPOC课程建设及实践。
报告人简介:
陈红,博士,中国人民大学二级教授、博导、杰出学者特聘教授,信息学院党委书记兼副院长。中国计算机学会数据库专委会常务委员、物联网专委会委员。作为项目负责人主持国家重点研发计划项目、国家“核高基”重大科技专项课题、国家863计划项目、国家自然科学基金重点项目等20余项;在TKDE 、KDD等国内外学术期刊和会议上发表论文200余篇,出版著译作8部。获教育部科学技术进步一等奖、二等奖,北京市科学技术进步二等奖(两次),中国计算机学会科学技术进步一等奖以及多个国际国内学术会议优秀论文奖等。2005年入选教育部新世纪优秀人才支持计划。
报告题目:《数据科学与工程的数学基础》课程设计——探索与思考
报告摘要:
随着信息技术的发展,大数据的应用领域不断拓广,数据科学与工程已经成为发展迅速,举世瞩目的新兴学科。
尽管这个学科定义分歧、名称各异,但是它与数学的紧密联系,已使它成为包含着大量计算实践的人工科学。
构成数据科学与工程的核心内容是大数据、模型和算法,系统和程序设计。然而,大数据的海量、高维、多模态和高速率以及无处不在的噪声等特征,
决定了这些内容除了依赖于传统计算机科学的离散数学体系,还需要建立在以随机模型、高维空间和几何、矩阵论和数值优化等能描述大数据结构和关系的新的数学体系。
然而,这一体系非常庞大,这些内容不能一门一门地教,
需要设计一门新的类似于计算机科学中“离散数学”这样的统一的“数据科学与工程的数学基础”课程来覆盖这些方面的内容。
本报告将围绕数据科学与工程中大数据的基本结构和大数据的运算关系、探讨如何抽取和重构现有的数学内容,
构建符合数据科学与工程特色的统一的数学内容教学体系。报告将分享课程体系建设中所开展的工作以及对数据科学与工程的数学基础发展趋向等问题的思考。
报告人简介:
黄定江,华东师范大学数据科学与工程学院教授。2007年获大连理工大学计算数学博士学位,2008-2012和2015-2016年在复旦大学、新加坡南洋理工大学和美国加州大学圣克鲁兹分校计算机系从事博士后和访问研究。主要从事数据科学、机器学习与人工智能及其在计算金融、政府治理和智慧教育等跨领域的大数据解析和应用研究等。先后主持或承担国家自然科学基金、国家重点基础发展规划“973”项目子课题等科研项目十多个。以第一作者身份在国内外重要学术会议和期刊如IJCAI, IEEE TKDE,ACM TIST,JDE等发表论文近40篇。担任NIPS,ACML等20多个国际会议或期刊的程序委员或评审人。
Session 2: 导论课程建设
报告题目:如何建设数据专业的第一门导论课程?
报告摘要:
《数据科学与工程导论》是数据科学与大数据技术专业本科学生接触到的第一门专业基础课。这门课程的目标包括了:了解数据专业全貌,建立数据思维的意识;掌握数据科学与工程的基本内涵和应用模式;培养以数据为中心的问题求解能力,系统性的学习数据科学与工程的核心原理与关键技术;培养开源开放的精神,建立基于开源工具的数据分析与处理意识,并做到初步的数据编程训练。而更为重要的是让大家感受到数据与计算的美,数据与计算的愉悦;以及点燃大家对数据专业的热情与兴趣!本报告结合报告人的一线授课经验,和大家一起探讨如何通过课程内容的设计、教学方法的设计、教学案例的设计、以及教学实训的设计,来达成上述目标,期望能够带领同学们进入到数据专业这个新兴学科中来。
报告人简介:
王伟,华东师范大学数据科学与工程学院研究员,美国Wisconsin大学Madison分校和美国Florida大学访问学者,中国计算机学会高级会员、中国计算机学会教育工作委员会委员、中国计算机学会大数据专委会通讯委员、开源社理事会成员。研究方向为容器云、教育大数据和大规模在线学习系统。
报告题目:《数据科学导论》的建设与开源
报告摘要:
在分析大数据时代人才培养工作的主要挑战的基础上,结合报告人自己的《数据科学导论》课程及同名MOOC课程的建设经验,分享关于《数据科学导论》课程建设的几点思考及开源课程行动(Open-sourcing Courses)的设想。
报告人简介:
朝乐门,中国人民大学信息资源管理学院、数据工程与知识工程教育部重点实验室副教授,博士生导师;章鱼大数据首席数据科学家;中国计算机学会信息系统专委员会委员、全国高校大数据教育联盟大数据教材专家指导委员会委员;获得国家自然科学基金项目优秀项目、IBM全球卓越教师奖、全国高校大数据教育杰出贡献奖、中国大数据学术创新奖、中国大数据创新百人榜单、北京市中青年骨干教师、Emerald/EFMD国际杰出博士论文奖、国际知识管理与智力资本杰出成就奖等多种奖励30余项。主持完成国家自然科学基金、国家社会科学基金等重要科学研究项目10余项;参与完成核高基、973、863、国家自然科学基金重点项目等10余项。朝乐门是我国第一部系统阐述数据科学理念、理论、方法、技术和工具的重要专著——《数据科学》(清华大学出版社,2016)的作者,也是数据科学与大数据技术专业第一个领域本体“DataScienceOntology”以及国内第一门数据科学导论MOOC课程的总负责人。2017年9月,出版《数据科学理论与实践》(清华大学出版社,2017)获业界专家的高度评价。2017年11月,首次提出开源课程的倡议,并开源了《数据科学导论》全套教学资料;2018年9月,出版新书《Python编程:从数据分析到数据科学》。
报告题目:数据科学核心课程和实践平台的建设与探索
报告摘要:
报告首先介绍大数据人才的需求状况以及国内外大数据学科建设的发展现状,并以北京大学数据科学学科发展为实例,展示大数据学科建设的交叉特点及复杂性。其次,介绍北京大数据研究院在数据科学核心课程建设的经验和思路。大数据专业注重培养具有理论性、实践性和应用性的多学科交叉型人才。在报告的最后,将介绍我们针对这样的人才培养理念建设的大数据教育云平台。
报告人简介:
欧高炎,北京大数据研究院研究员,大数据教育联盟秘书长,CCF数据库专委会委员。主持建设了广泛应用于高校的大数据教育云平台,平台包含系统的大数据课程体系及实验实训环境和教学案例资源。《数据科学导引》教材主要作者,该教材已被数十所高校采用。北京大学数据科学导引课程授课教师。中国人民银行征信中心“大数据新算法在个人风险中使用效果的评估”项目负责人。
Session 3: 培养方案设计
报告题目:数据科学与大数据技术专业人才培养:哈工大的设计与实践
报告摘要:
哈工大于2018年获批数据科学与大数据技术专业,但是专业申请之前数据科学与大数据技术教育的实践已经开始,专业的设计基于之前的人才培养的实践。在本报告中,报告人将介绍哈尔滨工业大学在数据科学与大数据技术方面人才培养的实践经验,以及基于此设计的数据科学与大数据技术专业培养方案。
报告人简介:
王宏志,哈尔滨工业大学计算机科学与技术学院教授、博士生导师,美国加州大学欧文分校博士后,微软亚洲研究院铸星计划访问学者。其研究方向为大数据、数据科学、数据管理与分析。在VLDB, SIGMOD等国内外重要会议和期刊发表学术论文200余篇,出版学术专著两本,出版国内首部《大数据算法》教材,其论文被SCI收录40余次,他引900余次。获得微软学者、中国优秀数据库工程师、IBM博士英才等称号,获得黑龙江省自然科学一等奖和教育部高等学校科技进步一等奖各一项,获2017年黑龙江省青年科技奖,其博士论文获得哈尔滨工业大学优秀博士论文和中国计算机学会优秀博士论文。先后主持国家自然科学基金重点项目、国家支撑计划课题、国家博士后特别资助等10余个项目,还参加国家973项目、863项目、自然科学基金重点项目等多个项目。其主讲的MOOC课程“大数据算法”获批第一批全国精品在线开放课程,主讲的“算法与分析”获批黑龙江省精品在线开放课程。担任4个国际期刊的编委,50余次担任国内外多个知名数据库会议程序委员会委员。CCF高级会员,任CCF哈尔滨分部副主席、ACM SIGMOD中国秘书长,中国计算机学会学术工作委员会委员、CCF YOCSEF哈尔滨分论坛荣誉委员、中国数据库专业委员会常务委员、黑龙江省数据科学与大数据技术专业委员会副主任委员、中国大数据专家委员会委员、中国计算机应用专业委员会委员、黑龙江省大数据产业协会专家委员会委员、ACM数据科学学科标准编写组成员。
报告题目:数据科学与大数据专业建设的思考
报告摘要:
大数据专业又双叒叕火了,许多高校都在积极申报。如何结合学科优势和特色建设大数据专业成为所有申报高校最为关注的问题。我们从复杂工程能力培养谈谈对数据科学与大数据专业建设的认识,通过发挥领域特色和工程优势,培养具备较强数据领域系统能力的工程创新人才。
报告人简介:
尚学群,西北工业大学教授、博导。2005年获得德国博士学位。在德国留学期间,主要从事数据挖掘和数据库系统研究和开发。此间参加了欧盟的一个大型信息融合项目的研究。 2005年11月西工大引进人才从德国回国工作。2009-2010年作为访问学者在美国RPI计算机系著名数据挖掘专家zaki mohammed教授领导的研究小组从事数据挖掘的研究。2013 - 2017年分别在美国耶鲁大学病理学系、加州大学洛杉矶分校微生物、免疫、分子遗传系、耶鲁大学生物统计系进行短期访问。主要的研究领域为数据挖掘,生物信息学,教育大数据,数据管理等。中国计算机学会高级会员, 美国ACM会员、兼任中国计算机学会数据库专业委员会委员、中国计算机学会生物信息学工作组委员、国家留学人员回国资助项目评审专家、《Frontiers of Computer Science》青年AE、多个国际学术会议的分会主席和程序委员。作为项目负责人先后主持了国家自然科学基金重点项目、国家自然科学基金委面上项目、工信部归国人员择优资助项目、陕西省自然科学基金等多项课题。已在《Scientific Reports》、《Cell Reports》、《Molecular and Cellular Biology 》、《BMC Genomics》、《BMC Bioinformatics》、《Neurocomputing》、ICDM、BIBM等国内外重要学术期刊及权威国际学术会议上发表论文60余篇。论文被包括《Nature Cell Biology》、《Nature Protocols》、《Nature Communications》等刊物引用,其中3篇入选ESI热点论文,2篇入选ESI高倍引论文。
报告题目:复旦大学大数据学院人才培养模式分享
报告摘要:
本报告简要回顾复旦大学数据科学学科建设的历程,重点介绍大数据两院成立以来在人才引进和学生培养方面所做的尝试,包括数据科学和大数据技术专业培养方案设计和课程体系建设。
报告人简介:
高卫国,复旦大学数学科学学院教授,大数据学院副院长,主要从事数值线性代数和高性能计算相关研究,包括线性与非线性特征值问题、大规模科学与并行计算、电子结构计算与鞍点计算、数据科学中的数值分析问题等。主持和参与多个高性能软件包开发,成果发表于计算数学、计算机、物理、化学和控制等学科杂志。是科技部973大数据专项“非结构数据的统计学习:数学基础及算法”课题组组长和专家组成员,自然科学基金委重大项目“大数据的统计学基础及分析方法”课题组组长。
Session 4: 工具与平台
报告题目:数据科学与大数据人才培养建设及应用实践
报告摘要:
针对目前高校数据科学与大数据专业建设方面的需求,从企业实际用人需求角度出发,分析目前市场对数据科学与大数据人才的需求以及现存问题,梳理人才种类以及能力模型,结合企业内部人才培养提升经验,提出数据科学与大数据人才建设的整体方案,基于东软自身业务数据案例优势,提供一系列工具支撑高校的专业建设,如数据科学实训教学平台环境、真实企业项目案例、师资培训服务等,同时针对目前已有的校企合作案例,分享数据科学实训实践经验。
报告人简介:
邹存璐,东软集团股份有限公司数据科学家、大数据平台产品总监,二〇一一年毕业于英国华威大学,获计算机博士学位,同年加入东软集团。在物联网应用、大数据分析、智能推荐系统、生物信息、云计算、网格计算、数据应用分析和挖掘、物联网标准体系建设等领域有系统深入研究,包括产品研发、业务拓展、项目咨询规划、市场战略研究多个方面。先后参与主持数据科学平台软件、知识服务平台软件,客户智能以及物联网智能等多个项目。曾多次参与国家级课题项目的规划和实施,包括九七三云应用软件架构技术研究、核高基网络化应用支撑工具、电子基金面向多行业的信息技术服务知识库系统开发。发表四篇具有国际影响力的论文,拥有七项发明专利申请。
报告题目:中新赛克产教融合探索
报告摘要:
介绍为解决大数据相关专业学生实验资源缺乏的问题,中新赛克所作出的种种探索与努力。
报告人简介:
张卫民,中新赛克大数据产品 市场总监
报告题目:如何建设数据专业的实训平台和工具?
报告摘要:
数据科学是当今大数据,人工智能应用的基础核心技术, 同样是数据专业的基础,掌握数据科学与工程的基本内涵和应用模式,是培养以数据为中心的问题求解能力,系统性的学习数据科学与工程的核心原理与关键技术,需要选择合适的实训平台和工具,并结合丰富的真实案例及动手实验,来实现人才的培养。
本报告主要包括下面基本方面的内容,来探讨组件专业实训平台和工具的重要性:1. 什么是数据科学?2. 数据科学方法论;3. 大数据案例的介绍;4. 真实大数据分析案例的分享,包括:1)基于逻辑回归算法的航班晚点预测;2) 中国气象站的数据分析;3) 泰塔尼克号;5. 大数据实验室平台演示和大数据实训营
报告人简介:
吴仲毓,杭州睿数科技(慧科生态企业)创始人兼 CEO,海归创业。武汉理工大学计算机专业本科以及硕士,加拿大多伦多大学计算机专业硕士,具备10年以上的海外生活和工作背景。慧科数据专业实训平台主要的架构师,负责产品的架构设计,开发以及市场推广等。
原IBM大数据大学(大中华区)项目总监,在IBM大数据及分析全球新技术中心(加拿大多伦多)工作近10年,负责大数据及分析领域最新技术的孵化,培育,开发以及市场推广。2016-2017年期间,受邀到包括上海交通大学,上海复旦大学,首都对外经贸大学以及西南大学等,举办多场大数据及人工智能相关的培训讲座,先后参与培训的老师和学生近千人,并负责 IBM大数据培训和实训项目在中国的落地。
曾是IBM DB2数据库的资深工程师和架构师,具备丰富的开发,设计以及咨询的经验,并以资深的信息产品以及行业经验,帮助众多IBM的全球客户,例如摩根大通,花旗银行,加拿大道明银行等进行数据仓库,信息系统的咨询。他参与设计和开发了第一代IBM Smart Analytics System (ISAS),广泛应用于IBM全球的银行,电信等客户。