期刊及会议

tcdb_qkjhy

2022年度VLDB暑期学校暨20周年特别论坛成功举办

由中国计算机学会主办、中国计算机学会数据库专委会和苏州大学计算机科学与技术学院联合承办、中国人民大学和平凯星辰(北京)科技有限公司协办的2022年度(第21届)VLDB暑期学校(VLDB Summer School 2022)于2022年7月7日至2022年7月13日在江苏苏州春申湖度假酒店成功举办。本次活动得到了平凯星辰(北京)科技有限公司(PingCAP)的赞助。

合影(1)

本届VLDB暑期学校的主题为AI4DB,授课模式为理论讲解+动手实践。大部分理论授课安排在上午,组委会邀请了多位在AI4DB领域有丰富科研和教学经验的计算机科学家作为本次授课的主讲人:清华大学李国良教授、普渡大学Walid G. Aref教授、VMware Research研究员Aishwarya Ganesan博士、字节跳动美国实验室高级研究科学家张铁赢博士,他们分别就基于学习的查询优化、学习型索引以及基于学习的数据库配置等前沿问题进行了深入浅出的讲解。在下午的实践环节,组委会邀请PingCAP公司的资深工程师张原嘉先生与徐逸凡先生组成实训团队,围绕AI4DB这一目标精心设计了四个实训任务,讲解并辅导同学实践。除此之外,今年是VLDB暑期学校20周年,组委会组织了一项关于“数据库:集中式vs分布式”的特别论坛,并且开展了相关的纪念活动,取得圆满成功。

受新冠疫情影响,本次活动采取线上线下混合的方式举行。经过报名与遴选,本次活动共计125名学员参加(其中73名学员线下参加,52名学员线上参加),分别来自东北大学,中国人民大学,北京大学,华东师范大学、山东大学、湖南大学、南方科技大学等34所高校。学员在理论课和实践课上积极提问、热情参与互动活动,课程取得了良好的效果。大部分小组在实践过程中完成了对AI4DB方向的初步探索,为以后深入研究相关领域打下了坚实基础。

图片2

图片3

图片4



以下是活动详情:

【活动第一天:2022年7月8日】

2022年度VLDB暑期学校于2022年7月8日在江苏苏州春申湖度假酒店百合厅隆重举行开幕仪式。出席开幕仪式的嘉宾有:中国计算机学会数据库专委会主任、工业和信息化部大数据存储与管理重点实验室主任、西北工业大学李战怀教授(线上),中国计算机学会数据库专委会前主任、VLDB暑期学校校长、中国人民大学校长助理兼理工学科建设处处长杜小勇教授,PingCAP 联合创始人兼 CTO黄东旭先生(线上)。开幕仪式由中国人民大学信息学院张静副教授主持。

仪式开始,VLDB 暑期学校校长、中国人民大学杜小勇教授介绍了VLDB 暑期学校的发展历史及办学初衷,从多方面对同学们提出要求,希望同学们在暑期学校能够认真学习,积极参与活动,努力提升自己,为中国数据库行业发展贡献一份力量。

图片5

随后中国计算机学会数据库专委会主任、西北工业大学李战怀教授进行致辞。他再次强调举办暑期学校的初心是为我国培养高端数据库人才,并衷心祝愿参与暑期学校的同学都能有所收获。李战怀教授在开幕仪式上反复表达了因为疫情不能到现场的遗憾心情。

图片6

最后,PingCAP联合创始人兼CTO黄东旭先生从工业界的角度出发,以自身学习数据库的经历为例子,说明了实践对于数据库学习是至关重要的。希望大家通过这几天的实践,能够对数据库前沿领域更加熟悉。开幕仪式结束后,线下参会的同学与嘉宾共同合影留念。

图片7

本届VLDB 暑期学校的第一课由清华大学李国良教授主讲。李国良教授首先对近年来大火的AI4DB领域进行了系统的总结和概括,然后以“Learning-based Cardinality/Cost Estimation”为题,从解决基数估计和代价估计的传统方法出发,分析它们面临的问题与挑战,之后介绍了几个基于学习思想的工作,这些工作可以有效缓解传统方法中存在的一些缺点。课堂现场氛围十分热烈,线上线下教师与同学纷纷在提问环节积极展开了讨论与思考。通过他的讲解,同学们对AI for Cardinality/Cost Estimation有了初步的理解,为接下来的编程实践打下了理论基础。

图片8

7月8日下午,来自PingCAP的高级工程师张原嘉先生指导同学们展开了编程实践的第一次课程“实现两种基于学习的基数估算方法”。张工程师在李国良老师理论讲解的基础上,进一步从实现级别对基于查询的基数估算和基于数据的基数估算进行了细化讲解。讲解结束后,同学们以分组的形式开始进行编程实践,通过头脑风暴与小组讨论,同学们对学习型基数估算有了更深刻的了解。

图片9



【活动第二天:2022年7月9日】

7月9日上午的教学环节继续由来自清华大学的李国良教授进行授课。李国良教授全面地介绍了“Learning-based Optimizer”领域的具有代表性的相关工作。同样从传统方法出发,分析传统方法存在的缺点,然后介绍如何用一些学习型的方法替代传统方法,最后提出自己的一些思考。李国良教授的授课不仅内容详实,并且深入浅出,再次引起了线上线下参会同学的积极互动讨论。

图片10

当日下午,PingCAP张原嘉和徐逸凡工程师对第二个实践任务“手动完成一组代价模型的校准,实现一个基于学习的代价模型”进行了全面地讲解,包括代价模型的基本介绍、代价模型的校准以及基于学习的代价模型。经过前一天的实践,大家对AI4DB项目的编程风格和范式更加熟悉,能够很快进入学习状态。



【活动第三天:2022年7月10日】

7月10日的理论学习主题为学习型索引,其中上午的课程由VMware Research的Aishwarya Ganesan博士主讲,主题为“A Learned Index for Log-Structured Merge Trees”,下午的课程由普渡大学的Walid G. Aref博士主讲,主题为“Learned Index”。他们分别介绍了目前在学习型索引上进行了的一些尝试,并指出学习型索引的未来方向。面对同学们在听讲过程中产生的疑问,他们也不留余力进行了解答。

图片11(1)

在实践环节中,针对大家在交流群里经常提到的一些问题,PingCAP工程师进行了详细解答,帮助同学们进一步提升实验效率。解答结束后,同学们在工程师的指导下开始第三个实践任务“将前两个实践完成的代价估算模型和代价模型整合到 TiDB 中”。通过阅读和分析TiDB源码,同学们的动手能力得到了进一步提升。



【活动第四天2022年7月11日:VLDB暑期学校20周年特别论坛】

今年是VLDB暑期学校20周年,因此组委会开展了一系列特别纪念活动。7月11日上午,暑期学校举办了“20周年特别论坛——数据库:集中式vs分布式”活动,主要探讨集中式和分布式数据库的未来。天津南大通用数据技术股份有限公司高级副总裁赵伟先生、PingCAP 联合创始人兼 CTO黄东旭先生、人大金仓信息技术股份有限公司高级副总裁冷建全先生、阿里巴巴集团副总裁李飞飞先生、中国计算机学会数据库专委会主任李战怀教授、中国计算机学会数据库专委会前主任、VLDB暑期学校校长杜小勇教授参加了特别论坛,活动由清华大学李国良教授主持。

图片12

图片13

人大金仓冷建全和阿里云李飞飞分别就集中式数据库和分布式数据库进行了介绍,他们从多角度系统地回顾和总结了集中式和分布式的特点与缺陷。在论坛环节,6位特邀嘉宾被分为集中式阵营(赵伟、冷建全)、分布式阵营(李飞飞、黄东旭)和学术界阵营(李战怀、杜小勇)分别对集中式和分布式数据库的未来发表了自己的观点和想法。

图片14

论坛结束后,组委会举办了VLDB暑期学校20周年纪念活动,活动由中国人民大学杜小勇教授主持,西北工业大学李战怀教授致辞。来自苏州大学的朱巧明教授作为第一届组织者代表进行了报告,回忆了20年前第一届VLDB暑期学校的种种往事细节。中国人民大学信息学院前院长、国家级教学名师王珊教授作为VLDB中国数据库学院第二任院长进行了报告,王珊教授在报告中反复强调VLDB 暑期学校是一个公益性的平台,初心在于培养中国高端数据库人才。王珊教授提到,20年前,中国学者在数据库顶会上仅有1篇论文发表,经过20年的不断努力与追赶,目前中国学者在数据库顶会上发表的论文占10%左右。香港科技大学计算机科学与工程学系教授、系主任周晓方教授代表第一届讲师、华东师范大学数据科学与工程学院院长钱卫宁教授代表第一届学员对VLDB暑期学校表达了浓厚的怀念与感激之情,香港科技大学(广州)王炜教授也在现场做了致辞。

图片15

图片16

最后,李战怀教授代表数据库专委宣布了关于“VLDB中国数据库学院”更名为“中国数据库学院”的决定,并由组委会发放20周年纪念册。

7月11日下午,PingCAP工程师姚维向同学们介绍了TiDB Hackthon 2022活动的基本情况,鼓励同学们积极参与到2022年Hackthon竞赛中,进一步提升自身的实践能力。随后,PingCAP王岩广先生以“开源与你”为主题与同学们进行深入的交流,号召更多同学参与到开源大军中。最后,组委会组织线下参会的数据库专委会常委和同学们一起作为CCF总部大楼建成后的第一批参观人员,集体参观了最新落成的CCF苏州总部大楼。

图片17



【活动第五天:2022年7月12日】

7月12日上午,由字节跳动张铁赢博士授课,张老师围绕“Learning-based DB Configuration”主题为同学们介绍了人工智能在数据库参数自调优领域相关的工作。由于数据库的查询性能通常会受到各种参数的影响,因此为某个查询找到一组合适的设置参数十分重要。基于学习的方法目标在于使用人工智能方法对数据库中存在的大量可设置参数进行自动调整。

7月12日下午,来自PingCAP公司的工程师向同学们详细讲解了最后一个实验:“查询优化的端到端学习方法”,尽管这个实验是可选的,但PingCAP的工程师依然充满热情,积极解决同学们在实践中遇到的任何问题。

图片18(1)



【活动第六天:2022年7月13日】

本届VLDB暑期学校历时6天,闭幕式于2022年7月13日上午举行。首先,共有13个小组制作了PPT来展示他们在实践任务上的完成情况,其中线下12个、线上1个。每个小组从小组介绍、实践结果展示、收获与感受等方面进行了汇报。

图片19

图片20

图片21

组委会邀请了华东师范大学钱卫宁教授、香港科技大学(广州)王炜教授、苏州大学许佳捷教授、中国人民大学张峰教授、PingCAP工程师张原嘉与徐逸凡组成专家评审团,对各组进行评分和点评,最终评出一个一等奖、两个二等奖和四个三等奖,颁发给7个小组的同学。

杜小勇教授和PingCAP王岩广先生分别为优秀学员、积极参与学员、主讲讲师、实训讲师、助教、志愿者、组织者、赞助商颁发了证书和奖品。

图片22

图片23

图片24

最后,中国计算机学会数据库专委会主任李战怀教授与VLDB暑期学校校长杜小勇教授对本届VLDB暑期学校进行总结发言。PingCAP研发副总裁唐刘先生表示与CCF数据库专委会的合作是正确的决定,期待明年的中国数据库暑期学校!

图片25

图片26

图片27

第21届VLDB暑期学校落下帷幕,活动取得圆满成功!



附录:2022 VLDB暑期学校组织机构

VLDB 中国数据库学院院

杜小勇 教授(中国人民大学)

本期组委会

学术委员会主席

杜小勇 教授(中国人民大学) 李战怀 教授(西北工业大学)

组织委员会主席

赵雷 教授(苏州大学) 张静 副教授(中国人民大学) 王岩广(PingCAP公司)

主办单位

中国计算机学会

承办单位

中国计算机学会数据库专委会   

苏州大学计算机科学与技术学院

协办单位

中国人民大学

平凯星辰(北京)科技有限公司


CCF二维码(公众号发布用)