CNCC技术论坛 | 国产数据库系统发展道路的探索与选择

阅读量:12
2019-11-12


在CNCC2019大会的第三天,10月19日(周六)下午,在苏州金鸡湖国际会议中心A212会议室,举办了国产数据库系统发展道路的探索与选择为主题的论坛。论坛邀请了来自阿里、华为、腾讯、人大金仓、蚂蚁金服等产业界的研发一线的技术领袖和来自中国人民大学、清华大学、香港理工大学、西北工业大学等教育界的多位专家共同论道我国数据库系统软件发展道路的探索与选择。数据库系统是重要的基础软件,是信息化建设的基础设施,是最容易被卡脖子的核心技术。掌握自主可控的数据库技术和产品,对于我国国家信息安全、产业安全至关重要。论坛由数据库专委会主任中国人民大学杜小勇教授、数据库专委会副主任武汉大学彭智勇教授共同主持。该论坛引起了学术界和工业界的广泛关注,获得了CNCC2019十佳优秀论坛之一。

WechatIMG604
WechatIMG603



论坛引言:


在当今中美贸易摩擦的大背景下,如何尽快解决信息领域的“卡脖子”的核心技术难题,是摆在我国政府和计算机从业者面前的现实而艰巨的课题,需要产业界和学术界联合起来,共同去努力拼搏,才有可能解决。


此次论坛我们分两个阶段,第一阶段将邀请来自华为、阿里、腾讯、蚂蚁金服、人大金仓等企业研发一线的技术领袖分享他们自研数据库管理系统及其应用的故事,讨论什么样的路径是最适合我国的实际、是最可行的?第二阶段将邀请来自自清华大学、中国人民大学、香港理工大学、西北工业大学等教育界的多位专家以及来自开源社区的专家一起探讨如何通过产学研合作建设国产数据库良好生态,共同推动我国数据库核心技术教育、科研和产业发展。



上半场:国产数据库研发的奋斗故事

特邀嘉宾:李飞飞


640



报告题目:从阿里巴巴数据库发展史看系统科研和产业化演进


报告摘要:阿里巴巴是中国以及全球范围内从大规模使用商业数据库系统演进到使用开源数据库系统再发展到今天全面拥抱自研与自主可控数据库系统的先行者。本次报告将结合阿里巴巴数据库发展历史,以及报告人在数据库系统科研和产业化的经历来分享对这些问题的探索。


嘉宾简介:阿里巴巴集团副总裁, ACM杰出科学家, 达摩院数据库首席科学家。阿里云智能事业群数据库产品事业部总裁, 达摩院数据库与存储实验室负责人。犹他大学计算机系终身教授。曾获NSF、ACM、IEEE、Visa、Google、 HP、华为等多个奖项,获IEEE ICDE 2014 10年最有影响力论文奖、ACM SIGMOD 2016最佳论文奖、ACM SIGMOD 2015最佳系统演示奖、IEEE ICDE 2004最佳论文奖、美国NSF Career Award、中国基金委海外重点研发奖 。担任多个国际一流学术期刊和学术会议的编委、主席。



特邀嘉宾:李思昊


6402



报告题目:华为高斯数据库的国产化之路


报告摘要:本次报告通过对华为数据库近20年研发历程的回顾,详尽揭示了华为高斯数据库从孕育、规划到诞生的全过程,并结合当前华为鲲鹏芯片战略,为听众解读高斯数据库后续的规划与发展。


嘉宾简介:李思昊,华为高斯数据库团队规划负责人。李思昊2010年3月加入华为,是华为高斯数据库团队创始成员之一,一直从事高斯数据库产品管理、技术规划。2011年起负责华为GaussDB 内存库,作为电信计费领域第一,当前已经支撑全球10亿用户计费业务;2013年起,带领团队启动PteroDB研究项目,孵化出华为GaussDB 200并行数据仓库产品,在G行EDW系统完成Teradata搬迁上线,2018年进入Gartner四象限;2016年起带领团队孵化华为分布式OLTP数据库。当前负责高斯数据库团队规划工作。



特邀嘉宾:潘安群


6403

6403


报告题目:腾讯分布式数据库TDSQL研发历程


报告摘要:腾讯用户量级巨大,业务场景复杂,经历了QQ社交、游戏、开放平台、金融、云计算等多次业务突破,每一次突破,均给数据库带来了新的挑战,而腾讯的数据库团队一直沿用着开源及自研两条路并行的策略,腾讯基于Shared-nothing的分布式数据库TDSQL从基于开源定制到自研,一路伴随业务成长,本次将与大家分享一下TDSQL的发展历程与未来展望,谈谈我们对未来国产分布式数据库的发展思考。


嘉宾简介:潘安群,腾讯分布式数据库TDSQL负责人,超过12年分布式计算和分布式数据库研发经验。其带领团队打造的自主可控分布式数据库TDSQL,在数据一致性、分布式、安全性、配套设施等方面表现突出,经历了腾讯集团及腾讯云海量业务的实践验证,目前已经为超过500+金融政企客户提供数据库服务。



特邀嘉宾:任永杰


6404

6404


报告题目:金仓数据库实践与探索


报告摘要:人大金仓历经20年发展,已成为国产数据库骨干企业之一,期间有长足进步,也有经验教训。报告分享人大金仓在国产数据库领域的实践与探索,从校企融合到产学研合作,从跟随国外主流产品到面向市场需求的产品技术研发,从技术选择到市场细分等,以及对未来国产数据库发展的理解主张和公司基本策略。


嘉宾简介:任永杰,博士/教授级高工,北京人大金仓信息技术股份有限公司常务副董事长、首席科学家。香港中文大学系统工程与工程管理学系博士,中国人民大学信息系硕士,北京大学计算机系学士。历任人大金仓技术总监、常务副总经理、总经理,主持承担了863数据库重大专项、核高基国家重大专项等系列数据库方向课题,人大金仓成为国产数据库骨干企业。曾获国家科技进步二等奖、北京市科技进步一等奖、CCF科技进步一等奖、北京市有突出贡献科学技术管理人才、中关村二十周年突出贡献奖等荣誉。



特邀嘉宾:阳振坤


   
6405


报告题目:关系数据库的自主研发与基于开源两种研发模式漫谈


报告摘要:关系数据库是最关键的社会基础设施之一,也是最复杂的大型软件之一。底层数据库“数据一条不能错,服务片刻不能停”是各种联机事务处理系统投入生产运行的前提和基础,而软件bug的存在却是客观事实,这使得关系数据库成为研发挑战最大、成熟周期最长的软件。当前国内的关系数据库研发,主要有两种模式,一种是在相对成熟的MySQL和PostgreSQL等开源多年的数据库软件的基础上进行开发,大多数产品和项目采用了这种模式;另一种是自己完全从零开始研发,这种模式只有像OceanBase等少数产品采用。本次报告将对这两种模式的优势和劣势做个简单地分析和对比。


嘉宾简介:阳振坤博士,在北京大学获得数学学士和硕士以及计算机博士学位并留校,1993年破格晋升副教授,1997年破格晋升教授,1999年成为北京大学首批长江教授,现为蚂蚁金服高级研究员。获得荣誉包括国家科学技术进步奖一等奖(排名第四)、北京市科学技术进步奖一等奖、第六届中国青年科技奖、第一届中国科协求是杰出青年奖等。阳振坤近年来的主要研究领域为分布式系统和分布式关系数据库,2010年6月他在阿里巴巴发起了OceanBase分布式关系数据库的研发,现在OceanBase已经在蚂蚁金服的核心系统中全面取代了Oracle数据库,也应用于网商银行、阿里巴巴、印度PayTM公司等,并在多家大中型商业银行使用。



下半场:营造国产数据库的发展生态


特邀嘉宾:陈红


6406


报告题目:数据库系统研发人才培养的实践和思考


报告摘要:培养数据库系统研究和开发人才是数据库系统生态建设的一个重要方面,中国人民大学数据库团队在数据库系统研发人才培养上做了大量的探索和实践。本报告将分享人大信息学院数据库基础课程及高级课程设置情况,数据库管理系统研发从理论到实践的人才培养体系,MOOC及SPOC课程的建设与实施,产学研合作的高端人才培养机制等。本报告还将分享人大数据库团队在数据库系统研发高端人才培养过程中遇到的问题、困惑以及相关思考


嘉宾简介:陈红,博士,中国人民大学二级教授、博士生导师,数据工程与知识工程教育部重点实验室学术委员会副主任,信息学院党委书记兼副院长。主持国家重点研发计划等项目20 余项;发表论文200 余篇。获国家科学技术进步二等奖等奖项。



特邀嘉宾:李国良


6407

6407


报告题目:构筑国产数据库系统生态


报告摘要:数据库是连接计算机系统和应用之间的必备系统软件,已经被广泛应用到各行各业。然而目前主流的数据库系统都来自于国外,数据库已经成为了卡脖子的产品,因而构筑国产数据库已经成为迫在眉睫的任务。除了构筑数据库存储引擎、优化引擎、事务处理、弹性计算等核心技术之外,数据库生态建设也是构筑国产数据库的重要一环。本报告将从国产数据库开源社区、开发者社区、DBA培养、学生培养、教材体系构建等方面来分享构筑国产数据库系统生态的一些思考。


嘉宾简介:清华大学计算机系长聘教授,软件所所长。发表CCF A类论文100余篇,他引6500余次,获得了VLDB Early Career Research Contribution Award、IEEE TCDE Early Career Award。获得KDD18、ICDE18最佳论文候选,CIKM’17最佳论文奖、DASFAA’14的最佳论文提名奖、APWeb’14最佳论文奖。获得过自然基金重点项目、优青、青年拔尖、973青年项目资助。



特邀嘉宾:李青


6408

6408


报告题目:数据库系统生态建设 -- 从香港看向大湾区


报告摘要:目前香港的数据库市场,主流的系统以SQL Server, Oracle, Sybase ASE, 以及DB2为代表。经过多年的市场耕耘,这些产品的生态环境已经形成体系,上下游、供应链等相关方都对它们形成了强劲的支持,并拥有不错的口碑。随着AI, IoT, 大数据和云计算的迅猛发展,数据库的生态体系也在快速发展和变化中。在香港,新的应用领域如智慧城市、智慧金融、智慧医疗、智慧企业、智慧教育等都在影响着上下游并形成新的产业链。随着国家大湾区的战略部署,上下游供应链的数据异构和去中心化的特质更加明显与突出。同时,新的机器学习如迁移学习、联邦学习等技术与应用也应运而生,一方面对底层的数据库管理系统提出了新的要求(比如联邦数据库架构),另一方面对整个生态建设也将产生积极的影响。我的演讲将对相关方面作些探讨与展望,希望能起到抛砖引玉的作用。


嘉宾简介:李青是香港理工大学电子计算学系的讲座教授兼系主任,从事数据库相关的研究与应用逾30年,发表论文近400篇。他的早期工作专注于数据建模与结构演化,中期工作包括数据仓库设计、多媒体及跨模态数据融合与管理,目前的研究兴趣集中在(社会媒体)大数据语义理解、事件检测及因果关系挖掘。他是多个国际会议Steering Committee的成员,包括DASFAA, ER, WISE, WAIM等。同时,他还担任香港万维网科技学会的主席。李教授是国家基金委(NSFC)"海外杰青"获得者,并于2014年获得"陆鸿均WAIM杰出贡献奖",以及2018年"DASFAA杰出贡献奖"等荣誉。



特邀嘉宾:李战怀


6409



报告题目:产学研合作的实践与思考


报告摘要:结合本团队在数据库及存储系统方面与产业界的长期合作经验,对高校做好产学研合作工作提出一些建议。


嘉宾简介:李战怀,教授,博士生导师,工业和信息化部大数据存储与管理重点实验室主任;中国计算机学会数据库专委会副主任委员;中国计算机学会信息存储专委会副主任委员;中国航天学会计算机应用专业委员会委员;2013-2017年教育部高等学校教学指导委员会委员;先后主持了国家973课题、科技部重点研发计划课题、国家自然科学基金重点项目、国家自然科学基金重大国际合作项目、国家863计划重大项目课题、国防科技预研、国家自然科学基金面上项目等项目。数十次担任国际学术会议的程序委员会委员(或主席),获省部级一等奖、二等奖各两项。目前主要从事的研究领域有:大数据管理技术、海量信息存储系统等。



特邀嘉宾:赵振平


64010

64010


报告题目:开源数据库内核开发生态报告


报告摘要:PostgreSQL是全球强大的,真正的开源数据库,由此衍生出了不少著名的产品,还诞生了好几个享誉世界的独角兽公司。开源影响全球技术发展,开源影响行业变局,开源思维影响产品开发周期。我将从开源数据库PostgreSQL的角度,分项全球开源数据库内核开发技术现状,人才现状,组织现状,探索内核研发生态建设。结合中国国情,如何借力全球开源力量优势,反哺国内数据库行业的发展。探索数据库行业弯道超车的可行性,共同推动国产数据库的发展。


嘉宾简介:计算机畅销书作家,贵州省省管专家,国家首批大数据高级职称,腾讯最具价值专家(TVP),电子工业出版社签约作家,出版了技术专著《Oracle数据库精讲与疑难解析》,出版了技术专著《成功之路:Oracle 11g学习笔记》,出版了技术专著《IT架构实录》。



论坛主席

杜小勇

64011



主席简介:杜小勇,工学博士,中国人民大学二级教授,博士生导师,主要从事数据库系统、大数据管理与分析等领域的研究。现任教育部数据工程与知识工程重点实验室主任,中国人民大学信息学院学术委员会主任,中国计算机学会数据库专业委员会主任、教育工委主任,科技部国家重点研发计划“云计算和大数据”总体专家组成员,工信部大数据标准工作组副组长,《大数据》期刊副主编等,教育部科技委信息学部委员。曾担任“十五”国家863计划“数据库管理系统及应用”重大专项专家组组长,国家中长期科技发展规划“核高基”实施方案编写专家组成员。曾先后获得国家科技进步二等奖(2018),教育部科学技术进步奖一等奖(2016),中国计算机学会科学技术奖一等奖(2015)和北京市科技进步奖一等奖(2005)等。

论坛主席

彭智勇

64012



主席简介:彭智勇,武汉大学教授、博士生导师, 国务院软件工程学科评议组成员,中国计算机学会会士、数据库专业委员会副主任、大数据专家委员会成员。1985年获武汉大学理学学士,1988年获国防科技大学工学硕士,1995年获日本京都大学工学博士。1995-1997年在日本京都高度技术研究所工作,研究员。1997-2000年在美国惠普公司的研究所工作,研究员。提出了一个新的数据库模型:对象代理模型,发表在数据库国际顶级会议IEEE ICDE和权威期刊IEEE TKDE上,得到了学术界认可;分析了开源数据库PostgreSQL核心代码,出版了《PostgreSQL数据库内核分析》专著,受到了产业界欢迎;研制了对象代理数据库管理系统TOTEM,形成了自主知识产权;目前主要从事对象代理数据库、大数据管理系统、制造业大数据、科技大数据、教育大数据、可信云数据和地理数据水印等方面的研究。