DSE-DSE APWeb-WAIM 2020精选特邀论文特刊

期刊及会议

tcdb_qkjhy

DSE APWeb-WAIM 2020精选特邀论文特刊

Data Science and Engineering最新出版的一期（Volume 6, Issue 3）的论文主要来源于APWeb-WAIM 2020会议，精选了6篇作为特邀扩展论文。

会议简介

APWeb-WAIM会议聚焦于Web信息管理相关的研究、开发和应用等广泛的主题。近年来许多研究热点如网络技术、数据库系统、信息管理、软件工程和大数据都有所涉及。第4届APWeb-WAIM会议于2020年9月18日至20日在中国天津举行，会议共收到259篇论文。程序委员会经过评议最终选择了68篇长文、29篇短文和8篇演示论文在会议上进行展示，并且收录在Springer会议论文集中。会议还邀请到四位著名学者进行大会特邀报告，分别为James Hendler教授（伦斯勒理工学院）、林学民教授（新南威尔士大学）、Masaru Kitsuregawa（东京大学）和周晓方教授（昆士兰大学）。

特刊简介

本期特刊的6篇扩展论文是由特邀编辑王鑫教授（天津大学）、李博涵副教授（南京航空航天大学）和杨世宇教授（广州大学）三位共同筛选并录用。筛选的依据是与DSE期刊的相关性和会议的评审意见，从所有录用论文中反复讨论决定的。所有论文的作者需按照DSE要求再次修改论文，并按照惯例添加至少30％新的实质性内容，修改后的论文也按照DSE标准流程经过严格的审稿、修改等过程后最终呈现给读者。

本期特刊的6篇论文涵盖了与数据科学和工程相关的多个主题，简介如下：

（1）Multiple Local Community Detection via High-Quality Seed Identification over Both Static and Dynamic Networks

原文链接：https://link.springer.com/article/10.1007/s41019-021-00160-6

该论文提出了一种新的算法HqsMLCD，用于恢复种子节点所属的所有社区。该方法可以在静态和动态网络中检测给定种子节点的多个社群。作者从整个网络采样并嵌入和聚类到候选子图，通过质量分数选择高质量的种子。为了解决动态网络中的多个局部社区检测问题，作者将静态算法扩展到HqsDMLCD。通过动态嵌入候选子图和动态扩展高质量种子，在动态网络上增量检测多个社区。

（2）GPU-Based Dynamic Hyperspace Hash with Full Concurrency

原文链接：https://link.springer.com/article/10.1007/s41019-021-00161-5

该论文为GPU构建了一个全并发动态超空间哈希表，并设计了特殊的并发控制和数据共享策略，以确保无等待读操作和高并行加速。这种新的超空间哈希数据结构的查询属性是单独存储的，提出的GHSH方法可以充分利用GPU的内存层次结构，通过GPU上的缓存访问来减少高延迟内存访问的次数，提高资源利用率。

（3）Scalable Multi-grained Cross-modal Similarity Query with Interpretability

原文链接：https://link.springer.com/article/10.1007/s41019-021-00162-4

该论文研究图像和文本的多粒度通用语义嵌入表示，将可解释查询索引集成到深度神经网络中。作者提出了一种具有可解释性的多粒度跨模态相似度查询框架（MCQI），以有效地利用粗粒度和细粒度语义信息来实现有效的可解释性跨模态查询，同时引入了一种高效kNN相似度查询算法。

（4）Achieving Approximate Global Optimization of Truth Inference for Crowdsourcing Microtasks

原文链接：https://link.springer.com/article/10.1007/s41019-021-00164-2

该论文提出了二元答案众包微任务答案聚合的近似全局最优算法，并推广了期望最大化的局部最优结果。作者从三个不同的角度对工人素质建模，并构建似然函数，然后基于EM算法获得局部最优结果。基于局部最优结果构建了优势排序模型（DOM），并设计了切点邻居检测算法，通过增加整体似然值来改进任务真值的估计。

（5）Efficient Personalized Influential Community Search in Large Networks

原文链接：https://link.springer.com/article/10.1007/s41019-021-00163-3

该论文研究了最大个性化影响力社群搜索，提出了一种基于索引的最优方法，以满足现实应用中的在线需求。作者基于不同的顶点访问顺序，提出了两种算法，即自顶向下算法和自底向上算法。为了满足在线搜索的需要，提出了一种基于索引的方法。当用户需要多个社区时，提出了支持top-r检索社区的方法。

（6）Deep Multiple Auto-Encoder based Multi-view Clustering

原文链接：https://link.springer.com/article/10.1007/s41019-021-00159-z

该论文提出一种基于多自编码器的深度多视图聚类算法MVC-MAE，对多视图数据进行聚类。该算法采用自动编码器以分层方式捕获每个视图的非线性结构信息，并将每个视图内的局部不变性以及任意两个视图之间的一致性和互补性信息相结合。进一步，将表示学习和聚类集成到一个统一的框架中进行联合优化。

客座编辑简介

特邀编辑王鑫，天津大学智能与计算学部教授、博导。CCF杰出会员、信息系统专业委员会秘书长、数据库专业委员会委员。研究方向：知识图谱、图数据库、大数据处理。国际期刊Knowledge-Based Systems副主编、Big Data Research编委。国际会议APWeb-WAIM 2020程序委员会主席、JIST2019程序委员会主席。

特邀编辑李博涵，南京航空航天大学计算机/人工智能学院副教授。ACM/CCF会员、CCF数据库专委、CCF信息系统专委、CCF科普工委、CAAI智能传媒专委。WWWJ、HISC客座编辑；担任TITS、KAIS、MTAP、中国科学(英文版)，以及AAAI、IJCAI、DASFAA、CIKM等期刊、会议特邀审稿人。研究方向：时空数据库、GIS、知识图谱、区块链等。

特邀编辑杨世宇，广州大学网络空间先进技术研究院教授，大数据计算与智能研究所所长，广州大学-滴滴智通“智慧交通与安全联合实验室”常务副主任, CCF信息系统专业委员会委员，数据库专业委员会通讯委员。研究方向：时空数据管理、图数据管理、新型硬件计算加速。担任多个国内外期刊编委和会议程序委员。