[置顶]无损时序压缩Elf+:压缩率再提升10%,压缩时间减少20%(附源码)



早期推文中介绍了Elf:基于擦除的浮点压缩算法,对于双精度浮点数的压缩有着很高的效率,尤其在压缩率方面相比Gorilla和Chimp128分别提高了50%和13%。观察到时间序列中的值通常有着相似的有效值位数,因此Elf算法有进一步的优化空间。本次为大家带来重庆大学时空实验室基于VLDB 2023工作《Elf: Erasing-based Lossless Floating-Point Compr...

[置顶]VLDB 2023 | 基于擦除的浮点无损压缩(附论文和源码)



大量浮点时间序列数据正以前所未有的高速率生成。一种高效、紧凑、无损的时间序列数据压缩方法对海量数据的应用场景至关重要。现有的大多数浮点无损压缩方法是基于异或操作,但它们没有充分利用尾随零,这通常会导致压缩率不尽如人意。本次为大家带来重庆大学START团队在数据库领域顶级会议VLDB 2023最新收录的论文《Elf: Erasing-based Lossless Floating-Point Com...

[置顶]京东城市时空数据引擎JUST亮相中国数据库技术大会(附PPT链接)



受疫情影响,第十一届中国数据库技术大会(DTCC2020)从原定的5月份,推迟到了8月份,再推迟到了12月份。尽管如此,依然没有减退国人对数据库技术的热情。2020年12月21日-12月23日,北京国际会议中心人头攒动,各大厂商争奇斗艳。在NoSQL技术专场,京东智能城市研究院的李瑞远博士给大家带来了《京东城市时空数据引擎JUST的架构设计与应用实践》的主题报告,受到了大家的广泛关注。以下为李瑞远...

数据宝藏与精灵法师:探秘Elf擦除魔法的奇幻故事

图片

在数字领域的奇幻王国中,大家视数据为宝藏。作为奇幻王国的国王,在他的宝库中,自然是有着无数的数据宝藏。这么多的数据宝藏,却让国王发难了。因为宝库有限,放不下这么多数据宝藏。因此,国王广招天下的精灵法师,希望借助他们的魔法,能在不损伤这些数据宝藏的前提下,缩小数据宝藏占的空间,从而让宝库中能装下更多的数据宝藏。在广招的精灵法师团队中,有一位年轻而聪明的精灵法师名叫艾尔弗,他以一种神奇的擦除魔法在精灵...

数据压缩新利器!小精灵ELF助你高效存储与传输

图片

存储空间不够用?网络传输太慢?想必每个人在生活中都会遇到这些问题。看着爆满的硬盘、焦急的等待数据的接受,更新设备?不是每个人都能承担这个成本。那不如尝试一下无损压缩?为了减少存储空间的占用,提高传输效率,START团队提出了一个高效的流式浮点类型数据无损压缩算法——“小精灵ELF”。利用小精灵平均可以将原本100GB的数据可以压缩到33GB。 ELF特点介绍 小精灵ELF是一种...

基于多智能体强化学习的出租车调度框架



网约车平台的繁荣使得人们比以往能更加“智慧”的出行。平台能实时掌握全局的车辆与乘客的供需关系,从而在车辆与乘客之间实现更加有效的匹配。但车辆与乘客还是会经常遭遇“车辆不停寻找乘客而乘客不停寻找车辆”的困境。产生这种现象的根本原因在于车辆供应与乘客需求的时空匹配程度不够。因此,现有很多研究都着力于调度空闲的车辆来提高两者之间的时空匹配程度。其中,基于强化学习的方法凭借其能够捕捉长期的车辆与乘客供需分...

JUST亮相研究生“地理大数据与空间数据智能”暑期学校(视频+PPT)



JUST于2021年8月20日 15:30-17:00通过线上直播方式,在2021年研究生“地理大数据与空间智能”暑期学校分享JUST最新架构及落地案例,全程干货满满!以下是直播的全程录屏,欢迎大家收看!    关注公众号,回复“JSSummer2021”,下载PPT

CCF产学研动态: 京东城市时空数据引擎JUST



摘要定位技术的普及产生了海量的时空数据,这些时空数据能够用于各种智能城市应用。时空数据具有数据体量大、结构复杂、查询分析独特等特点,对大规模时空数据的管理极具挑战。本文介绍的京东城市时空数据引擎JUST,能够便捷、高效地管理海量的时空数据。关键字:时空数据管理,时空数据挖掘,分布式计算,城市计算李瑞远 liruiyuan@whu.edu.cnCCF数据库专委会执行委员,陕西省计算机学会优...

JUST亮相研究生“地理大数据与空间数据智能”暑期学校(视频+PPT)



JUST于2021年8月20日 15:30-17:00通过线上直播方式,在2021年研究生“地理大数据与空间智能”暑期学校分享JUST最新架构及落地案例,全程干货满满!以下是直播的全程录屏,欢迎大家收看!关注公众号,回复“JSSummer2021”,下载PPT

​AAAI 2021:一种跨城市迁移的新冠肺炎高危社区发现框架



新冠肺炎已经在世界范围内广泛传播,严重影响着人们的日常生活。面对新冠肺炎,人为干预的空间隔离手段(如限制出行或集中隔离)已经被证明其有效性。但是,确诊病例的统计往往是滞后且粗粒度的,比如对于尚未确诊的患者他们的传染过程并没有被考虑,因此直接通过各区域的确诊病例建立时空预测模型的方法效果不佳。基于此,研究人员提出了一种跨城市迁移的新冠肺炎高危社区发现框架,该框架能够从人类移动数据与区域特征对地块的隐...