当前位置:首页 > 房产信息

doris Apache Doris(incubating)发布首个社区版本

最近Apache Doris(孵化)通过社区投票成功发布了第一个0.9.0版本。

多丽丝是什么?

多丽丝(原百度Palo)是基于大规模并行处理技术的分布式SQL数据库,2017年由百度开放,2018年进入Apache孵化器。

多丽丝的主要特征

1.它与MySQL协议兼容,支持丰富的SQL语法,包括多表连接、子查询、窗口函数和CTE。支持很多常见的BI报表系统,可以大大降低用户的学习和迁移成本。

2.支持高并发查询和高吞吐量多维分析查询场景。通过分区裁剪、预聚合、谓词下推、矢量化执行等技术,以及高效的列存储引擎,即数据压缩算法,满足不同业务场景下的延迟和吞吐量需求。

3.独特的数据预聚合功能。支持预聚合表和基准表的同步原子更新,并为报表场景提供更快的查询响应。

4.提供强大的可扩展性和高可用性。所有数据均采用多份副本,确保数据的高可靠性,并提供全自动副本选择、平衡和修复功能,为用户提供7*24小时高可用的数据库系统。

5.提供友好的在线表格结构变更功能,可以有效应对业务需求的变化。

6.提供两级数据分区功能和分层存储功能。用户可以更灵活地管理和维护数据。

多丽丝已经在百度申请了200多条业务线,包括百度风超和百度统计。最大单个业务数据量超过500 TB。同时在百度的公有云和toB业务中得到了高度认可。自开源以来,小米、美团、搜狐、新浪微博、瓜子脸、链家、上海一威、零售魔方、量化派等十多家公司在制作环境中使用了多丽丝。

第一个发布版本已经发布

作为多丽丝进入Apache孵化器以来的第一个版本,这个版本在功能、性能、易用性和稳定性方面都有了很多改进。以下是该版本的一些主要功能。

1.流式导入

在以前的版本中,Doris只支持批量异步导入。这种导入方式对卡夫卡、Spark Streaming等流媒体系统不友好。此外,批量导入执行过程中有许多磁盘删除操作,导致整体导入效率较低,单机导入速度约为10-20mb/s。

新的导入模式采用了微批量的思想。Doris一方面支持数据同步导入,方便对接流媒体数据源;另一方面导入效率大大提高,单节点导入吞吐量可达100 MB/s;导入小数据的延迟从几分钟减少到几毫秒。

2.同地连接

通过管理表数据的分布,支持多表数据的原位连接操作。减少Join操作的网络传输,大大减少Join类查询的延迟。(感谢美团同学的贡献)

3.高效的数据碎片管理

引入RocksDB存储数据切片的meta-informatIOn,大大减少了随机io操作。每台机器500,000台电脑的启动时间从10分钟缩短至20秒。

4.更丰富的集群状态查询和管理

提供100多个监控指标和丰富的监控仪表盘;;提供当前查询和历史查询的资源消耗显示和统计;提供更完善的副本管理和状态查询工具。便于运维人员快速定位系统故障,找出性能瓶颈。

5.提供Docker开发环境映像

开发人员可以在大多数环境中快速构建多丽丝编译和调试环境,而无需处理复杂的编译依赖关系。

6.Apache许可证2.0

许可证改为Apache许可证2.0,任何公司或个人都可以自由使用和开发多丽丝。

7.缺陷和稳定性问题修复

多达30多个Bug和稳定性问题修复。帮助多丽丝成为更加成熟稳定的数据库产品。

目前,越来越多的开发商加入多丽丝社区。多丽丝团队非常感谢用户的支持,并将一如既往地努力推动多丽丝朝着更加开放、合作、对商业化友好、外围工具更加丰富的方向前进。

同时,我们还维护了多丽丝的百度分公司。百度分公司会跟社区分公司并驾齐驱,更快的修复bug,更频繁的发布版本。用户可以在生产环境中使用百度分公司发布的版本,以确保更稳定的在线服务。

多丽丝计划在2019年4月发布下一个官方Apache版本。在新版本中,多丽丝将增加与卡夫卡的数据对接能力,支持弹性搜索的数据查询能力,更新和优化包括UDF和十进制数据类型改进在内的许多功能。

敬请期待,欢迎体验!

欢迎来到开发者邮件群:

dev@doris.apache.org

相关链接:

阿帕奇多丽丝0.9.0

http://doris.apache.org/downloads.html

阿帕奇多丽丝官网

http://doris.incubator.apache.org

Apache Doris Github

https://github.com/apache/incubator-doris

阿帕奇多丽丝维基

https://github.com/apache/incubator-doris/wiki

百度桃乐丝Github

https://github.com/baidu-doris/incubator-doris

1.《doris Apache Doris(incubating)发布首个社区版本》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《doris Apache Doris(incubating)发布首个社区版本》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/fangchan/1235019.html

上一篇

furmark设置 科普教程 篇五:小白超频教程——显卡篇

下一篇

提到的英文 提到bag只想到包包?学学bag的十种英文表达

新版本吕布符文5级推荐 2020国服最强“快刀流”吕布铭文及六神装推荐,80%胜率全靠这种打法!

  • 新版本吕布符文5级推荐 2020国服最强“快刀流”吕布铭文及六神装推荐,80%胜率全靠这种打法!
  • 新版本吕布符文5级推荐 2020国服最强“快刀流”吕布铭文及六神装推荐,80%胜率全靠这种打法!
  • 新版本吕布符文5级推荐 2020国服最强“快刀流”吕布铭文及六神装推荐,80%胜率全靠这种打法!
思派 「医疗数据说」思派集团李大勇:关于医疗大数据的五个“为什么”

思派 「医疗数据说」思派集团李大勇:关于医疗大数据的五个“为什么”

医疗大数据创业的“火”从2018年烧到2019年。虽然有些玩家对自称“医疗大数据企业”非常敏感,但不得不承认,大数据推动的医疗“价值革命”正在席卷整个行业。 2019年是否会开启医疗大数据的“新时代”不得而知,但不难看出行业的“心态”趋于开放。...

南京地铁规划图 数据 | 未来4年地铁规划流出 南京超1000公里

  • 南京地铁规划图 数据 | 未来4年地铁规划流出 南京超1000公里
  • 南京地铁规划图 数据 | 未来4年地铁规划流出 南京超1000公里
  • 南京地铁规划图 数据 | 未来4年地铁规划流出 南京超1000公里

12367服务平台上线 有网页版和手机版两个版本 事件详细经过!

​4月8日,记者从国家移民管理局获悉,国家移民管理机构12367服务平台和国家移民管理局英文版门户网站今日上线运行。...

世导服务器托管 TikTok砸5亿美元在爱尔兰建数据中心,托管欧洲用户信息

世导服务器托管 TikTok砸5亿美元在爱尔兰建数据中心,托管欧洲用户信息

8月6日,据媒体报道,TikTok将在爱尔兰建立首个欧洲数据中心,投资4.2亿欧元(合同金额5亿美元),预计将于2022年初开放并投入使用。对此,字节跳动相关负责人告诉南方记者,TikTok确实会在爱尔兰建立一个欧洲数据中心。  消息称,Tik...

粤工惠 粤工惠上线金融服务功能,福利代发、津贴发放、工会费收缴……“电子钱包”搞定!

永中官网 永中DCS“在线文档编辑”功能让文档编辑更便捷

在一些学校的官网网站上,我们经常可以看到一些以附件形式悬挂的通知或申请表格等文件。当我们需要处理一些事情时,我们可能需要填写这些材料。此时,我们可以直接从网站下载文档并填写。最后,我们将下载完成的文档并交给相关人员。然而,随着互联网的发展,这个...

留存率 留存分析数据研究心得大公开!告诉你“用户留存率”的重要性

在我过去的互联网经历中,我遇到了一个特别棘手的问题:每天有2-3万注册用户,但为什么活跃用户总数每天不增加? 常识性的解释是,如果用户规模不变,那一定是用户来了又走了,加多少亏多少。所以自然要从损失入手,做一些研究,比如对损失者的画像,损失原因...