加入收藏 | 设为首页 | 会员中心 | 我要投稿 怀化站长网 (https://www.0745zz.cn/)- 语音技术、云资源管理、物联设备、云计算、决策智能!
当前位置: 首页 > 站长资讯 > 传媒 > 正文

8个流行的Python可视化工具包

发布时间:2021-02-12 19:19:26 所属栏目:传媒 来源:互联网
导读:常务董事、华为消费者业务CEO余承东在演讲中表示, HarmonyOS将正式开源,开发者将获得模拟器、SDK包以及IDE工具,2020年底首先对国内开发者发布针对智能手机的HarmonyOS beta版本。华为将代码捐赠给中国开放原子开源基金会,并宣布了HarmonyOS的开源路标:

常务董事、华为消费者业务CEO余承东在演讲中表示, HarmonyOS将正式开源,开发者将获得模拟器、SDK包以及IDE工具,2020年底首先对国内开发者发布针对智能手机的HarmonyOS beta版本。华为将代码捐赠给中国开放原子开源基金会,并宣布了HarmonyOS的开源路标:“从9月10日起,HarmonyOS将面向大屏、手表、车机等128KB-128MB终端设备开源,2021年4月将面向内存128MB-4GB终端设备开源,2021年10月以后将面向4GB以上所有设备开源。”

这意味着,明年华为手机将可以全面搭载HarmonyOS。
 

是谁?从中国深圳走向全球;

是谁?保障1500多张网络正常运行;

是谁?服务170多个国家和地区的近30亿人口;

是谁?全面涉足运营商、企业及消费者三大业务体系;

……

是华为。

今天,华为再创里程碑!HarmonyOS 2.0正式亮相华为开发者大会2020(Together)大会,分布式软总线、分布式数据管理、分布式安全等分布式能力的全面升级,同时发布了自适应的UX框架,让开发者能够快速触达千万级新设备和用户。

 

避免明细数据join。ClickHouse更适合大宽表数据聚合查询,对于明细数据join的场景尽量避免出现。

集群硬件升级。软件的优化总是有限的,观察集群的CPU、内存、硬盘情况,集群的日常CPU、内存较高时,及时升级机器。

数据监控报警

完善的监控体系让我们及时得知引擎异常,同时也能时刻观测数据写入查询情况,掌握整个引擎的运行情况。

  • 数据从消费到写入各个阶段异常信息。主要包括java.lang.NullPointerException、java.lang.ArrayIndexOutOfBoundsException等异常信息,大部分是因为数据源有所调整引起;
  • 各个阶段添加报警功能,Kafka添加积压报警、核心算子计算逻辑添加异常报警、ck集群在mdc系统添加硬盘、cpu、内存预警;
  • Grafana查询系统。主要包括CPU、内存、硬盘使用情况;
  • 大SQL监控。查询耗时SQL和没有卡分区和排序字段的查询。

最后

ClickHouse自身有处理万亿数据的能力。在掌握了它的存储、查询、MergeTree原理后,创建符合业务要求的数据库表,执行符合ClickHouse特性的查询SQL,实现1000亿数据的秒级聚合查询并不是难事。

ClickHouse还有很多特性,需要在开发过程中不断地摸索和尝试。

 

进行到这里,完成了建表和数据写入,集群的查询速度一般还是可以的,在集群硬件还不差的情况下满足每次10几亿的数据的聚合查询没有问题,当然前提是是选择了分区和卡排序字段的基础上。

但数据再进一步多到百亿甚至近千亿数据,只是简单的设置分区和优化排序字段是很难做到实时秒级查询了。

查询优化

虽然在查询时卡了分区和排序条件,但随着存储的数据量增多,ClickHouse集群的查询压力会逐渐增加,出现查询速度慢情况。如果有大SQL请求发给了集群,会造成整个集群的CPU和内存升高,直到把整个集群内存打满,集群基本会处于瘫痪状态。对查询进行优化非常重要。

排查耗时SQL。耗时的SQL对整个集群造成很大的压力,要先找到解决耗时SQL的优化方案。当前业务场景下,能很容易发现聚合计算UV(去重)是比较消耗集群资源的。

对于聚合结果的场景,我们多次尝试优化方案后,通过建立物化视图,以空间换取时间,大部分聚合查询速度能提高10几倍。建立物化视图同样要先去了解业务场景,选择分区字段、ORDER BY字段,并选择count、sum、uniq等聚合函数。

物化视图建表语句:


 

(编辑:怀化站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读