8个流行的Python可视化工具包

发布时间：2021-02-12 19:19:26 所属栏目：传媒来源：互联网

导读：常务董事、华为消费者业务CEO余承东在演讲中表示， HarmonyOS将正式开源，开发者将获得模拟器、SDK包以及IDE工具，2020年底首先对国内开发者发布针对智能手机的HarmonyOS beta版本。华为将代码捐赠给中国开放原子开源基金会，并宣布了HarmonyOS的开源路标：

常务董事、华为消费者业务CEO余承东在演讲中表示， HarmonyOS将正式开源，开发者将获得模拟器、SDK包以及IDE工具，2020年底首先对国内开发者发布针对智能手机的HarmonyOS beta版本。华为将代码捐赠给中国开放原子开源基金会，并宣布了HarmonyOS的开源路标：“从9月10日起，HarmonyOS将面向大屏、手表、车机等128KB-128MB终端设备开源，2021年4月将面向内存128MB-4GB终端设备开源，2021年10月以后将面向4GB以上所有设备开源。”

这意味着，明年华为手机将可以全面搭载HarmonyOS。

是谁？从中国深圳走向全球；

是谁？保障1500多张网络正常运行；

是谁？服务170多个国家和地区的近30亿人口；

是谁？全面涉足运营商、企业及消费者三大业务体系；

……

是华为。

今天，华为再创里程碑！HarmonyOS 2.0正式亮相华为开发者大会2020（Together）大会，分布式软总线、分布式数据管理、分布式安全等分布式能力的全面升级，同时发布了自适应的UX框架，让开发者能够快速触达千万级新设备和用户。

避免明细数据join。ClickHouse更适合大宽表数据聚合查询，对于明细数据join的场景尽量避免出现。

集群硬件升级。软件的优化总是有限的，观察集群的CPU、内存、硬盘情况，集群的日常CPU、内存较高时，及时升级机器。

数据监控报警

完善的监控体系让我们及时得知引擎异常，同时也能时刻观测数据写入查询情况，掌握整个引擎的运行情况。

数据从消费到写入各个阶段异常信息。主要包括java.lang.NullPointerException、java.lang.ArrayIndexOutOfBoundsException等异常信息，大部分是因为数据源有所调整引起;
各个阶段添加报警功能，Kafka添加积压报警、核心算子计算逻辑添加异常报警、ck集群在mdc系统添加硬盘、cpu、内存预警;
Grafana查询系统。主要包括CPU、内存、硬盘使用情况;
大SQL监控。查询耗时SQL和没有卡分区和排序字段的查询。

最后

ClickHouse自身有处理万亿数据的能力。在掌握了它的存储、查询、MergeTree原理后，创建符合业务要求的数据库表，执行符合ClickHouse特性的查询SQL，实现1000亿数据的秒级聚合查询并不是难事。

ClickHouse还有很多特性，需要在开发过程中不断地摸索和尝试。

进行到这里，完成了建表和数据写入，集群的查询速度一般还是可以的，在集群硬件还不差的情况下满足每次10几亿的数据的聚合查询没有问题，当然前提是是选择了分区和卡排序字段的基础上。

但数据再进一步多到百亿甚至近千亿数据，只是简单的设置分区和优化排序字段是很难做到实时秒级查询了。

查询优化

虽然在查询时卡了分区和排序条件，但随着存储的数据量增多，ClickHouse集群的查询压力会逐渐增加，出现查询速度慢情况。如果有大SQL请求发给了集群，会造成整个集群的CPU和内存升高，直到把整个集群内存打满，集群基本会处于瘫痪状态。对查询进行优化非常重要。

排查耗时SQL。耗时的SQL对整个集群造成很大的压力，要先找到解决耗时SQL的优化方案。当前业务场景下，能很容易发现聚合计算UV(去重)是比较消耗集群资源的。

对于聚合结果的场景，我们多次尝试优化方案后，通过建立物化视图，以空间换取时间，大部分聚合查询速度能提高10几倍。建立物化视图同样要先去了解业务场景，选择分区字段、ORDER BY字段，并选择count、sum、uniq等聚合函数。

物化视图建表语句：

（编辑：怀化站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!