快被系统性能逼疯了?你需要这份性能优化策略(3)
解决方法:采用更高效的算法、数据结构替换原来消耗CPU的代码,或者采用新的设计绕过瓶颈代码,比如查找数据的逻辑,可以把List改为Map,以空间换时间;比如用Json报文替换XML报文,提高传输、解析和打印日志的效率。 导致Cpu计算资源高消耗的代码:报文格式转换、加解密、正则表达式、低效的循环、低效的正则表达式。 排查方法:
9、批处理时间长、数据库逐笔插入缓慢 问题现象:大批量数据(10万条以上)更新或插入数据库,耗时较长。 问题原因:批量数据处理时,如果逐条更新数据库,则会存在大量网络io、磁盘io,耗时较长,而且对数据库资源消耗较大。 解决方法:
10、数据库CPU高 问题现象:后台指令发送满负荷工作时,数据库CPU高。 问题原因:后台指令发送线程每次对全量查询结果排序,结果集很大,然后取一条记录;索引区分度不高,满负荷执行时;查询频率很高;压测显示,并行发送指令的后台线程越多,数据库CPU越高,效率越低。 解决方法:
改进后的方案,数据库CPU降到10%一下,发送效率单机提升6倍,且可线性扩展任务服务器。 11、压测TPS曲线剧烈下降或抖动 问题现象:50并发压测,TPS曲线正常应该是平缓的,波动不大,如果突然出现剧烈下降,并且短时间内无法恢复,则可能存在问题。 问题原因:一般是由于前置或bp的jvm进行垃圾回收,或者日志记录磁盘满导致的。 解决方法:如果不是特别剧烈的波动或者TPS曲线下降后长时间不反弹,则可以忽略该问题。否则,需要分析曲线下降的时刻,系统当时正在发生的事情。可以通过top命令监控当时CPU占用比价高的线程,也可以kill -3 pid杀javacore来查看线程堆栈。 六、优化案例 1、网银系统基本情况 1) 压测环境系统架构 压测环境不包括F5,只有1台WEB、1台前置(应用服务器)、1台BP(业务处理服务器)、1台DB、1台Redis服务器。 2)客户请求链路: 客户端压力机-〉Web-〉PRE-〉BP-〉DB2 ; 客户端压力机-〉Web-〉PRE-〉BP-〉挡板服务器(模拟后端服务方)。 3)系统特点:
4)网银登录压测曲线 2、数据库消息队列案例(指令发送队列) 需求是:对于需要异步处理的交易指令,需要设计一个基于数据库的消息队列,我们称之为指令发送队列。该队列既要满足服务器的性能约束,又要满足每日处理交易量的要求。 1)优化前处理过程 后台任务每次从数据库指令表中排序并取最早的一条指令,获取该指令的详细交易信息,组装成报文并调用接口发送后台核心系统。 在压测环境下,该方案如果配置一个后台任务,无法达到系统设计的指令处理速度;如果配置多个后台任务,则会导致数据库CPU占用较高,影响其他联机业务的开展。 2)优化后处理过程 每台后台任务服务器配置一个生产者任务,20个消费者任务。 生产者任务一次取100个(可配置)指令,依次分配给20个消费者任务中空闲的任务,消费者任务获取指令详细信息,并组装报文后发送后台核心系统;生产者任务如果发现无空闲消费者任务,则等待15s后重新判断。 此方案显著降低了数据库CPU负载,合理利用了应用服务器的并发能力,处理效率大为提高,以上线程数和每次获取的指令数可以配置。 指令发送线程池模型图: 3、数据库死锁案例 1)死锁问题现象 (编辑:ASP站长网) |