日常中遇到elk中性能问题
日常中遇到elk中性能问题
1.遇到过logstash写es提示429写尝试拒绝
- 1.后台es写压力大可以提升es thread_pool.write.queue_size/size大写(缓解)
- 2.es存储使用ssd,建议冷热分离,扩增数据存储节点(治本)
2.新增索引提示403(indice ready only)
- 1.临时关闭写保护,清理历史索引释放空间
- 2.调整es磁盘写保护阀值
- cluster.routing.allocation.disk.watermark.low,默认85%,用于控制磁盘的最小使用率;
- cluster.routing.allocation.disk.watermark.high,默认90%,用于控制磁盘的最大使用率;
- cluster.routing.allocation.disk.watermark.flood_stage,默认95%超过此值时,Elasticsearch变成只读模式,无法写入数据
3.logstash解析压力过大导致机器负载飙升,日志存在很大时延
- 1.kafka日志扩大分区,扩充logstash服务
- 2.改用gohangout解析,显著降低cpu/loadavg
4.提高可用性、增加redis/kafka作为日志缓冲组件
5.elasticsearch查询缓慢
- 合理设置分片,冷热区分,jvm堆内存预留50%,设置合理查询条件(防止全文查询)
6.kibana查询崩溃
- 设置nodejs内存(–max-old-space-size=4096)