技术栈线:

1. 支持灵活的处理方式,Elasticsearch是实时全文索引,无需像其它的产品样预先编程才能实现

2. 支持简单的配置方式,Elasticsearch是全部采用JSON接口,Logstash是Ruby DSL设计,都是通用配置语法

3. 支持高效的数据检索,虽然每次查询都是实时计算,但基本上可以实现全天数据查询的秒级响应

4. 支持方便的线性扩展,不管是Elasticsearch集群还是Logstash集群都可以线性扩展

4. 支持绚丽的前端展示,Kibana界面上只需要点击鼠标,就可以完成搜索,聚合,生产绚丽的仪表盘


常规架构:

简单介绍:


说明: Logstash作为一款接收,处理,输出日志的工具,可以处理各种各样的日志,由JRuby编写,支持大量的配套插件,于2013年被Elasticsearch收购,正式成为Elastic Stack的一员.

现包安装:


rpm -qa |grep jdk |xargs rpm -e --nodepsyum -y install gcc cmake coreutils lsof pcre pcre-devel zlib zlib-devel coreutils lrzsz wget python-setuptools epel-releaseyum install java-1.8.0-openjdk  java-1.8.0-openjdk-devel nc jqrpm -ivh https://artifacts.elastic.co/downloads/logstash/logstash-5.0.0.rpm

源码部署:


# 安装 JAVA 运行 环境rpm -qa |grep jdk |xargs rpm -e --nodepsyum -y install gcc cmake coreutils lsof pcre pcre-devel zlib zlib-devel coreutils lrzsz wget python-setuptools epel-releaseyum install java-1.8.0-openjdk  java-1.8.0-openjdk-devel nc jqjava -version# 创建 LOGSTASH目录mkdir -p /xm-workspace/xm-apps/logstash/tar -zxvf logstash-5.0.0.tar.gzmv logstash-5.0.0/* /xm-workspace/xm-apps/logstash/# 创建 配置 文件 目录mkdir -p /xm-workspace/xm-apps/logstash/etc/logstash.d

常用参数:

-n 指定Logstash实例的名称,如果未指定,默认为主机名
-f 指定Logstash配置文件或目录,如果指定目录则合并目录中配置文件
-e 指定Logstash配置数据,以字符串的形式指定,常用于手工测试
-l 指定Logstash日志文件目录,默认安装目录下logs目录
--debug 开启Logstash调试模式
--log.level 指定Logstash日志级别,fatal/error/warn/info/debug/trace
--config.debug 指定Logstash打印配置合并日志,开启前提是打开调试模式--debug以及设置日志级别
-t 测试Logstash配置文件,,必须配合-f使用
-r 设置Logstash自动重载配置文件,必须配合-f使用
--config.reload.interval 设置Logstash重载配置周期,默认为3秒
--http.host 设置LogstashAPI监听地址
--http.port 设置LogstashAPI监听端口
--quiet 设置 Logstash为安静模式

注意: 当-f指定目录时,Logstash会自动读取目录下所有*.conf配置文件,按照字母排序,然后在内存中拼接成一个完整的大配置文件加载,推荐采用数字编号方式命名配置文件,且同时在配置中严谨使用if判断限定不同日志的动作,还有就是从5.0开始所有的命令行配置都可通过/xm-workspace/xm-apps/logstash/config/logstash.yml文件设置.

快速测试:


/xm-workspace/xm-apps/logstash/bin/logstash -e 'input{stdin{}}output{stdout{codec=>rubydebug}}' --debug
{    "@timestamp" => 2016-12-06T08:37:52.922Z,      "@version" => "1",          "host" => "YunChanPinXian",       "message" => "limanman"}

说明: 数据以事件对象的形式在线程之间传递,Logstash会自动为事件对象添加一些额外信息,最重要的就是@timestamp,用来标记事件的发生时间,此字段以joda时间对象的形式内部流转,而且还支持在过滤插件中通过add_tag/remove_tag/add_field/remove_field对事件对象添加删除标签数组和自定义字段.

配置语法:

1. Logstash设计了自己的DSL(类似Puppet的DSL)来描述配置,使用{}定义区域,区域内可以包含多个插件区域,插件域内可以定义对应区域的键值对设置

2. Logstash支持少量的数据类型如bool类型(debug => true),string类型(host => "hostname"),number类型(port => 514),array类型(match => ["datetime", "UNIX", "ISO8601"]),hash类型(options => {key1 => "value1",key2 => "value2"})

3. Logstash支持字段引用,由于字段可以是hash或array类型,所以可通过[field]来还原字段对象,而且还支持正倒序下标检索子元素,如果要在字符串中使用字段引用可通过%{[field][...]}实现

4. Logstash支持==等于/!=不等于/<小于/>大于/<=小于等于/>=大于等于/=~匹配/!~不匹配/in包含/not in不包含/and与/or或/nand非与/xor非或/()复合表达式/!()取反复合表达式


if "_grokparsefailure" not in [tags] {} else if [status] !~ /^2\d\d/ or ( [url] == "/noc.gif" nand [geoip][city] != "beijing" ) {} else {}

后台运行:


#!/bin/sh# -*- coding: utf-8 -*-### Authors: limanman# OsChina: http://xmdevops.blog.51cto.com/# Purpose: control logstash start|stop|force-stop|status|restart ### customer envname=logstashpidfile="/var/run/${name}.pid"LS_HOME=/xm-workspace/xm-apps/logstashexport PATH=/sbin:/usr/sbin:/bin:/usr/bin:${LS_HOME}/bin# must use root if [ `id -u` -ne 0 ]; then   echo "You need root privileges to run this script"   exit 1fi# optimizationsLS_HEAP_SIZE="1024m"LS_OPEN_FILES=102400# logstash comm# LS_OPTS="--debug"LS_OPTS="--quiet"LS_LOG_DIR=${LS_HOME}/logsLS_CONF_DIR="${LS_HOME}/etc/logstash.d"[ ! -d ${LS_HOME} ] && mkdir -p ${LS_HOME}[ ! -d ${LS_LOG_DIR} ] && mkdir -p ${LS_LOG_DIR}[ ! -d ${LS_CONF_DIR} ] && mkdir -p ${LS_CONF_DIR}program=${LS_HOME}/bin/${name}args="-f ${LS_CONF_DIR} -l ${LS_LOG_DIR} ${LS_OPTS}"start() {  LS_JAVA_OPTS="${LS_JAVA_OPTS} -Djava.io.tmpdir=${LS_HOME}"  HOME=${LS_HOME}  export PATH HOME LS_HEAP_SIZE LS_JAVA_OPTS LS_USE_GC_LOGGING  ulimit -n ${LS_OPEN_FILES}  # Run the program!  bash -c "    cd $LS_HOME    ulimit -n ${LS_OPEN_FILES}    exec \"$program\" $args  " 2> "${LS_LOG_DIR}/${name}-error.log" &>/dev/null &  echo $! > $pidfile  echo "${name} started."  return 0}stop() {  if status ; then    pid=`cat "$pidfile"`    echo "Killing ${name} (pid $pid) with SIGTERM"    kill -TERM $pid    for i in 1 2 3 4 5 ; do      echo "Waiting ${name} (pid $pid) to die..."      status || break      sleep 1    done    if status ; then      echo "${name} stop failed; still running."    else      echo "${name} stopped."    fi  fi}status() {  if [ -f "$pidfile" ] ; then    pid=`cat "$pidfile"`    if kill -0 $pid > /dev/null 2> /dev/null ; then      return 0    else      return 2    fi  else    return 3  fi}force_stop() {  if status ; then    stop    status && kill -KILL `cat "$pidfile"`  fi}case "$1" in  start)    status    code=$?    if [ $code -eq 0 ]; then      echo "${name} is already running"    else      start      code=$?    fi    exit $code    ;;  stop) stop ;;  force-stop) force_stop ;;  status)     status    code=$?    if [ $code -eq 0 ] ; then      echo "${name} is running"    else      echo "${name} is not running"    fi    exit $code    ;;  restart)         stop && start     ;;  *)    echo "Usage: ${SCRIPTNAME} {start|stop|force-stop|status|restart}" >&2    exit 3  ;;esacexit $?

注意: 为了使Logstash后台运行,不管是nohub ... &还是screen还是supervisord管理进程时千万不要把配置目录中的配置文件中的input {}区段设置为测试用的stdin {},否则进程运行一会儿就会自动退出.