nginx基础学习(一):linux环境下nginx的安装和配置文件的初步认识


nginx 目前在市场上使用是非常广泛的,作为一个开发人员,可以不会 nginx 的高级使用,但是基本的使用场景以及日常问题排查技能还是要有的。nginx 使用的方向主要有三个,分别是路由功能、负载均衡功能以及静态资源服务功能。路由功能主要是用来将不同请求分发到不用的服务上,负载均衡是将请求分发到一个服务的集群中的不同虚拟机上,这两种有一点类似,但是存在本质的区别。再就是静态资源服务功能,以前的开发和现在的小公司服务,习惯将静态资源直接放在项目下,但是随着公司产品量和服务量的增多,静态资源自然也会增长,如果继续放在项目下,就会增加项目的压力。所以单独出来建立对应的静态资源服务器也是很常见的,这个时候就需要将静态资源的请求路由到对应静态资源服务器上。

1. nginx 的三种使用场景

1.1 路由服务功能

对外提供服务不会直接将机器暴露给外界提供访问(安全问题),往往是提供统一的路由机器,由路由机器来将请求分发到内部提供真实服务的服务器上,处理请求后再通过路由机器响应给请求方。内部服务器很多,具体需要路由到那一台机器,这是就可以用到 nginx 的路由服务功能。实现思路如下:

1.2 负载均衡功能

负载均衡,一个服务集群部署,由多个机器组成,为了不让一台机器的压力过大而造成崩溃发现,就需要将所有的请求均衡的分配到每一台机器中,既能提高响应的速度也能降低单台机器的压力。nginx 可以通过配置多台机器的负载实现。实现思路如下:

1.3 静态资源服务功能

这个其实和路由服务基本相同,只不过是将业务服务的路由改成静态资源服务的路由,另外加上一些静态资源的一些优化策略,让静态资源的响应速度更快,更有效(如静态资源的压缩,降低传输数据的量,提高传输速度)。实现思路可以参照路由服务功能。

2. linux 环境下安装 nginx

2.1 安装方式一

这种方式是推荐的,等说完第二种方式再做一个对比。安装步骤如下:

  • /usr/local/目录下使用 wget 下载 nginx 资源包

    wget http://nginx.org/download/nginx-1.9.0.tar.gz
  • 将下载的资源包使用 tar 命令解压,并进入到解压后的目录中

    tar -zxvf nginx-1.9.0.tar.gz
    cd nginx-1.9.0
  • 配置 nginx 的安装目录,检查环境

    ./configure --prefix=/usr/local/nginx --with-http_stub_status_module --with-http_ssl_module

    如果上面的 shell 脚本执行后没有执行成功,是因为缺少相关的依赖工具,需要提前安装依赖后再重新执行上面的命令,安装依赖命令如下:

    yum -y install pcre pcre-devel    
    yum -y install zlib zlib-devel
    yum install -y openssl openssl-devel
  • 编译&&安装 nginx

    make && make install
  • 使用 whereis 命令去看看 nginx 的安装目录

    whereis nginx

    查询的结果:

    nginx: /usr/local/nginx

    这里看到 nginx 就是安装在上面 configure 配置的路径下面,在说第二种安装方式的时候会进行一个比较。

2.2 安装方式二

这种安装方式很简单,很省事。执行下面的命令即可。

yum -y install nginx

如果上面的命令执行报错,说明需要安装 yum 的 epel-release 扩展源。命令也很简单。如下:

yum -y install epel-release

到这里就安装结束了,看着比第一种方式要简单的很多,但是存在一个问题。执行一下whereis nginx命令,得到的输出结果如下:

nginx: /usr/sbin/nginx /etc/nginx /usr/lib64/nginx /usr/share/nginx /usr/share/man/man3/nginx.3pm.gz /usr/share/man/man8/nginx.8.gz

安装后的 nginx 被放到了不同的位置,分散开的,这个为后期的配置文件修改,日志查看提供了很大的不便,没有第一种方式好,统一放在一个指定的目录下。

3. nginx 中的常用命令

3.1 nginx 命令

启动命令:

/usr/local/nginx/sbin/nginx

重启命令:

/usr/local/nginx/sbin/nginx -s reload

停止命令:

/usr/local/nginx/sbin/nginx -s stop

检查配置文件是否正确(一般用于修改配置文件后重启之前,做配置文件正确性检查):

/usr/local/nginx/sbin/nginx -t

指定配置文件位置启动或重启:

/usr/local/nginx/sbin/nginx/ -c /usr/local/nginx.conf
或
/usr/local/nginx/sbin/nginx/ -c /usr/local/nginx.conf -s reload

3.2 简化 nginx 指令

简化 nginx 指令的方法就是通过创建软连接。

  1. cd进入到/usr/bin/目录;
  2. 创建链接ln -s /usr/local/nginx/sbin/nginx nginx

软连接创建完成,在 3.1 中的命令就可以被简化。如下:

# 原命令
/usr/local/nginx/sbin/nginx/ -c /usr/local/nginx.conf
# 简化后命令
nginx -c /usr/local/nginx.conf

3.3 nginx 控制信号

nginx 启动后,对应的 pid 是存在 nginx 目录下的nginx.pid文件中。可以通过cat命令读取文件获取 pid。也可以通过ps -ef | grep nginx命令来获取 pid。

主进程可处理信号:

  • TERMINT:表示快速关闭
  • QUIT:从容的关闭
  • HUP:重载配置,用新的配置开始新的工作进程,从容关闭旧的工作进程
  • USR1:重新打开日志文件
  • USR2:平滑升级可执行程序
  • WINCH:从容关闭工作进程

发送控制信号的方式:

kill -TERM pid
#或者(/usr/local/nginx/是nginx的安装目录)
kill -TERM cat /usr/local/nginx/nginx.pid

4. nginx 配置文件的初认识

4.1 nginx 配置文件整体布局

nginx 配置文件中主要分三个模块,分别是主全局配置、工作模型及连接上限配置、http 服务相关属性。

  • 全局配置:里面包含的信息由当前用户信息、工作进程数(worker_processes 数量默认是机器的核心数,可以手动设置,一般推荐设置为核心数的两倍)、全局日志以及日志的级别设置、nginx 进程的 pid 信息等。
  • 工作模型和连接上限:工作模型默认是 epoll,连接上限(worker_connections)默认是 1024。
  • http 服务相关属性:其中包含 http 服务的全局设置,以及对应 Server 配置。每个 Server 路由到不同服务,可以使用 upStream 配置负载均衡,以及根据 Location 配置 URL 匹配的位置等。

4.2 nginx 配置参数说明

  • worker_processes:工作进程数,默认是当前机器的核心数。
  • pid:当前 nginx 的进程编号,默认存储在 logs/nginx.pid 文件中。
  • worker_connections:连接上限,默认设值是 1024。
  • max_clients:最大客户端连接数,这个是不会手动的设置,而是通过 worker_processes 和 worker_connections 相乘计算得到,如果是反向代理,需要除以 4。
  • log_format:日志格式,可以定义多个,然后在定义具体日志的时候采用不同的格式。(根据指定格式生成日志,可以给大数据分析提供数据源)
  • keepalive_timeout:连接超时时间,表示浏览器发送请求,nginx 转发到对应的服务器并等待服务器响应,如果超过这个连接时间,就不会再继续等待。
  • listen:表示监听的端口,此配置是放在 http 的 server 下。(http 请求一般监听都是 80 端口,而 https 请求监听的是 443 端口)
  • server_name:监听的服务名称,如上面图中提到的www.itcrud.comorder.itcrud.com等。
  • location:指定 URL 匹配特定服务的位置和相关配置信息。
  • error_page:指定对应的响应码,当服务出现对应的错误时,给出相应的错误页面信息展示。

4.3 常用全局变量

这里的日志和应用的日志是类似的,使用不同的占位符来表示不同的信息,然后打印日志的时候,使用全局变量进行填充,形成一条具体的日志信息。当然这些全局变量不仅仅可以用于日志输出的方式,还可以用于一些请求参数的设值等。

  • $remote_addr:客户端的 IP 地址(代理服务器,显示代理服务器 IP)
  • $remote_user:用于记录远程客户端的用户名称(一般是“-”)
  • $time_local:用于记录访问时间和时区
  • $request:响应状态码
  • $body_bytes_send:给客户端发送的文件主体内容字节数
  • $http_user_agent:用户使用的代理(一般为浏览器)
  • $http_x_forwarded_for:可以记录客户端 IP,通过代理服务器来记录客户端的 IP 地址
  • $http_referer:可以记录用户是从哪个连接访问过来的
  • $args:请求行中的参数
  • $content_length:请求头中 Content-length 字段
  • $content_type:请求头中的 Content-type 字段
  • $document_root:当前请求的 root 指令中指定的值
  • $remote_port:客户端端口
  • $request_filename:当前请求的文件路径,由 root 或者 alias 指令与 URI 请求生成
  • $limit_rate:这个变量可以限制连接速率
  • $host:请求主机头字段,否则为服务器名称
  • $http_cookie:客户端 cookie 信息
  • $http_user_agent:客户端 agent 信息
  • $scheme:HTTP 方法(如:http,https)
  • $uri:不带请求参数的当前 URI,不包含主机名,和$document_uri相同
  • $request_uri:包含请求参数的原始 URI,不包含主机名
  • $server_protocol:请求使用的协议,通常是 HTTP/1.0 或 HTTP/1.1
  • $server_addr:服务器机制,在完成一次调用后可以确定此值
  • $server_name:服务器名称
  • $server_port:请求到达服务器的端口号

文章作者: 程序猿洞晓
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 程序猿洞晓 !
评论
 上一篇
项目中手机、姓名、身份证信息等在日志和响应数据中脱敏操作 项目中手机、姓名、身份证信息等在日志和响应数据中脱敏操作
项目日志打印请求的入参和出参,用来跟踪数据信息,方便根据日志信息排查问题,在涉及到用户敏感信息的时候,为了安全的考虑,不能直接将这些信息直接输出到日志文件中,需要做脱敏操作。如果这个脱敏操作放在项目的业务代码中,只要出现需要脱敏的信息就进行一次脱敏操作,这样会有很多脱敏的代码冗余;如果将脱敏的逻辑代码提出来,在需要脱敏的位置……
2018-12-12
下一篇 
ThreadLocal遇到线程池出现数据问题和解决方案 ThreadLocal遇到线程池出现数据问题和解决方案
ThreadLocal开发中常用,通过ThreadLocal操作数据实现线程之间的隔离,保证线程之间不会因为操作同一数据导致数据安全问题。但是这种隔离是有适用范围的,也就是说在某些特定的情况下还是会出现数据安全问题的。这种特定情况下就是使用到线程池,并且在ThreadLocal使用前后没有做数据清理,就会导致安全问题,下面来看看出现的情况和具体……
2018-12-02
  目录