目录
一. Ansible 的相关知识
1.1 Ansible 工具的简介
Ansible 是一个基于 Python 开发的配置管理和应用部署工具,现在也在自动化管理领域大放异彩。它融合了众多老牌运维工具的优点,Pubbet 和 Saltstack 能实现的功能,Ansible 基本上都可以实现。
Ansible 能批量配置、部署、管理上千台主机。比如以前需要切换到每个主机上执行的一或多个操作,使用 Ansible 只需在固定的一台 Ansible 控制节点上去完成所有主机的操作。
Ansible 在管理节点将 Ansible 模块通过 ssh 协议 推送到被管理机端执行,执行完自动删除
1.2 Ansible的四大组件
- Inventory 主机清单(主机组)
- Modules 模块
- Plugins 插件
- Playbooks 剧本(相当于脚本)
Ansible 是基于模块工作的,它只是提供了一种运行框架,它本身没有完成任务的能力,真正执行操作的是 Ansible 的模块, 比如 copy 模块用于拷贝文件到远程主机上,service 模块用于管理服务的启动、停止、重启等。
Ansible 其中一个比较鲜明的特性是 Agentless,即无 Agent 的存在,它就像普通命令一样,并非C/S软件,也只需在某个作为控制节点的主机上安装一次 Ansible 即可,通常它基于 ssh 连接来控制远程主机,远程主机上不需要安装 Ansible 或其它额外的服务。
使用者在使用时,在服务器终端输入命令或者 playbooks,会通过预定好的规则将 playbook 拆解为play,再组织成 Ansible 可以识别的任务,调用模块和插件,根据主机清单通过 SSH 将临时文件发给远程的客户端执行并返回结果,执行结束后自动删除
Ansible 的另一个比较鲜明的特性是它的绝大多数模块都具备幂等性(idempotence)。所谓幂等性,指的是多次操作或多次执行对系统资源的影响是一致的。比如执行 systemctl stop xxx 命令来停止服务,当发现要停止的目标服务已经处于停止状态, 它什么也不会做,所以多次停止的结果仍然是停止,不会改变结果,它是幂等的,而 systemctl restart xxx 是非幂等的。
当使用Ansible来集中管理一组客户机时,首要步骤是通过主机清单文件来组织和识别目标机器。在这个清单文件中,管理员会按照组名来划分和定义各组客户机,通常会列出每组对应的IP地址或主机名。这样,在调用某个组名时,Ansible就会知道需要对哪些特定的客户机执行管理任务。
在批量操控这些客户机时,Ansible提供了两种策略来组织和执行任务:
Playbooks(剧本式管理):这是一种采用YAML格式编写的文件,它能够以清晰的层次结构描述多个任务。在Playbook中,你可以指定一组主机(通过之前定义的组名引用),然后为这些主机安排一系列模块调用,每个模块代表一个具体的操作,比如安装软件、配置服务或修改文件内容等。Ansible内建了一套丰富的核心模块来满足大部分基础运维需求。
自定义模块:对于那些Ansible内置模块不能直接处理的复杂或者特定功能,可以自行编写自定义模块。这些模块可以用Python、Perl、Shell或其他支持的语言编写,目的是为了扩展Ansible的能力,使之能应对更多样化的自动化运维场景。
执行过程中,Ansible会通过相应的连接插件(如SSH或WinRM)与远程主机建立通信,发送要执行的命令或调用的模块给目标客户机执行。为了便于管理和审计,Ansible还支持通过插件记录操作日志,甚至可以配置邮件插件,将执行结果自动发送至指定邮箱,以便及时了解任务执行的状态和详情。
Ansible 的很多模块在执行时都会先判断目标节点是否要执行任务,所以,可以放心大胆地让Ansible 去执行任务,重复执行某个任务绝大多数时候不会产生任何副作用。
1.3 运维自动化工具
1.4 Ansible 和其它自动化运维工具对比
Ansible 是一个能实现批量部署的自动化运维工具,基于python开发,能实现批量系统配置,批量部署程序,批量运行命令。Ansible主要是提供一种批量部署的框架,系统由控制主机和被管理主机组成。
项目 |
SaltStack |
Ansible |
BatchShell |
开发语言 |
Python |
Python |
Java |
是否有客户端 |
有 |
无(非c/s架构) |
有 |
是否支持二次开发 |
支持 |
支持 |
支持 |
服务器与远程机器是否相互验证 |
是 |
是 |
是 |
服务器与远程机器的通信是否加密 |
是,使用AES加密 |
是,使用OpenSSH |
是,使用OpenSSH、FTPS等多种加密协议 |
平台支持 |
BSD, Linux , Mac OS X,Solaris,Windows |
AIX , BSD , HP-UX , Linux,Mac OS X ,Solaris |
AIX , BSD , HP-UX , Linux,Mac OS X, Solaris |
是否提供Web UI |
提供 |
商业版本提供 |
提供 |
配置文件格式 |
YAML |
YAML |
原生Shell |
命令行执行 |
支持 |
支持 |
支持 |
是否有客户端 |
有 |
无 |
有 |
是否支持二次开发 |
支持 |
支持 |
支持 |
可视化文本编辑、查询、替换 |
无 |
无 |
支持 |
1.5 Ansible 的优缺点
优点
- 部署较为简单, 只需要在控制主机上部署 Ansible 环境,被控制端上只要求安装 ssh 和 python 2.5以上版本,对于运维人员使用门槛低。
- 被管控节点无需安装 Agent
- 无服务端,使用是直接调用控制端命令或者脚本。
- 基于模块工作, 可以使用任意语言开发模块
- 基于 yaml 语法编写 playbook
- 定义的任务已存在则不会做任何事情,意味着在同一台服务器上多次执行同一个 playbook 是安全的
缺点
- 学习成本:需要学习 Ansible 自定义的脚本语法规则。
- 安装成本:控制主机需是一台非 Windows 远程主机,也就是说至少要有1台远程 Server。
- 易用性:因为必须有远程主控机,若本地有文件需同步,则需先将文件传输到对应的主控机,才能够做分发同步。
二. Ansible 环境安装部署
服务器种类 | 服务器IP | 工具 |
管理端 | 192.168.44.70 | Ansible |
被管理端 | 192.168.44.60 | 无 |
被管理端 | 192.168.44.50 | 无 |
2.1 管理端安装 ansible
yum install -y epel-release //先安装 epel 源
yum install -y ansible
2.2 配置主机清单
cd /etc/ansible
vim hosts
[webservers] #配置组名
192.168.44.60 #组里包含的被管理的主机IP地址或主机名(主机名需要先修改/etc/hosts文件)
[dbservers]
192.168.44.50
ansible 默认使用ssh连接,所以管理前要设置免密登录
#配置密钥对验证
ssh-keygen -t rsa #一路回车,生成密钥文件
vim /etc/ssh/ssh_config #修改ssh服务端和ssh客户端配置文件
StrictHostKeyChecking no #35行,取消注释,将ask修改为no,开启免交互
systemctl restart sshd #重启sshd
配置密钥对验证
ssh-keygen -t rsa #一路回车,使用免密登录
sshpass -p '123' ssh-copy-id root@192.168.44.60
sshpass -p '123' ssh-copy-id root@192.168.44.50
输出内容解释:
三. ansible 命令行模块
格式:
命令格式:ansible <组名> -m <模块> -a <参数列表>
查看ansible的所有模块:
ansible-doc -l
#列出所有已安装的模块,按q退出
3.1 command 模块
在远程主机执行命令,不支持管道,重定向等shell的特性。
ansible-doc -s command
#-s 列出指定模块的描述信息和操作动作
ansible 192.168.44.60 -m command -a 'date' #指定 ip 执行 date
ansible webservers -m command -a 'date' #指定组执行 date
ansible dbservers -m command -a 'date'
ansible all -m command -a 'date' #all 代表所有 hosts 主机
ansible all -a 'ls /' #如省略 -m 模块,则默认运行 command 模块
常用的参数:
chdir:在远程主机上运行命令前提前进入目录
creates:判断指定文件是否存在,如果存在,不执行后面的操作
removes:判断指定文件是否存在,如果存在,执行后面的操作
3.2 shell 模块
在远程主机执行命令,相当于调用远程主机的 shell 进程,然后在该 shell 下打开一个子 shell 运行命令(支持管道符号等功能)
ansible-doc -s shell
ansible dbservers -m shell -a 'echo 123456 | passwd --stdin agag'
登录测试一下:
ansible dbservers -m shell -a 'echo $(ifconfig ens33 | awk "NR==2 {print $2}") | cut -d " " -f2'
#以空格为分隔符 打印第二列
ansible dbservers -m shell -a 'echo $(ifconfig ens33 | awk "NR==2 {print \$2}")'
3.3 cron 模块
在远程主机定义任务计划。其中有两种状态(state):present 表示添加(可以省略),absent 表示移除。
ansible-doc -s cron #按 q 退出
//常用的参数:
minute/hour/day/month/weekday:分/时/日/月/周
job:任务计划要执行的命令
name:任务计划的名称
ansible webservers -m cron -a 'minute="*/1" job="/usr/bin/echo nihao xyl" name="test crontab"'
ansible webservers -a 'crontab -l'
ansible webservers -m cron -a 'name="test crontab" state=absent'
#移除计划任务,假如该计划任务没有取名字,name=None即可
3.4 user 模块
//用户管理的模块
ansible-doc -s user
//常用的参数:
name:用户名,必选参数
state=present|absent:创建账号或者删除账号,present表示创建,absent表示删除
system=yes|no:是否为系统账号
uid:用户uid
group:用户基本组
shell:默认使用的shell
move_home=yse|no:如果设置的家目录已经存在,是否将已经存在的家目录进行移动
password:用户的密码,建议使用加密后的字符串
comment:用户的注释信息
remove=yes|no:当state=absent时,是否删除用户的家目录
ansible dbservers -m user -a 'name="test01"' #创建用户test01
ansible dbservers -m user -a 'name="test01" state=absent' #删除用户test01
#查看
ansible dbservers -m command -a 'tail /etc/passwd'
但是家目录并没有被删除
要想这个一起被删除,需要加上 remove=yes
3.5 group 模块
//用户组管理的模块
ansible-doc -s group
ansible dbservers -m group -a 'name=test02 gid=520 system=yes' #创建test组
ansible dbservers -a 'tail /etc/group'
ansible dbservers -m user -a 'name=test03 uid=1314 system=yes group=test02'
#将test03用户添加到test02组中
ansible dbservers -a 'tail /etc/passwd'
ansible dbservers -a 'id test03'
3.6 copy 模块
//用于复制指定主机文件到远程主机的
ansible-doc -s copy
//常用的参数:
dest:指出复制文件的目标及位置,使用绝对路径,如果源是目录,指目标也要是目录,
如果目标文件已经存在会覆盖原有的内容
src:指出源文件的路径,可以使用相对路径或绝对路径,支持直接指定目录,如果源是目录则目标也要是目录
mode:指出复制时,目标文件的权限
owner:指出复制时,目标文件的属主
group:指出复制时,目标文件的属组
content:指出复制到目标主机上的内容,不能与src一起使用
ansible dbservers -m copy -a 'src=/etc/fstab dest=/opt/fstab.bak owner=root mode=777'
ansible dbservers -a 'ls -l /opt'
ansible dbservers -a 'cat /opt/fstab.bak'
ansible dbservers -m copy -a 'content="hi yz" dest=/opt/hi.txt'
#将hi yz写入/opt/hi.txt文件中
ansible dbservers -a 'cat /opt/hi.txt'
3.7 file 模块
//设置文件属性
ansible dbservers -m file -a 'owner=xyl group=xyl mode=644 path=/opt/fstab.bak'
#修改文件的属主属组权限等
ansible dbservers -m file -a 'path=/opt/fstab.link src=/opt/fstab.bak state=link'
#设置/opt/fstab.link为/opt/fstab.bak的链接文件
ansible dbservers -m file -a "path=/opt/abc.txt state=touch"
#创建一个文件
ansible dbservers -m file -a "path=/opt/abc.txt state=absent"
#删除一个文件
3.8 hostname 模块
//用于管理远程主机上的主机名
ansible dbservers -m hostname -a "name=dbservers-user"
3.9 ping 模块
//检测远程主机的连通性
ansible all -m ping
3.10 yum 模块
ansible-doc -s yum
ansible webservers -m yum -a 'name=httpd' #安装服务
在该命令任务中添加warn: false
或在ansible.cfg
配置文件中设置command_warnings=False
来禁用此警告。
ansible dbservers -m yum -a 'name=httpd state=absent' #卸载服务
3.11 service/systemd 模块
//用于管理远程主机上的管理服务的运行状态
ansible-doc -s service
//常用的参数:
name:被管理的服务名称
state=started|stopped|restarted:动作包含启动关闭或者重启
enabled=yes|no:表示是否设置该服务开机自启
runlevel:如果设定了enabled开机自启去,则要定义在哪些运行目标下自启动
ansible webservers -a 'systemctl status httpd'
#查看web服务器httpd运行状态
ansible webservers -m service -a 'enabled=true name=httpd state=started'
#启动httpd服务 并设置开机自启 管理服务名称叫 httpd
3.12 script 模块
//实现远程批量运行本地的 shell 脚本
ansible-doc -s script
vim test.sh
#!/bin/bash
echo "this is a test script" >/opt/script.txt
chmod +x test.sh
ansible webservers -m script -a 'test.sh'
ansible webservers -a 'cat /opt/script.txt'
3.13 setup 模块
//facts 组件是用来收集被管理节点信息的,使用 setup 模块可以获取这些信息
ansible-doc -s setup
ansible webservers -m setup
#获取webservers组主机的facts信息
ansible webservers -m setup -a 'filter=*ipv4'
#使用filter可以筛选指定的facts信息
总结:
ansible 命令格式
ansible <组名> -m<模块> -a<参数列表>
- ansible-doc -l 列出所有已安装的模块 按q退出
- ansible-doc -s 模块名 指导模块使用方法
操作模块
- command
- shell
- cron
- user
- group
- copy
- file
- hostname
- ping
- yum
- service/systemd
- script
- setup
command 模块:
注意:在远程主机执行命令,不支持管道,重定向等shell的特性。
ansible 指定的IP -m command -a 'Linux基础命令' #指定 ip 执行 基础命令
ansible 组名 -m command -a 'Linux基础命令' #指定组执行基础命令
ansible all -m command -a 'linux基础命令' #指定所有被管理的主机执行该命令
ansible all -a 'linux基础命令' #如省略 -m 模块,则默认运行 command 模块
//常用的参数:
chdir:在远程主机上运行命令前提前进入目录
creates:判断指定文件是否存在,如果存在,不执行后面的操作
removes:判断指定文件是否存在,如果存在,执行后面的操作
shell 模块 :
在远程主机执行命令,相当于调用远程主机的shell进程,然后在该shell下打开一个子shell运行命令(支持管道符号等功能)
ansible-doc -s shell
ansible dbservers -m shell -a ''
-a 中可以使用shell常用的一些命令,注意:像awk这种本身使用 '' 来执行后续命令的命令时
单引号需要变为双引号,如果涉及变量,则“$”前需要加转义字符“\”
cron 模块:
//在远程主机定义任务计划。其中有两种状态(state):present表示添加(可以省略),absent表示移除。
ansible-doc -s cron #按 q 退出
//常用的参数:
minute/hour/day/month/weekday:分/时/日/月/周
job:任务计划要执行的命令
name:任务计划的名称
#设定计划性任务
ansible xxxx组 -m cron -a '时间规则 " job="绝对路径执行的命令" name="计划性任务的名称"'
#查看xxx组中的计划性任务
ansible webservers -a 'crontab -l'
#删除xxxx组的计划性任务
ansible xxx -m cron -a 'name="任务名称 crontab" state=absent' #移除计划任务,假如该计划任务没有取名字,name=None即可
user 模块:
//用户管理的模块
ansible-doc -s user
//常用的参数:
name:用户名,必选参数
state=present|absent:创建账号或者删除账号,present表示创建,absent表示删除
system=yes|no:是否为系统账号
uid:用户uid
group:用户基本组
shell:默认使用的shell
move_home=yse|no:如果设置的家目录已经存在,是否将已经存在的家目录进行移动
password:用户的密码,建议使用加密后的字符串
comment:用户的注释信息
remove=yes|no:当state=absent时,是否删除用户的家目录
group模块:
//用户组管理的模块
ansible-doc -s group
#创建xxxx组中所有的xxx用户组
ansible dbservers -m group -a 'name=xxx gid=xxx system=yes'
#查看用户组的信息
ansible dbservers -a 'tail /etc/group'
#将用户添加到用户组
ansible dbservers -m user -a 'name=xxxx uid=xx system=yes group=xxx' #将test01用户添加到xxxzu
#查看用户信息
ansible dbservers -a 'tail /etc/passwd'
#查看用户的相关组的信息
ansible dbservers -a 'id 用户名'
copy模块:
//用于复制指定主机文件到远程主机的
ansible-doc -s copy
//常用的参数:
dest:指出复制文件的目标及位置,使用绝对路径,如果源是目录,指目标也要是目录,如果目标文件已经存在会覆盖原有的内容
src:指出源文件的路径,可以使用相对路径或绝对路径,支持直接指定目录,如果源是目录则目标也要是目录
mode:指出复制时,目标文件的权限
owner:指出复制时,目标文件的属主
group:指出复制时,目标文件的属组
content:指出复制到目标主机上的内容,不能与src一起使用
eg:
ansible dbservers -m copy -a 'src=/etc/fstab dest=/opt/fstab.bak owner=root mode=640'
file 模块:
//设置文件属性
ansible-doc -s file
ansible dbservers -m file -a 'owner=xxx group=xxx mode=xxx path=文件路径' #修改文件的属主属组权限等
ansible dbservers -m file -a 'path=链接文件路径 src=源文件路径 state=link' #设置链接文件
ansible dbservers -m file -a "path=文件路径 state=touch" #创建一个文件
ansible dbservers -m file -a "path=文件路径 state=absent" #删除一个文件
hostname模块:
//用于管理远程主机上的主机名
ansible dbservers -m hostname -a "name=主机名"
ping 模块:
//检测远程主机的连通性
ansible all -m ping
ansible xxx组 -m ping
yum 模块 :
//在远程主机上安装与卸载软件包
ansible-doc -s yum
ansible webservers -m yum -a 'name=服务名' #安装服务
ansible webservers -m yum -a 'name=服务名 state=absent' #卸载服务
service/systemd 模块 :
//用于管理远程主机上的管理服务的运行状态
ansible-doc -s service
//常用的参数:
name:被管理的服务名称
state=started|stopped|restarted:动作包含启动关闭或者重启
enabled=yes|no:表示是否设置该服务开机自启
runlevel:如果设定了enabled开机自启去,则要定义在哪些运行目标下自启动
ansible xxx组 -a 'systemctl status 服务名' #查看web服务器httpd运行状态
ansible xxx组 -m service -a 'enabled=true name=服务名 state=started' #启动httpd服务
script 模块:
//实现远程批量运行本地的 shell 脚本
ansible-doc -s script
首先编写一个shell脚本,赋予执行权限
ansible xxx组 -m script -a '脚本名称'
setup 模块 :
//facts 组件是用来收集被管理节点信息的,使用 setup 模块可以获取这些信息
ansible-doc -s setup
ansible xxx组 -m setup #获取mysql组主机的facts信息
ansible xxx组 -m setup -a 'filter=想要的字段' #使用filter可以筛选指定的facts信息
注意:以上的所有模块,你可以用组名来指定命令实行的范围,也可以用 all 表示全部,也直接可以用 IP 来对单机进行指定
个人建议:既然是按组划分了批量管理的主机,最好让 webservers 和 dbservers 两个组的成员IP(最好是组成员的IP是具有连续性),最好两个组的成员的 IP 都像一个取值范围一样,两个组的成员IP不要有交叉,方便管理。