日常运维中,有哪些好的技能、经验、工具值得学习和掌握?在上周的交流活动中,社区成员分享了很多内容,是活动社区成员董志伟整理的,希望能给大家带来帮助。
一、资产管理
经验分享1:
我们企业的设备资产由采购部采购,记入财务账户,然后由我们的维修部门使用。但是在几个大的固定资产存货中,问题是财务账和固定资产不匹配。原因是购买的设备是比如三个服务器,我们得到的设备是三个服务器,但是涉及到避税或者其他一些问题。供应商经常开5台服务器或1台服务器的发票,或者擦除硬盘、内存等扩展配件的信息。财务上,只要总额正确。他们不会问问题。几次之后。财务账目和固定资产有很大出入。我们现在开始根据固定资产的情况进行整理,分享一些我想到的经验:
财务发票应与资产明细完全一致。
设计、形成详细的固定资产报表,并为每一次设备采购尽快更新和核实固定资产报表。
如果条件允许,设备应通过不应脱落的标志或标签进行识别。,可以建立固定资产查询库,通过设备标识可以准确查询固定资产信息、购置时间、折旧年限等信息。
固定资产一定要尽快清点。不要因为机房的初步建设而等待繁重的任务。否则等设备全部上线后,以后清点固定资产会相当繁琐痛苦。
经验分享2:
当一些公司需要财务和运维部门制定设备采购后的资产编号和用途时,由于当时的设备采购需求不同,随着后来的使用,设备的用途发生了一次又一次的变化,但财务系统中设备的用途并没有发生变化。久而久之,经过几个管理员,判断的时候设备都找不到,也配不上。
还有比如设备是扩展的,但是如果你申请新购,那么新购会有另一个资产号,时间长了会冲突或者很难找到。
只靠管理员记录这些东西不是特别现实。它需要定期更新,这通常会耗费管理员大量的精力。因为更新不是很多财务的事情,需要有完善的机制来指定。然而,许多企业不愿意开发专门针对这一需求的系统或接口,在许多情况下,他们仍然保持现状。
经验分享3:
在资产管理的运维中,我觉得不需要高效,需要准确细致。目前大多数企业都有自己的OA系统。在办公自动化系统中,应该设计特殊的资产管理流程。这个过程的核心当然是财务部。任何资产的转移、放弃和增加都要有相应的流程。过程完成不了也没关系。年末有详细记录。财务盘点前结清欠款就好。
经验分享4:
CMDB的资产设备信息可以集成到企业ITIL流程管理中。在日常的运行维护过程中,如果有新的设备或变化,可以通过这个过程直接关联到CMDB的设备配置信息。然而,CMDB设备资产的粒度值得反复实践和探讨。如果粒度过细,比如网线、电缆等信息在CMDB记录,可能会导致整个CMDB的设备资产过大,做很多无用的工作。但是如果粒度太粗,可能无法在资产设备和各种应用系统之间形成有效的关联。
总结:
资产管理是日常运营和维护中一项繁琐而重复的任务。很多企业没有做好资产管理,存在一些问题。比如流程系统问题,资产管理产品系统问题,人工操作更新等等。面对很多问题,并不是说有统一的方法可以解决所有问题。更实际的是,我们需要在某个具体的薄弱环节或者管理员的自我管理上付出更多的精力,情况会有很大的改善。
我们可以借鉴的经验:
1.在管理流程体系、资产盘点、财务部门与运维部门的沟通与合作等方面,可以根据情况进行改进和完善
2.抛弃一些低效的资产管理方法,开发或购买一套资产管理产品,提高工作效率
3.要提高自我责任感,首先要做好自己的工作,也可以在工作中游刃有余。
二、操作系统部署管理工具
经验分享1:
AIX和Linux操作系统安装和部署:
由于没有实现云环境,以下大多数场景都基于传统的基本平台。
AIX操作系统大多通过NIM安装,NIM是AIX上功能强大的软件。当企业有五台以上的小机器时,应考虑建立一个NIM环境,用于统一的网络安装和部署设施。
NIM本身资源不多,操作系统镜像和安装初始化所需的设施,比如NFS环境,用来存储常用的镜像和初始化软件。有30G的基本收入就够了。当然越多越好,本地磁盘就够了。制作镜像或使用存储的lun。
关于nim资源定义的使用,请参考我之前的帖子:
http://www.aixchina.net/club/thread-115907-1-1.html
在构建nim服务器时,建议使用等于或大于企业主流版本的稳定版本。应该不会经常升级,兼容性会更好。可以支持几年没有问题。大多数企业升级主流操作系统版本需要3年以上。通用软件可以添加到Nim安装的初始化资源中,也可以使用相同的初始化脚本简单地安装和设置操作系统。
参考脚本:
http://www.aixchina.net/club/thread-116571-1-1.html
经验分享2:
Linux的安装和部署:
由于我们大多数企业都选择红帽系列操作系统,所以我选择了鹅卵石自动安装操作系统,与红帽系列兼容,支持ubuntu等操作系统。
主要关注:
鞋匠工具好用,使用方便。
由于操作系统环境不同,可以制作更多的模板,磁盘大小和参数设置可以单独设置。
您可以与CMDB运维管理平台合作进行支持管理和操作系统部署。可以用python重新开发等等。考虑到日常运维,不要买太多版本的硬件和主流操作系统,给管理带来更多的复杂性。很多互联网公司都是统一的设备,都是统一的OS版本,管理起来还是挺方便的。以后做同样的管理平台方便多了。
经验分享3:
对于系统系列服务器,我们使用了联想XClarity管理工具。可以实现设备发现、系统安装、硬件监控等功能。同时,它还支持虚拟机安装和虚拟化设备的管理,如Vmware和Hyper-V。
总结:
操作系统安装和部署是操作和维护的重要组成部分。今天,我们有很多好的工具可以参考和使用。主要有以下产品:
Windows:WDS、SCCM、PXE+kickstart
Linux:补鞋匠,PXE+kickstart,UNetbootin,AutoYaST
尼姆,powervc
除了光驱安装系统,还可以支持主流操作系统的u盘安装。
三、运维项目的难点
经验分享:
无论是哪种运维,DB运维,OS运维,中间件运维,责任第一,谨慎第二,专业和经验第三。做事没有责任心和细心是不够的,即使技术好,也有潜在的隐患,因为如果责任心不到位,你就不会主动去监控、检查、维修系统。不能防患于未然。技术和经验是技术问题,责任和谨慎是性格问题。如果要选择,先关注人品,再关注技术。
第四,SSH登录慢
登录速度慢和登录后速度正常可能有三个原因:
1.DNS反向解析问题
OpenSSH在用户登录时验证IP。它利用反向DNS根据用户的IP查找主机名,然后利用DNS查找IP地址,最后匹配登录的IP是否合法。如果客户端的IP没有域名,或者DNS服务器速度慢或者无法访问,那么登录需要很长时间。
解决方法:
修改一下就好
/etc/ssh/ssh _ config,
将“已用号码”设置为“否”:
sed-I " s/# UseDNS yes/UseDNS no/"/etc/ssh/ssh _ config
2.GSSAPI的问题
使用ssh -v user@server,您可以在登录时看到以下信息:
调试1:下一个身份验证方法:gssapi-with-mic
首次亮相1:未指明的GSS失败。次要代码可能会提供更多信息
解决方法:
可以用ssh
-o GSSAPIAuthentication =无用户@服务器
登录
也可以修改
/etc/ssh/ssh_config,
设置GSSAPIAuthentication no
3.DNS访问设置
查看IBM官方文档,了解DNS解析的详细说明。/etc/netsvc.conf进行以下更改:
hosts=local,bind ->;hosts=local4,bind4
最后
/init . d/ssh重新启动
[计]高级交互执行程序(Advanced Interactive Executive)
扫描方式:cfgmgr
查看结果:lsdev
Windows操作系统
查看结果:设备管理器
Linux操作系统
扫描方法:
1.重新扫描LUN设备(脚本)
rescan-SCSI-bus.sh上有现成的脚本。
通过HBA卡扫描底层物理设备
回声1>。/sys/class/fc _ host/host 1/issue _ lip
回声1>。/sys/class/fc _ host/host 2/issue _ lip
通过SCSI扫描SCSI设备
回声"- -" >。/sys/class/SCSI _ host/host 1/scan
回声"- -" >。/sys/class/SCSI _ host/host 2/scan
检查结果:
Lsscsi或fdisk
服务器
扫描方法:#ioscan
检查结果:
ioscan -fNnkC磁盘
ioscan -m lun
Solaris:
扫描方法:#devfsadm
检查结果:#格式
如果这些方法不容易使用,那么最终的解决方案是:重启
六、操作系统常用的监控小工具
常见的UNIX和Linux性能监控命令:
netstat、vmstat、iostat、ps、sar、nfsstat、lsof
每个操作系统平台独有的性能监控命令或小工具:
[计]高级交互执行程序(Advanced Interactive Executive)
topas、nmon、svmon、entstat、procmon、lsps、filemon、truss、lvmstat、netpmon
Linux操作系统
nmon、top、dstat、ss、iftop、iperf、slabtop、top、sysdiag、Smem、ethtool
操作系统
扫视、测量软件、性能视图、nnm和ITO
操作系统
sysperfstat、prtdevs、mpstat、swapinfo、iotop、iosnoop、nicstat、checkcable、prtdiag、snoop、sarmons
七、Linux安装Oracle RAC Udev设备绑定
环境:
red hat 5.6+多路径
cat/etc/red hat-发布
红帽企业Linux服务器5.6版(Tikanga)
cat/etc/udev/rules . d/99-ASM . rules
KERNEL = = "/dev/mapper/ASM _ VNX 5200 _ data 0[1-5]",OWNER="grid ",GROUP="oinstall ",MODE="660 "
red hat 6.5+多路径
cat/etc/red hat-发布
CentOS版本6.5(最终版)
cat/etc/udev/rules . d/99-ASM . rules
KERNEL=="dm-[2-8]",OWNER="grid ",GROUP="oinstall ",MODE="660 "
由于操作系统版本不同,操作系统上的设备识别的文件类型也不同。所以绑定规则不一样。
以上设置已在生产系统运行中稳定。
以下内容收集于网上,可供参考:
要安装RAC,您需要绑定磁盘映射并获取磁盘WWID以使用UDEV绑定。
Scsi_id命令向设备发送Scsi查询指令,以访问重要产品数据(VPD)页面的0x83数据,其中包含设备的WWID和其他信息,或页面的0x80数据,其中包含设备序列号。scsi_id命令(一个长字符串)的执行结果是设备的WWID,当前映射到/dev/sdc(/sys/block/sdc)。设备的每个路径和设备上每个分区的WWID都是相同的。即使在系统中添加或删除了其他设备,设备的WWID也不会改变。但是,映射到/dev/sdc的设备可能会改变。这就是为什么您需要创建一个静态设备名称。您可以根据WWID创建设备名称。
首先,如何获得WWID的设备
(1) Redhat 5企业版Linux如下:
/sbin/scsi_id -g -u -s /dev/sdb
或者
/sbin/scsi_id -g -u -s /block/sdb
外壳脚本
# for I in ` cat/proc/partitions | awk { ' print $ 4 ' } | grep SD `;do echo " # # $ I:` SCSI _ id-g-u-s/block/$ I ` ";行
(2)红帽6企业版Linux如下:
/sbin/scsi_id -g -u /dev/sdb
或者
/sbin/scsi_id -g -u /block/sdb
或者
/sbin/scsi_id -白名单[-replace-空格] [ - device=] /dev/sdb
外壳脚本
# for I in ` cat/proc/partitions | awk { ' print $ 4 ' } | grep SD `;do echo " # # $ I:` SCSI _ id-白名单-替换-空白/dev/$ I ` ";行
第二,写udev。规则
(1)为整个磁盘的绑定编写99-oracle-asmdevices.rules(文件名,test可以随便排序)
RHEL5
因为我在英国、加拿大、德国、法国;
做
echo "KERNEL=="sd* ",BUS=="scsi ",PROGRAMME = = "/sbin/SCSI _ id-白名单-替换-空白-设备=/dev/$name ",RETUTE = = " `/ sbin/SCSI _ id-g-u-s/dev/SD $ I ` ",NAME="asm-disk$i ",OWNER="grid ",GROUP="asmadmin ",MODE = " 0660 " " & gt>。/etc/udev/rules . d/99-Oracle-asmdevices . rules
行
RHEL6
因为我在英国、加拿大、德国、法国;
做
echo "KERNEL=="sd* ",BUS=="scsi ",PROGRAMME = = "/sbin/SCSI _ id-白名单-替换-空白-设备=/dev/$name ",RETURE = = " `/ sbin/SCSI _ id-白名单-替换-空白-设备=/dev/sd$i ` ",NAME="asm-disk$i ",OWNER="grid ",GROUP="asmadmin ",MODE = " 0660 " " & gt>。/etc/udev/rules . d/99-Oracle-asmdevices . rules
行
(2)磁盘子分区的绑定
红帽企业版Linux 5使用以下参数
KERNEL=="sd?[1-2]",BUS=="scsi ",PROGRAMME = = "/sbin/SCSI _ id-g-u-s % p ",RETURn = = " 1ATA _ VBOX _ HARDDISK _ VBaef9 fa 71-c 32978 c 8 ",NAME="asm-ocr%n ",OWNER="grid ",GROUP="asmdba ",MODE="0660 "
红帽企业版Linux 6使用以下参数
KERNEL=="sd?[1-2]",BUS=="scsi ",PROGRAMME = = "/sbin/SCSI _ id-g-u/dev/$ NAmE ",RETURE = = " 1ATA _ VBOX _ HARDDISK _ VBaef9 fa 71-c 32978 c 8 ",NAME="asm-ocr%n ",OWNER="grid ",GROUP="asmdba ",MODE="0660 "
或者
KERNEL=="sdb1 ",BUS=="scsi ",PROGRAMME = = "/sbin/SCSI _ id-g-u-d/dev/$ parent " RETURE = = " 1ATA _ VBOX _ HARDDISK _ VB 8383313d-441 FD 502 ",NAME="asm-crs1 ",OWNER="grid ",GROUP="asmadmin ",MODE="0660 "
(3)仅更改权限
[根@ RAC 01 Oracle]# cat/etc/udev/rules . d/99-ASM-multiplex . rules
" PROGRAMME = "/bin/chown Oracle:oinstall/dev/mapper/back _ mpap P1 "
" PROGRAMME = "/bin/chown Oracle:oinstall/dev/mapper/back _ mpat 2 P1 "
" PROGRAMME = "/bin/chown Oracle:oinstall/dev/mapper/data _ mpap P1 "
" PROGRAMME = "/bin/chown Oracle:oinstall/dev/mapper/data _ mpat 2 P1 "
八、使用Linux多路径软件多路径
随着X86环境的普及,Linux的市场份额越来越高。为了方便后续的设备管理和Linux自带多路径软件的成熟,我们在日常的设备多路径软件选择中,往往会考虑先使用DM软件。以下内容主要结合日常使用的多径各方面。
Linux,lsscsi的一款软件,方便查看日常设备,推荐大家使用。
多路径安装配置:
[root @ power yum . repa . d]# rpm-QA | grep设备映射器
设备映射器-持久数据-0.2.8-2.el6.x86_64
设备映射器-libs-1.02.79-8.el6.x86_64
设备映射器-事件-libs-1.02.79-8.el6.x86_64
设备映射器-事件-1.02.79-8.el6.x86_64
设备映射器-1.02.79-8.el6.x86_64
[root @ power yum . repa . d]# yum install device-mapper-multiplex . x86 _ 64
[root @ power yum . repa . d]# mod probe DM-multiplex
[·鲁特@ power yum . repa . d]# mod probe DM-循环赛
[root @ power yum . repa . d]#服务多路径启动
启动多路径守护程序:[确定]
[根@电源等]#多路径-ll
1月13日15:22:46 |/etc/multiplex . conf不存在,将所有设备列入黑名单。
1月13日15:22:46 |示例多路径. conf文件位于
1月13日15:22:46 |/usr/share/doc/device-mapper-multiplex-0 . 4 . 9/multiplex . conf
1月13日15:22:46 |您可以运行/sbin/mpathconf来创建或修改/etc/multiplay . conf
[root @ power etc]# CP/usr/share/doc/device-mapper-multiplex-0 . 4 . 9/multiplex . conf/etc/multiplex . conf
[root @ power etc]# cat/etc/multiplex . conf
黑名单{
“^sda”发展节点
}
默认值{
用户友好名称是
path_grouping_policy多总线
立即回切
no _ path _重试失败
}
多面体{
多路径{
wwid 36005076307 ffc 0 da 000000000001704
别名ibm_ds8100_1704
}
多路径{
wwid 3600601600 e 003 e 001 b 30 C4 d2f 8 a9 e 511
别名ibm_ds8100_1705
}
}
常见的多路径命令:
多路径
modprobe DM-多路径
服务多路径重新加载(启动、停止、重新启动)
多路径-v2
多路径-v3格式的路径-v3更详细
多径
多路径ll
多面体-k(帮助)
注意:配置多路径后,在添加存储阵列的新本地磁盘或LUN时,需要考虑使用黑名单和LVM配置文件过滤磁盘的问题。参数不正确可能会导致主机异常识别和使用新添加的磁盘,需要酌情修改。
两种选择:
file:/etc/lvm/lvm.conf
filter = [ "a/。*/" ]
file:/etc/multiplex . conf
黑名单{
“^sda”发展节点
}
1.通过apache ANT工具,一个服务器(类似于一个fort-base机)可以控制多个服务器应用的启停操作;
2.集群服务器配置,相互信任;
3.使用rsync命令同步群集中的包;
4、统一管理应用程序的启停操作。
当然,jenkins也可以为自动化部署而构建
九.电力医院管理局的日常管理
PowerHA 5和6的日常管理监控
1.编辑/etc/profile并添加以下环境变量
export PATH =/usr/es/sbin/cluster/utilities:/usr/es/sbin/cluster
2.检查集群进程状态
clshowsrv -v
3.检查资源组clshowres
clshowres
4.检查集群节点信息
cllsnode
5.使用clstat检查机器状态(您需要编辑/etc/snmpdv3.conf)
VACM _集团集团1 SNMPv1公众-
VACM _查看默认值查看互联网-包括-
VACM _视图默认值视图1 . 3 . 6 . 1 . 4 . 1 . 2 . 2 . 1 . 1 . 1 . 1 . 0-包括-
VACM _视图默认值视图1.3.6.1.4.1.2.6.191.1.6 -包括-
从默认视图中排除与snmpv3相关的MIb
VACM _查看默认值查看简单模块-排除-
VACM _视图默认值视图1.3.6.1.6.3.1.1.4 -包括-
VACM _视图默认值视图1.3.6.1.6.3.1.1.5 -包括-
Vacm _ view默认视图1 . 3 . 6 . 1 . 4 . 1 . 2 . 3 . 1 . 2 . 1 . 5-包含-添加此行
从默认视图中排除aixmibd托管MIBs
VACM _视图默认值视图1.3.6.1.4.1.2.6.191 -排除-
VACM_ACCESS组1-NoAuthNopriv Snmp v1默认视图-默认视图-
NOTIFY notify1 traptag陷阱-
TARGET _ ADdress TARGET 1 UDP 127 . 0 . 0 . 1 trap tag trap arms 1-----
TARGET _ PARAMETERS trap arms 1 Snmp v1 Snmp v1 public NoAuthNopriv-
COMMUNITY public NoAuthNopriv 0 . 0 . 0 . 0 . 0 0 . 0-
默认安全不可访问
日志文件=/usr/tmp/snmpdv3.log已启用
日志大小=100000级别=0
smux 1.3.6.1.4.1.2.3.1.2.1.2门控_密码#门控
smux 1 . 3 . 6 . 1 . 4 . 1 . 2 . 3 . 1 . 2 . 1 . 5 clsmexpd _ password在此删除AIX clsmuxpd的注释部分# HACMP/ES
VACM _集团董事_集团SNMPv2c公众-
VACM _ ACCESS _ director _ group-NoAuthNopriv SNMPv2c Defaultview-Defaultview-
1.《dumprep 日常运维中值得掌握的十个方面技能、经验和工具》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《dumprep 日常运维中值得掌握的十个方面技能、经验和工具》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/guoji/819978.html