概述
相信大家在做文件迁移时,会有人遇到过这样一个奇怪的问题:相同的文件放置在不同的硬盘上面,占用存储空间相差很大,部分目录甚至达到2倍。这里我们先从Linux存储的本质开始介绍。
Linux文件系统的存储方式
在Linux系统中一个文件由目录项、inode和数据块组成,数据块作为存储的最小单元。
♦ 目录项:包括文件名和inode节点号。
♦ Inode:又称文件索引节点,包含文件的基础信息以及数据块的指针。
♦ 数据块:包含文件的具体内容。
1、inode
理解inode,要从文件储存说起。文件储存在硬盘上,硬盘的最小存储单位叫做”扇区”(Sector)linux复制整个文件夹,每个扇区储存512字节(相当于0.5KB)。
操作系统读取硬盘的时候,不会一个扇区一个扇区地读取,这样效率太低,而是一次性连续读取多个扇区,即一次性读取一个”块”(block)。这种由多个扇区组成的”块”,是文件存取的最小单位。”块”的大小,最常见的是4KB,即连续八个 sector组成一个 block。
文件数据都储存在”块”中linux复制整个文件夹,那么很显然,我们还必须找到一个地方储存文件的元信息,比如文件的创建者、文件的创建日期、文件的大小等等。这种储存文件元信息的区域就叫做inode,中文译名为”索引节点”。
2、inode的大小
inode也会消耗硬盘空间,所以硬盘格式化的时候,操作系统自动将硬盘分成两个区域。一个是数据区,存放文件数据;另一个是inode区(inode table),存放inode所包含的信息。
磁盘存储分析
同一个文件在不同的硬盘占用不同的磁盘空间,从本质讲是这些文件的inode和block不同导致的。而这些参数是在硬盘初始化时设定的,会不会是因为这个原因导致的呢?
通过命令dumpe2fs 查看两块硬盘的信息:
硬盘 1 :
硬盘 2 :
从上面可以看出硬盘1的Block size: 8192 而硬盘2为Block size: 4096,也就是说硬盘1的最小存储单元为8K,硬盘2为4K,会不会是因为文件里面有好多小于4K的文件,当存储在硬盘1最少占用8k的空间导致上面奇怪的现象?
判断验证
在 硬盘1创建一个空文件,并输入一个空格保存,
#vi test.txt
使用du –sh test.txt 发现文件大小为8K 如图:
在 硬盘2 做同样的动作
判断再验证
拷贝硬盘的文件进行对比
硬盘2:
硬盘1:
可以发现相同的文件不同的硬盘,占用的空间大小不同。到这里问题也就解决了,只需要重新做一下格式化就可以了。
觉得有用的朋友多帮忙转发哦!后面会分享更多devops和DBA方面的内容,感兴趣的朋友可以关注下~
限时特惠:本站每日持续更新海量展厅资源,一年会员只需29.9元,全站资源免费下载
站长微信:zhanting688