技术提高能力,沟通开拓视野
导航
IT博客
首页
新随笔
联系
聚合
管理
<
2007年10月
>
日
一
二
三
四
五
六
30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
6
7
8
9
10
公告
本Blog以原创为主,内容涉及平时工作及兴趣范围! 网络涉及: 企业级网络架构, 企业级AD域模式构建, 企业信息安全与病毒防范。 程序开发: Delphi, Dotnet(C#,Asp.Net), SQL SERVER等. 工作QQ:381584155
随笔分类
(21)
基础理论(7)
(rss)
程序开发(3)
(rss)
系统维护(6)
(rss)
网络技术
(rss)
软件分享(1)
(rss)
轻松生活(4)
(rss)
文章分类
(9)
程序开发-Delphi
(rss)
程序开发-Dotnet(1)
(rss)
系统维护(8)
(rss)
网络知识
(rss)
随笔档案
(22)
2007年12月 (1)
2007年11月 (13)
2007年10月 (5)
2007年6月 (1)
2007年5月 (2)
文章档案
(10)
2007年10月 (2)
2007年6月 (2)
2007年5月 (5)
2007年2月 (1)
相册
Family
统计
随笔 - 22
文章 - 10
评论 - 30
引用 - 0
留言簿
(2)
给我留言
查看公开留言
查看私人留言
积分与排名
积分 - 54881
排名 - 114
阅读排行榜
1. "SQL 2005 附加数据库出错"解决方法(8189)
2. 原码,反码,补码和移码的相关概念(4371)
3. (转)理解原码,反码和补码(3140)
4. Win2003中AD域功能级别简介(3116)
5. 8086寄存器分类(2484)
评论排行榜
1. (转)理解原码,反码和补码(6)
2. 分享一下Gmail的邀请函(6)
3. "SQL 2005 附加数据库出错"解决方法(4)
4. 写在考网工之前(2)
5. (转)有母如此,子复何求(2)
浅析SQLSERVER数据库文件存储机制
数据存储是SQLSERVER数据库比较核心的知识,同时网络上相关的参考资料也比较少!近段时间,通过微软的WebCast学习以及自己查询资料,
将自己对SQLSERVER数据库在数据存储方面的理解整理下来,一方面希望能加深自己的印象,另一方面也希望能给其他的朋友提供相关的参考!
一:存储文件类型
SQLSERVER有两种数据存储文件,分别是数据文件和日志文件。
其中:数据文件是以8K(=8192Byte)的页面(Page)作为存储单元的。
而日志文件是以日志记录作为存储单元。
二:页面类型
SQLSERVER中页面类型有8种,具体每种类型的详细说明,见下图:
三:页面结构
SQLSERVER中,页面结构如下图:
其中:数据页面页首:96个字节,保存着页面的管理信息,比如该页面所属于哪个物理文件。
数据区:对应于上图中所有数据行的总区域,存放真正的数据,是以Slot为单位。一个Slot就是对应于一条数据记录行,从0开始编号,以16进制反序保存,Slot0, Slot1....。
行偏移数组:用于记录该数据页面中每个Slot在数据页面所处的相对位置,便于定位和检索每个Slot在数据页面中的位置,数组中每个记录占两个字节。
四:存储分配单位:盘区(扩展 Extend)
虽然SQLSERVER中数据文件的标准的存储单位是页面(Page),但为了减少频繁的读写IO,在表或其它对象分配存储空间,不是直接分配一个8K的页面,而是以一个盘区(Extend)为存储分配单位,一个盘区为8个页面(=8*8K=64K)。
五:盘区类型
在SQLSERVER存储分配时,为提高数据库性能,不是以页面做为分配单位而是以盘区做为分配单位。这样虽然减少了频繁的IO读写,提高的数据库性 能,但却导致出一个新问题,那就是在存储那些只有少量数据,不足8K的对象,如果也是分配给一个盘区,就会存在存储空间上的浪费,降低了空间分配效率。
为解决上述问题,SQLSERVER定义了两种盘区类型,统一盘区和混合盘区。
其中:
统一盘区只能存放同一个对象,该对象拥有这个盘区的所有页面
混合盘区:由多个对象共同拥有该盘区。
在实际
为对象分配存储盘区时,为了提高空间利用率,默认的情况下,如果一个对象一开始大小小于8个页面,就尽量放在混合盘区中,如果该对象
大小增加到8个页面后,SQLSERVER会为这个对象重新分配一个统一盘区。
六:盘区管理机制
为了可以准确无误的实现上述的盘区分配策略,SQLSERVER使用了GAM/SGAM管理盘区机制。
其中:GAM(全局分配映射页面),专门用来管理盘区,记录数据文件的盘区使用情况。一个GAM页面的大小也是8K,除去96个字节的页头,还有8*1024-96=8096(byte)=64768(bit),每个bit用0/1来表示这个盘区有没有空闲空间。
具体含义是:如果这个位是 1,则盘区可用;如果这个位是 0,则盘区已分配。
一个盘区是64K,那么一个GAM页面可以管理
64768*64=4GB的空间。也就是说,如果数据文件的大小小于4GB,只用一个GAM页面就可以管理,超出4GB后,才会增加第2个GAM页面。
SGAM(全局共享映射页面),专门用来管理混合盘区,同样的,一个SGAM也可以管理4GB的数据文件。每个位中0/1表示的含义也与GAM中的一样。GAM与SGAM对同一盘区的管理参数搭配如下图:
定义好管理盘区机制后,SQLSERVER中是如何给一个对象来分配盘区呢?
简单来说,SQLSERVER会综合GAM和SGAM中盘区信息,寻找一个合适的盘区进行分配。
在对一个对象分配盘区时,首先根据大小来确实是分配新的统一盘区还是分配混合盘区。
若 要分配新的统一盘区,SQL Server 在 GAM 中搜索是 1 的位,然后将它设成 0。
若要查找有可用页的混合盘区,SQL Server 在 SGAM 中搜索是 1 的位。
若要分配一个新的混合盘区,SQL Server 在 GAM 中搜索是 1 的位,并将它设置为 0,然后将 SGAM 中相应的位也设置为 1。
若要释放盘区,SQL Server 应确保 GAM 位设置为 1 而且 SGAM 位设置为 0。
SQL Server 内部实际使用的算法比这里叙述的算法要复杂,但道理大致如此。
七:通过DBCC命令查看数据页面信息
数据存储相关的概念就是以上6点,全是理论性知识,但我们可以通过未公开的DBCC命令,直接查看某个数据页面的内容,得到直观上的数据存储信息。
具体DBCC命令是DBCC PAGE.
简单的使用例子如下:
//查看数据页面的内容的方法
--打开查看数据页面的开关
dbcc traceon(3604) //打开跟踪标记
dbcc Page(northwind,1,100,1) //打开northwind数据库,第101个页面的信息
posted on 2007-10-23 21:34
Alligator
阅读(1952)
评论(0)
编辑
收藏
引用
只有注册用户
登录
后才能发表评论。
Powered by:
IT博客
Copyright © Alligator