—
一、四个基本概念
1. 数据(Data)
– 定义:描述事物的符号记录,与其语义不可分割。
– 种类:数字、文字、图形、图像、声音等。
– 示例:学生记录(李明,男,1972,江苏,计算机系,1990)需结合语义解释。
2. 数据库(DB, Database)
– 定义:长期存储在计算机内、有组织、可共享的大量数据集合。
– 特征:按数据模型组织、冗余度小、独立性高、易扩展。
3. 数据库管理系统(DBMS)
– 定义:位于用户与操作系统之间的数据管理软件。
– 功能:数据定义(DDL)、数据操纵(DML)、完整性控制、并发控制、数据库恢复等。
4. 数据库系统(DBS)
– 定义:引入数据库后的计算机系统,由数据库、DBMS、应用系统、DBA和用户构成。
– 核心:DBMS。
—
二、数据管理技术的发展
1. 人工管理阶段(20世纪50年代前)
– 特点:数据不保存、无共享、完全依赖程序、无结构。
– 应用场景:科学计算,数据量小。
2. 文件系统阶段(50年代末-60年代中)
– 特点:数据长期保存,但共享性差、冗余度大、独立性差。
– 问题:数据不一致、查询困难、维护成本高。
3. 数据库系统阶段(60年代后期)
– 特点:数据整体结构化、共享性高、独立性强、由DBMS统一管理。
– 数据模型:网状模型(第一代)、关系模型(第二代,主流)、面向对象模型(第三代)。
—
三、数据库系统结构
1. 三级模式结构
– 外模式(子模式):用户视角的局部数据逻辑结构(如视图)。
– 模式(逻辑模式):全局数据逻辑结构,描述数据整体框架(如关系表)。
– 内模式(存储模式):数据的物理存储结构(如索引、存储方式)。
2. 两级映像与数据独立性
– 外模式/模式映像:保证逻辑独立性(修改模式时不影响外模式)。
– 模式/内模式映像:保证物理独立性(修改存储结构时不影响模式)。
—
四、数据库管理系统(DBMS)
1. 主要功能
– 数据定义(DDL)、数据操纵(DML)、事务管理、安全性与完整性控制、并发控制、恢复机制。
2. 组成模块
– 查询处理器、存储管理器、事务管理器、缓冲区管理器、数据字典。
—
五、数据库管理员(DBA)
– 职责:
1. 数据库设计与维护。
2. 定义完整性约束与安全策略。
3. 监控性能并优化(如重组织、重构造)。
4. 故障恢复与备份。
—
六、数据库系统特点
1. 数据共享性高:减少冗余,避免不一致性。
2. 结构化存储:整体数据按模型组织(如关系表)。
3. 独立性:物理独立性(存储变化不影响应用)、逻辑独立性(结构变化不影响应用)。
4. 可控冗余:通过设计降低冗余,提升一致性。
—
七、对比:文件系统 vs 数据库系统
| 特性 | 文件系统| 数据库系统|
|—————-|—————————|—————————–|
| 数据共享 | 共享性差,冗余度大 | 共享性高,冗余度小 |
| 数据独立性 | 依赖程序,独立性差 | 高度独立(两级映像) |
| 数据结构 | 记录内有结构,整体无结构 | 整体结构化(如关系模型) |
| 完整性控制 | 由程序自行控制 | 由DBMS统一管理 |
—
八、关键示例
– 数据独立性应用:修改存储结构(如从顺序存储改为B树索引)时,通过模式/内模式映像调整,应用程序无需改动。
– 三级模式实例:
– 模式:学生表(学号,姓名,系别)。
– 外模式:教务处视图(学号,姓名)、财务处视图(学号,奖学金)。
– 内模式:数据按学号聚簇存储,使用B+树索引。
—