您现在的位置:首 页 政策法规 相关标准 Skip Navigation Links
关闭      
明清档案目录中心数据采集标准 明清档案机读目录数据交换格式
DA/T 33-2005

1范围
本标准规定了软磁盘、光盘等作为载体交换明清档案机读目录数据时所使用的格式。
本标准规定的明清档案机读目录数据文件的组织形式为交换格式的文本文件。
本标准适用于全国明清档案目录中心机读目录数据信息交换。

2规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T1988–1998信息技术信息交换用七位编码字符集
GB/T2901–1992书目信息交换用磁带格式
GB2312–1980信息交换用汉字编码字符集基本集
GBl8030–2000信息技术信息交换用汉字编码字符集
DA/T8–1994明清档案著录细则

3术语和定义
下列术语和定义适用于本标准。
3.1档案目录catalogue Of archives
按照一定的秩序编排而成的条目组合,是档案管理、检索和报道的工具。
3.2机读目录machine-readable catalogue
将档案目录按照一定格式输入计算机内,可以由计算机读取、管理、检索的档案目录信息。
3.3数据data
对事物的概念和属性进行描述的规范化表示。
3.4记录record
字段的集合,完整描述一件事物的相关数据处理单元。
3.5字段field
记录中可标识的特定范围数据,可包含一个或多个子字段
3.6子字段sub-field
字段的一部分,它含有一个确定的数据单元
3.7数据元素data="element
被明确标识的最小数据信息单位
3.8字段标识符tag
识别字段的一组三位数字符号。
3.9子字段标识sub-field identifier
识别子字段的符号,由(b~j)字母标识。
3.10指示符indicator
字段标识符后,提供有关字段内容的附加信息。用(0–9)数字标识
3.11分隔符separator
用来限定记录、字段、数据单元的控制符。
记录分隔符&,字段分隔符@,子字段标识符$。

4交换格式的记录构成
4.1记录结构
记录由一组按一定格式写入的物理记录序列构成。
一条记录由记录头标、若干字段和记录尾标组成。

记录头标

字段1

……

……

字段N

记录尾标


记录头标
标识记录的开始信息,由1位字符组成。
其取值,M代表明朝档案,Q代表清朝档案。
记录尾标
标识记录的结束信息,由1位字符组成。
其取值,“&”。
4.2字段结构

记录标识符

指示符

字段标识符(可选)

数据区

字段分隔符


3位字符 1位字符 2位字符 N位字符 1个字符

字段标识符
标识该字段数据区所属的字段,其取值为三位数字。
指示符
标识对应字段的属性。其取值为数字,空时为“#”。
子字段标识符
由2位字符组成,标识字段中所属的子字段,
其第一位取值“$”。
第二位取值为小写字母。
字段分隔符
指示该字段数据区结束。其取值为“@”。
4.3文件结构
由若干记录组成一个文件,文件起始处为说明记录。

说明记录

记录

……

记录


4.4字段标识符说明
下列各字段定义除有专门说明外,均与DA/T8-1994相应的著录项的定义保持一致。
101 档号
指示符为空
子字段表
标识符 内容 说明
$b 全宗号 字段不可重复
$c 目录号 字段不可重复
$d 案卷号 字段不可重复
$c 件号 字段不可重复
$f 页号 字段不可重复
102 缩微号
指示符为空 字段不可重复
103 档案馆代码
指示符为空 字段不可重复
104 电子文件号
指示符为空 字段不可重复
105 画幅数
指示符为空 字段不可重复
106 密级
指示符为空 字段不可重复
201 题名
指示符为空 字段不可重复
202 责任者
指示符 1 表示第一责任者
指示符 2 表示第二责任者
指示符 3 表示第三责任者
子字段表
标识符 内容 说明
$b 官职爵位 字段不可重复
$c 责任人 字段不可重复
203 文本
指示符为空 字段不可重复
204 时间
指示符 1 表示文件原纪年(明、清朝纪年)
指示符 2 表示公元纪年
指示符 3 表示外国纪年
子字段表
标识符 内容 说明
$b 文件起始时间 字段不可重复
$c 文件终止时间 字段不可重复
301 附注
指示符为空
子字段表
标识符 内容 说明
$b 责任者 注字段不可重复
$c 载体型态 字段不可重复
$d 档案数量 字段不可重复
$e 数量单位 字段不可重复
$f 附件 字段不可重复
$g 规格 字段不可重复
$h 语种 字段不可重复
$i 档案实体 字段不可重复
$j 时间注 字段不可重复
601 主题词
指示符为空
子字段表
标识符 内容 说明
$b 主表主题词 字段可重复
$c 人名主题词 字段可重复
$d 国家机构主题词 字段可重复
$e 官职爵位主题词 字段可重复
$f 清代民族主题词 字段可重复
$g 行政区划主题词 字段可重复
602 分类号
指示符 1 表示第一分类主号
指示符 2 表示第二分类主号
指示符 3 表示第三分类主号
子字段表
标识符 内容 说明
$b 分类主号 字段不可重复
$c 地区复分号 字段可重复
$d 民族复分号 字段可重复
$e 国家复分号 字段可重复
901 提要项
指示符为空 字段不可重复
902 朝年政权标识
指示符为空 字段不可重复
903 控制符
指示符为空 字段不可重复

5 XMLSchema模式定义

<schema>

<element? name=“明清档案目录”>

<complex? Type>

<sequence>

<element name=“档案馆代码”type=“string'/>

<element name=“全宗号”type=“string”/>

<element name=“目录号”type=“string”/>

<element name=“案卷号”type=“string”/>

<element name=“件号”type=“string”/>

<element" name=“页号”type=“string”/>
<element name=“缩微号”type=“string”/>

<element name=“主分类号A”type=“string”/>

<element name=“A地区1”type=“string”/>

<element name=“A地区2”type=“string”/>

<element name=“A地区3”type=“string”/>

<element name=“A地区4”type=“string”/>

<element name=“A地区5”type=“string”/>

<element name=“A国家或民族l”type=“string”/>

<element name=“A国家或民族2”type=“string”/>

<element name=“A国家或民族3”type=“string”/>

<element name=“A国家或民族4”type=“string”/>

<element name=“A国家或民族5”type=“string”/>

<element name=“主分类号B”type=“string”/>

<element name=“B地区1”type=“string”/>

<element name=“B地区2”type=“string”/>

<element name=“B地区3”type=“string”/>

<element name=“B地区4”type=“string”/>

<element name=“B地区5”type=“string”/>

<element name=“B国家或民族1”type=“string”/>

<element name=“B国家或民族2”type=“string”/>

<element name=“B国家或民族3”type=“string”/>

<element name=“B国家或民族4”type=“string”/>

<element name=“B国家或民族5”type=“string”/>

<element name=“主分类号C”type=“string”/>

<element name=“C地区1”type=“string”/>

<element name=“C地区2”type=“string”/>

<element name=“C地区3”type=“string”/>

<element name=“C地区4”type=“string”/>

<element name=“C地区5”type=“string”/>

<element name=“C国家或民族1”type=“string”/>

<element name=“C国家或民族2”type=“string”/>

<element name=“C国家或民族3”type=“string”/>

<element name=“C国家或民族4”type=“string”/>

<element name=“C国家或民族5”type=“string”/>

<element name=“责任者A”type=“string”/>

<element name=“责任者B”type=“string”/>

<element" name=“责任者C”type=“string”/>

<element name=“责任者注”type=“string”/>

<element name=“官职爵位A”type=“string”/>

<element name=“官职爵位B”type=“string”/>

<element name=“官职爵位C”type=“string”/>

<element name=“题名”type=“string”/>

<element name=“文本”type=“string”/>
<clement name=“语种”type=“string”/>

<element name=“原纪年起始时间”type=“string”/>

<element name=“原纪年终止时间”type=“string”/>

<element name=“公元纪年起始时间”type=“string”/>

<element name=“公元纪年终止时间”type=“string”/>

<element name=“外国纪年起始时间”type=“string”/>

<element name=“外国纪年终止时间”type=“string”/>

<element name=“主题词”type=“string”/>

<element name=“附注”type=“string”/>

<element name=“提要项”type=“string”/>

<element name=“档案数量”type=“integer”/>

<element name=“数量单位”type=“string”/>

<element name=“档案属性”type=“string”/>

<element name=“朝年政权标识”type=“string”/>

<element name=“控制符”type=“string”/>

<clement name=“电于文件号”type=“string”/>

<element name=“画幅数”type="“integer”/>

<element name=“密级”type=“string”/>

</sequence></complex" Type></schema>


6、文件数据字段映射表

序号

字段名称

字段类型

字段标识符

1

<档案馆代码>

字符

103

2

<全宗号>

字符

101$b

3

<目录号>

字符

101$c

4

<案卷号>

字符

101$d

5

<件号>

字符

101$c

6

<页号>

字符

101$f

7

<缩徽号>

字符

102

8

<主分类号A>

字符

6021$b

9

<A地区1>

字符

6021$c

10

<A地区2>

字符

6021$c

11

<A地区3>

字符

6021$c

12

<A地区4>

字符

6021$c

13

<A地区5>

字符

6021$c

14

<A民族1>

字符

6021$d

15

<A民族2>

字符

6021$d

16

<A民族3>

字符

6021$d

17

<A民族4>

字符

6021$d

18

<A民族5>

字符

6021$d

19

<A国家1>

字符

6021$e

20

<A国家2>

字符

6021$e

21

<A国家3>

字符

6021$e

22

<A国家4>

字符

6021$e

23

<A国家5>

字符

6021$e

24

<主分类号B>

字符

6022$b

25

<B地区1>

字符

6022$c

26

<B地区2>

字符

6022$c

27

<B地区3>

字符

6022$c

28

<B地区4>

字符

6022$c

29

<D地区5>

字符

6022$c

30

<B民族1>

字符

6022$d

31

<B民族2>

字符

6022$d

32

<B民族3>

字符

6022$d

33

<D民族4>

字符

6022$d

34

<B民族5>

字符

6022$d

35

<B国家1>

字符

6022$e

36

<B国家2>

字符

6022$e

37

<B国家3>

字符

6022$e

38

<B国家4>

字符

6022$e

39

<B国家5>

字符

6022$e

40

<主分类号C>

字符

6023$b

41

<C地区1>

字符

6023$c

42

<C地区2>

字符

6023$c

43

<C地区3>

字符

6023$c

44

<C地区4>

字符

6023$c

45

<C地区5>

字符

6023$c

46

<C民族1>

字符

6023$d

47

<C民族2>

字符

6023$d

48

<C民族3>

字符

6023$d

49

<C民族4>

字符

6023$d

50

<C民族5>

字符

6023$d

51

<C国家1>

字符

6023$e

52

<C国家2>

字符

6023$e

53

<C国家3>

字符

6023$e

54

<C国家4>

字符

6023$e

55

<C国家5>

字符

6023$e

56

<责任者A>

汉字

2021$c

57

<责任者B>

汉字

2022$c

58

<责任者C>

汉字

2023$c

59

<责任者注>

字符

301$b

60

<官职爵位A>

汉字

2021$b

61

<官职爵位B>

汉字

2022$b

62

<官职爵位C>

汉字

2023$b

63

<题名>

汉字

201

64

<文本>

汉字

203

65

<语种>

汉字

301$h

66

<原纪年起始时间>

字符

2041$b

67

<原纪年终止时间>

字符

2041$c

68

<公元纪年起始时间>

字符

2042$b

69

<公元纪年终止时间>

字符

2042$c

70

<外国纪年起始时间>

字符

2043$b

71

<外国纪年终止时间>

字符

2043$c

72

<主题词>

字符

601

73

<附注>

汉字

301

74

<提要项>

汉字

901

75

<档案数量>

汉字

301$d

76

<数量单位>

数字

301$e

77

<档案属性>

字符

无标识符,内容为记录头标信息

78

<朝年政权标识>

字符

902

79

<控制符>

字符

903

80

<电于文件号>

字符

104

81

<画幅数>

数字

105

82

<密级>

字符

106


实例:清代军机处录副奏折著录条目
档号:0001–001
缩微号:001–0015
文本:奏折
官职爵位A:都察院左副都御史
责任者A:二格
文件起始时间:061101026
题名:奏为请设口外道员以专责成事
分类主号A:C111
A地区1:61
A地区2:62
记录格式:
  Q101#$d0001$e001@102#001-0015@201#奏为请设口外道员以专责成事@2021$b都察院左副都御史$c二格@203#奏折@2041$b061101026@6021$bClll$c61$c62&