欢迎来到冰豆网! | 帮助中心 分享价值,成长自我!
冰豆网
全部分类
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • 党团工作>
  • ImageVerifierCode 换一换
    首页 冰豆网 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    文档一体化系统的数据准备著录与标引.docx

    • 资源ID:30635246       资源大小:29.55KB        全文页数:19页
    • 资源格式: DOCX        下载积分:10金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    文档一体化系统的数据准备著录与标引.docx

    1、文档一体化系统的数据准备著录与标引文档一体化系统的数据准备一著录与标引5 . 1 著录与标引的含义著录是对文件或档案的内容特征和形式特征进行分析、选择和记录的过程。著录包括著和录两个方面。著,即标引。标引是在文件或档案的加工 、存贮和检索过程中,将其内容主题的自然语言,转换成规范化的检索语言的过程,标引是针对内容特征而言的。录,即抄录。抄录是将文件或档案的形式特征,如作者、时间、文号等照录在著录条目上。标引使用的是规范化的人工语言,而抄录使用的是文件或档案固有的自然语言。标引是著录的核心部份,通过标引,使文件或档案的内容信息形成检索标识 , 管理自动化系统才具有管理和检索功能。在手工系统中,对

    2、文件进行著录,即形成文件登记表或登记卡片,对档案进行著录,即形成各种形式的档案目录。在管理自动化系统中,文书及档案的著录过程与手工系统仍然是相似的,但它已减少了许多的重复性工作,使著录与标引的效率大为提高。特别是象 S L W S 等将文书及档案的管理合二为一的系统,由于在文书管理阶段即对所发生的文件即时进行了著录,从而,使文件归档时著录工作量大为减少。在管理自动化系统中,对文件和档案的管理,是通过对文件和档案数据库的管理来实现的。而数据库的建立,又必须依赖于著录项目的输人。也就是说,没有这种输入,自动化管理就无从谈起。这也是我们把著录和标引称为管理自动化系统的数据准备或前处理工作的原因。著录

    3、的质量,直接影响到自动化系统的应用水平。现在的计算机还不会判断这些特征数据的质量,就如我们常说的,“输入的是垃圾,输出的也是垃圾” 著录与标引的工作质量,可以概括为对内容特征和形式特征进行描述及给予检索标识的正确性与全面性程度。影响著录与标引的正确性和全面性的主要原因有以下几点: (1)主题分析不正确,析出的主题与实际内容不符。(2)主题分析不充分或无控制,析出的主题少于或多于文件和档案有参考价值的实 际内容。(3)给出的标识符号与主题概念不符,即标识错误或组配错误等。(4)给出的标识太少或过于专指,反之,给出的标识太多或过于泛指。 (5)技术性错误,如著录缺项、写错字、用错标识符等。前四种错

    4、误主要是标引人员的水平不高所致,最后一种错误则主要是工作态度的问题。应针对具体情况采取相应的改进措施。5 . 2 著录的内容与方法5 . 2 . 1 著录项目及各项著录方法根据 档案著录规则 ,文件或案卷的著录应包括以下项目:(1)题名与责任者项题名。包括正题名、并列题名、副题名及说明题名文字。正题名就是文件或案卷的标题。并列题名是文件或案卷以两种语言文字书写的与正题名对照的题名。副题名是指解释或从属于正题名的另一题名。只有当正题名含义不清、不能揭示文件或案卷的主题时,才著录副题名。说明题名文字是指对文件或案卷的内容、范围、用途等的说明文字。一般来说,文件或案卷只要著录正题名即可满足要求。 文

    5、件编号。包括文件字号、年号和顺序号。 责任者。即文件的作者,一般为机关、机关内的某部门或个人乙根据形成文件所负的责任,分为第一责任者和其他责任者。第一责任者是指对文件负有直接责任、主要责任的组织和个人。当只有一个责任者时,作为第一责任者著录。当有两个责任者,且分不清所负责任的主次时,可并列为第一责任者。当有多个其他责任者时,最多著录两个,并加“等”字。对于文书文件来说,收文的责任者为来文单位,发文的责任者为主办单位,会办单位可著录为其他责任者。领导讲话的责任者可著录为领导个人。合同的责任者为甲乙双方。(2)文本项是指文件的稿本,如正本、副本、草稿、定稿、手稿、草图、底图、蓝图等。(3)密级与保

    6、管期限项密级是指文件的机密程度的等级。根据保密法的规定,密级分为绝密、机密和秘密。保管期限应根据保管期限表的要求著录。根据档案法的规定,保管期限分为永久、长期、短期三种。 (4)时间项对于文件,著录文件的形成时间,即文件日期。收发文为发文日期,决议、决定等,为通过或发布日期,条约、合同等为签署日期,报表为编制日期。著录文件日期时,应写清年、月、日。对于案卷,著录案卷内文件的起止日期。(5)载体形态项载体形态项著录文件或案卷载体的物质形态特征,如磁带、磁盘、胶卷等,以纸张为载体的文件是大量的,则可省略该项目。载体形态项还包括数量及其单位、规格及附件情况等。 (6)丛编项是指在一个总题名下,汇集若

    7、干同一类型、统一发布的系列文件,多用于会议文件、从书、从刊稿的著录。(7)附注项著录各个项目中,需要解释和补充的事项,依各项目的顺序著录。一般情况可省略。 (8)提要项是对文件和案卷内容的简介和述评,应力求做到反映主题确切,评述中肯,文字简洁,一般不超过 3 00 字。(9)排检与编号项排检与编号,是目录排检和文书、档案部门业务注记项,是著录的重点。 分类号是标记文件或案卷信息类目的符号,用以表示文件或案卷信息的所属类目在档案分类体系中的位置和顺序。分类号的标引,应严格按“中国档案分类法”进行。 档案馆(室)代号。每一个档案馆或档案室,都应有一个唯一的代号。 档号。它是全宗号、案卷目录号、案卷

    8、号、件号或页号的总称。对于案卷,著录全宗号、案卷目录号和卷号;对于文件,还可加上件号和页号。对于编号的要求是:一个全宗内,不能有相同的案卷目录号,在一份案卷目录内,不能有相同的案卷号,在一份案卷内,不能有相同的页号或件号。缩微号。是文件或档案缩微品的编号井目前,编号的方法还没有统一的规定。主题词。又称叙词。是经过规范化了的词,在标引中用以表达文件或案卷的主题,在检索中,用它构成提问式,以表达检索要求。主题词标引时,应严格按照 中国档案主题词表 选用。在以后的各节中,将着重对分类号与主题词的标引进行详细的介绍。 5 . 2 . 2 著录的来源与工作依据心(1)著录的来源著录的来源是被著录文件或案

    9、卷本身。对于文件来说,主要是文头、文尾,主题词的标引应查阅全文。在管理自动化系统中,案卷的著录过程与文件归档的过程是融为一体的,其来源仍是归入该案卷的文件。如被著录案卷本身材料不足时,可参考其他材料。 (2)著录的工作依据这里所说的工作依据,是指著录工作时应遵循的法律、标准、规则、方法等。如档案法;档案著录规则;中国档案分类法;文献主题标引规则;中国档案主题词表;档案保管期限表;保密法;其他与文书及档案管理有关的法律、规定、标准等。5 . 2 . 3 著录用文字著录用文字必须规范化,应采用标准简化汉字。著录项目中的数字,除题名中的数字按原写法著录外,凡出现在文件编号、时间项、载体形态项、排检与

    10、编号中的数字,一律用阿拉伯数字。少数民族、外文文件及案卷,必须依照少数民族文字和外文书写规则著录。5 . 2 . 4 著录的详简级次著录的详简级次,是指著录时对著录项目的取舍程度。 “档案著录规则”将著录项目分为必要项目和选择项目。对于必要项目,必须著录,不能省略。选择项目,可根据具体情况决定取舍。必要项目包括正题名、第一责任者、时间、分类号、档号、缩微号、主题词等,其他项目均为选择项目。著录的详简级次,分为简要级次和详细级次。凡仅著录必要项目的,称为简要级次。几除著录必要项目外,还著录部分或全部选择项目的称详细级次,各单位可根据实际情况,自行选择详简级次。5 . 2 . 5 管理自动化系统与

    11、手工系统著录方法的主要区别两种系统对于著录的要求是基本一致的,但也有一些区别,特别在处理程序与方法上,有较大差别。 (l)手工系统对文件和案卷进行著录,是在文件归档之后,即在形成案卷之后 ,是“事后著录;而在文书及档案管理自动化系统中,对于文件的著录,是在收到文件或文件形成的过程中,对于案卷的著录,是在案卷的形成过程中 。所以 ,对于自动化管理系统而言,在文书管理阶段,就可利用著录所产生的二次信息。笔者把他称为“实时著录”。 ( 2 )对标准化、规范化要求的严格程度不同。尽管手工系统亦要求著录的标准化、规范化,但人的大脑要比计算机灵活得多,对于某些不很标准和规范的著录信息,亦能分析、判断出正确

    12、的结果。相对来说,计算机是非常死板的,检索的准确完全依赖著录信息的准确、标准与规范。( 3 )在手工系统中,著录信息的贮存方式为著录目录,要编制多种著录目录时,必须重复进行,工作量相当大。在管理自动化系统中,著录信息的贮存方式为数据库。根据这个数据库,可自动组织各种目录,简单、灵活、方便,使目录组织的工作量大为减少。 5 . 3 文件和档案的分类所谓分类,就是把性质上彼此相同的事物组织起来。文件的分类和档案的分类分属两门不同的学科,即文书学与档案学,其分类的方法亦有所区别。5 . 3 . 1 文件的分类对文件进行分类,从不同的角度上观察可以采用不同的分类标准,产生不同的分类结果。文书处理的客观

    13、需要,也不可能仅仅满足于一种分类方法。分类方法的选择,应当以分类的结果对实际工作是否具有指导意义来确定。一般来说,文件分类的依据主要有文件的使用范围、来源、行文关系、内容与性质、密级、时限要求等。如,按行文关系,可将文件分为上行文,平行文和下行文三种。按密级,又可分为保密文件和非保密文件。采用何种方法,应根据本单位的实际情况而定,亦可同时按几种方法对文件进行分类。管理自动化系统要求有统一的文件分类方法和分类方法保持基本稳定。5 . 3 . 2 档案的分类大档案分类的原理来说,可以按照档案的来源、形成时间和内容的异同等形成多种分类方法,如年度分类法、组织机构分类法、时间分类法、作者分类法、地区分

    14、类法、 . 文件名称分类法、问题分类法等,但为了便于档案的利用、便于馆际交流、便于实现,档案管理的自动化,有必要将档案分类体系规范化。“中国档案分类法 ,就是出于这一目的而制定的。 5 . 3 . 3 中国档案分类法 中国档案分类法 是一种规范化了的档案分类语言,是档案部门进行档案分类标引的依据和工具。 ( l )分类原则 中国档案分类法所遵循的基本原则是:以马列主义、毛泽东思想为指导,以国家机构和社会组织活动的职能分工为基础,结合档案内容记述和反映的事物的性质,分门别类,组成科学的体系,适应各个历史时期形成的各类档案分类的实际需要。 ( 2 )体系结构档案的内容涉及到社会实践活动的各个方面,

    15、因此,档案分类表实际上是对整个社会实践活动加以划分 ,并通过划分使其组成一个分门别类的系统 ,这个系统,就是档案分类体系。 中国档案分类法)的体系结构为:将档案分为 3 大部类,即政治、科学文化与经济。在 3 大部类中,根据社会活动的职能分工又划分为 19 大类。其中:属于政治的 6 大类,即中国共产党党务类,国家政务总类,政法类,政协、民主党派、群众团体类,军事类和外交类。属于科学文化的 2 大类,即文化、教育、卫生、体育类和科学研究类。属于经济部类的有 11 大类,即计划、经济管理类,财政、金融类,贸易、旅游业类,农业、林业、水利类,工业类,交通类,邮电类,城乡建设、建筑业类,环境保护、土

    16、地管理类,海洋、气象、测绘类和标准、计量、专利类。 中国档案分类法 由正表和附表组成。正表是档案分类法的主体,它是根据档案分类原则对档案进行从总到分,从一般到特殊的划分后所形成的逻辑清楚、层次分明的展开式排列表。正表的第一层次是 19 大类,以下根据各类档案的具体情况继续划分,以保证分类表的体系简明、条目精炼,便于使用。附表又称复分表。它是把分类表中某些具有共同细分标准的类目从主表中抽出,分别编成总论复分表,地区复分表及若干专类复分表,供主表类目复分时使用。制订附表的目的是为了使整个分类表层次简明、结构清晰,并具有详细分类的功能。正表盒附表联合使用,既可消除分类表类目繁复臃肿现象,又可使其在必

    17、要时得以扩张,从而使分类表结构灵活、富有弹性。 ( 3 )类目档案分类表的类目是一种标志,代表一组具有某种共同属性的档案,它在分类系统中起着信息符号的作用。类目设立的原则是: 以具有一定数量和共同属性的档案的客观存在为依据,每一个类目都是一个“实体” ,代表一组档案。 考虑到人们利用档案的规律,将综合性类目与专指性类目有机结合,以适应各种利用的需要。 类目名称的选择力求科学、准确、概括、简洁。 通过科学地处理类目间的关系来提高分类表的逻辑性和适用性。档案分类表类目间的相互关系可概括为两种,即从属关系与并列关系。类目间的从属关系是通过档案内容的层层细分,即概念的缩小实现的,在分类表中表现为上位类

    18、和下位类的关系。它是一种系统的、族性的关系,是由不同分类层次来反映的。位于高层次的上位类概念概括性较强,专指性较差,位于低层次的下位类概念则概括性较低,专指性较强。类目间的并列关系也就是同位类之间的关系。在档案分类表中,上位类是由下位类组成的,但一个上位类所包括的下位类并不是一个,这样,同一层次中几个下位类之间的关系就是并列关系 。具有并列关系的类目都隶属于同一个上位类 ,具有上位类的基本属性,但它们之间则是互相排斥的,各自具有独立的内容范畴。 ( 4 )符号符号即类目的代号,称为分类号。这种分类标识的作用有两个,一是表征档案的内容,再就是固定各个类目在分类体系中的排列位置。档案分类表采用汉语

    19、拼音字母与阿拉伯数字相结合的号码制,用一个字母标志一本大类,并以字母的顺序反映大类的序列。工业大类的下一级类目也用字母标志,即用双位字母表示其二级类目,并反映其序列。在字母之后,用数字表示其下位类目的划分,即先排字母后的第一位数字,再排第二位,以此类推。数字的位数一般代表类目的级位,即遵循所谓层累制的原则,但同级类目超过 10 个时,该级类目用双位数并在前加一圆点表示。5 . 4 档案的分类标引5. 4 . 1 分类标引的程序与方法档案分类标引的程序一般分为以下几个阶段:(1)分析标题。文件的标题是作者对文件中心内容的概括,一般都能够正确地反映文件的内容和性质。仔细、认真地研究标题对于分类标引

    20、有很大的作用。但也有一些标题不能正确表达文件的中心内容,所以,标题不能作为分类标引的唯一根据。(2)浏览正文。就是将正文粗略地浏览一遍,目的在于了解撰写目的、中心内容,确定文件论说和研究的主题,判断应归入什么类目,提供哪些检索途径。 (3)查阅文件版头和附加标记。党政机关的正式文件都有固定的版头,标明作者、收文机关、文件字号、时间、密级等,有助于明确文件的具体内容、使用范围及参考价值。 (4 )归类。根据文件分析确定的主题,查阅分类表,找到与其确切相符的类目,标引分类号。 )(5)审校。复核文件分类标引是否正确。它是保证标引质量的措施,一般不许采用抽样的方法。标引人员所掌握的知识是有限的,不可

    21、能掌握各个职能部门的所有工作情况,因此,在档案分类时,往往会遇到有些不懂或一个人无法解决的情况,这就要通过查找工具书,集体讨论或请教专家的办法来解决。总之,标引人员要善于学习,在分类工作中要不断总结经验,探索科学方法,逐步地熟悉标引规则。 5 . 4 . 2 归类原则 ( 1 )单主题档案的归类文件或案卷只记录或阐述一个事物或一个问题,称为单主题档案。其归类的一般原则为: 只记录一个事物或一个问题,内容比较专一的单主题档案,一般依其内容的职能性质归类。如:“中共中央关于整党问题的决定”人整党类。 从不同职能或不同方面来记录阐述同一主题的档案,依记录的职能角度归入相应的类。如:“棉花种植”入农业

    22、;“棉花收购”入商业;“棉花加工”入轻纺工业。 论述同一主题的两个或两个以上方面的档案,如果论述的方面是属于同一职能的同一类列,则归入其上位类;如属于不同的职能工作范围,则依档案所论述的主要的职能归类。如:“知识分子入党和提干问题,入组织类。 凡是从几种职能工作角度来综合记录一个主题的档案,按其主要职能归类。如:“工青妇组织和党政部门关心大龄未婚青年”入民政类。 ( 2 )多主题档案的归类记录了两个或两个以上事物或问题的文件或案卷,称为多主题档案。对多主题档案,必须分析其各主题相互之间的关系,包括并列关系、从属关系、因果关系、影响关系、应用关系等等。然后按其中最能代表档案内容本质或起主导作用的

    23、主题的职能归类。多主题档案归类的一般原则是: 诸主题是并列关系的档案,按篇幅多的、重点的或在前的主题归类。如并列主题超过三个以上,又属于同一上位类,则归入其所属上位类,或按重点归类。如:“加强民航保卫工作 ,防止劫机事件发生”入国家安全类; “统战政策与改善党的宣传工作”入党务类。 诸主题是从属关系的档案,内容涉及的职能是上下位的关系,一般归入其上位类,如重点是讲较小主题的档案,则按较小主题的性质归类。如:“档案学与档案编纂学”入档案学研究类; “普及微型机 ,加强微型机软件开发”,重点是讲软件开发,则入微机软件类。 诸主题是因果关系的档案 ,一般按结果的方面归类。如果是论述一个主题多方面后果

    24、的,则按原因的主题归类。如:“从少年开始培养足球人才”入足球运动类; “加强青少年智力开发 ,培养多方面人才”入青少年教育类。 诸主题是影响关系的档案,一般按受影响的方面归类 ;如果是论及一个主题在各方面影响的则依发生影响的主题归类。如: “新技术革命对档案工作的影响”入档案工作类;“新技术革命的影响与后果”入科学技术类。 诸主题是应用关系的档案,按应用到的主题归类 ;但一个主题综合阐述其在各方面应用的情况,则按该主题的职能和特性归类。如:“计算机在档案工作中的应用”入档案工作现代化类 ; “计算机应用”则入计算机类。 诸主题是比较关系的档案,按作者所要阐明的主题归类。如:“发展商业、服务业方

    25、面个体经济与国营经济的比较” ,作者主要说明个体经济在发展商业、服务业方面的作用,所以入个体经济类。对于多主题档案,应根据具体情况来决定以什么主题作为主要类目。5 . 5 主题词、主题词法及主题词表5 . 5 . 1 主题词及主题词法(1)主题词概念主题,是一组具有共性事物的总称,用以巍文件禾口档案所论述和研究的具体对象与问题,也就是文件和档案的中心内容或中心论题。主题词,又称叙词 (即正式主题词),它是经过规范化的词,在标引中用以表达文件和档案的主题概念,在检索中用它组成提问式,以表达检索的要求。它是从文件和档案中概括出来的,表达其主题的最小概念单元。 ( 2)主题词的性质 组配性。主题词具

    26、有组配的功能。组配,就是标引和检索时,通过主题词的逻辑组合来表达描述文件或档案中心内容的主题。在实践中,多数主题都是用两个或两个以上的主题词的概念组配来进行标识的。主题词经过组配后,能够得到外延很小、内涵很深的专指主题,并扩大了检索途径。 规范性。主题词是从自然语言中精选出来的,要求词与概念一一对应,并有确定的唯一的含义。 直观性。主题词使用自然语言中的词汇,标识比较直观,按字顺或音顺排列,序列比较明确,便于标引和查找。 可控性。主题词法根据对主题词使用频率的统计,可对主题词表进行调整。一方面删除(合并)使用频率过低、检索意义不大的主题词;另一方面分化使用频率过高、检索负担过重的主题词,使现行

    27、主题词都有一定的使用价值,达到控制词汇数量,避免文献分散的目的。 上机性。由于主题词标识是组配的,比较灵活,在检索中可采用布尔代数表达用户检索提问和进行逻辑运算,因此将主题词法应用于自动化系统,可以比较充分地发挥管理自动化系统的特长。 动态性。主题词可随着事物的发展变化和人们认识水平的提高,不断进行修订,以保持其现代水平和实用价值,因而对新事物、新的职能工作具有较强的反映能力。 ( 3 )主题词法主题词法是以主题词作为标识符号,并依据一定的原则,标引文件或档案的主题概念和查找文件或档案的一种方法。主题词法的基本原理是单词组配、概念组配和规范化。所谓单词组配,就是将单个的主题词依据一定的原则组配

    28、到一起,以表达文件或档案的主题。单词组配所依据的原则,就是概念组配的原则,即几个相互组配的主题词之间,在概念上必须有某种逻辑关系或语法关系,其实质是概念的分析与综合。 5 . 5 . 2 主题词表 ( l )主题词表的概念把主题词按照一定的规则(如字顺、音序、万类范畴、词族关系)排列起来,即构成主题词表。主题词表,又称叙词表。它是将文献标引人员或利用者的自然语言转换成规范化的检索语言的一种术语控制工具,是概括各种或某一职能活动并由语义相关、族性相关的术语组成的规范化的动态检索词典。是标引、存贮及检索各方面都必须共同遵守的检索语言的工具,目的是规定共同的词汇和法则,以便达到不同人员标引同一文件或

    29、档案内容的一致性以及描述文件或档案内容的语言(标引语言)与查找文件或档案内容的语言的一致性。 中国档案主题词表 是一部由反映档案内容的规范化词目组成的词典,是档案著录中主题词标引和进行检索的词语控制工具。文书、档案部门在进行主题词标引时,必须按 中国档案主题词表 所列正式主题词选用。 中国档案主题词表 所包含的词汇量比较大,将这些词汇全部输入微型计算机进行管理,难度是相当大的,对于一般单位来说,也没有这个必要。因为大部分单位在工作过程中所形成的文书和档案涉及的主题范围都是较窄的,一般有数百至数千个主题词即可满足著录的需要。为了工作方便,各单位应在中国档案主题词表 的基础上,根据本单位的工作特点

    30、,将主题词表缩小,建立本单位的专用主题词表。 ( 2 )专用主题词表的建立与管理 成立专门机构或指定专人负责。 收集词汇。词汇的基本来源是中国档案主题词表,对于极少数 中国档案主题词表 中没有的专业词汇,可参考其他专业的主题词表、分类表、专业词汇表、重要文件以及工作中积累的词汇,但自选词汇不宜太多,并且,自迭词汇一般只限在对本单位的内部文件进行标引时采用,对上级和外单位的文件不能用自选词汇进行标引。 规范化处理。对于从 中国档案主题词表 选取的词汇,可直接列入专用主题词表,对于自选词汇,应按要求对所收集的词汇进行优选。 建表。将选定的主题词进行分类,赋予每一个主题词一个编码,并利用建表功能,将

    31、这些主题词和相应的编码输入计算机。 经常对主题词的使用情况进行检查(主要是词频统计),增加必要的主题词,删除使用频率过低的主题词。5 . 6主题标引主题标引是文件和档案在加工、存贮和检索过程中,将其内容主题的自然语言转换成规范化的主题词法检索语言的过程。在管理自动化系统中,主题标引的目的是建立数据库,以供贮存和检索之用,它是利用者与文件和案卷之间联系的重要桥梁。5 . 6 . 1 主题标引的程序与方法 ( 1 )文件和档案的审读这是标引过程的首要步骤,其目的在于了解和判断文件和档案所论述的中心内容和研究对象,进而确定文件和档案的主题。审读文件和档案时,通常依据文件档案的标题,以及所附的文摘、简介、前言、结论、领导人批语或修改意见以及文中的目次、图表、数据等内容;必要时应该浏览全文。切忌仅依据标题进行主题分析。 ( 2 )了解主题的类型与结构所谓主题,是文件与档案记录和阐述的中心问题,也就是想要传达给利用者的文件与档案记录的中心内容。主题的类型,依据文件与档案内容可分为单主题和多主题两种。单主题指一份文件与档案只研究和论述一个问题。如福州地区实行农业生产责任制的调查报告 。又如:日本钢铁、汽车和计算机工业发展趋势研究 。标引时,单主题可用一个专指主题词或几个主


    注意事项

    本文(文档一体化系统的数据准备著录与标引.docx)为本站会员主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2022 冰点文档网站版权所有

    经营许可证编号:鄂ICP备2022015515号-1

    收起
    展开