信息资源5
发布日期:2021-09-08 22:54:50 浏览次数:6 分类:技术文章

本文共 3279 字,大约阅读时间需要 10 分钟。

第四章 信息资源内容管理

信息需求 信息采集 信息存储与检索 信息加工与分析 知识管理 信息传递与共享

信息采集 

  信息源 信息源类别 文献分类

  信息采集原则 目的性系统性 及时性经济型 计划性 可靠性 预见性

  信息采集方法 定向 定题 定点 主动 跟踪 社交 现场 委托 间谍

  信息采集途径 内部途径 外部途径

信息源的类型 

以组织边界为界线 内部信息源 外部信息源

根据信息是否被记录 记录型信息源 非记录型信息源

根据信息是否数字化 数字化信息源  组织内部各种信息系统 专业数据库 数字出版物

                                 非数字化信息源

根据载体的形式 印刷型  缩微型 机读型  声像型

根据出版形式  图书 连续性出版物 特种文献

2. 文献的分类及特点

根据文献内容,性质及加工情况 

一次文献:期刊论文 研究报告 专利说明书 会议论文

二次文献:书目 题录 简介 文摘等检索工具

三次文献:综述 专题述评 学科年度报告 进展报告 数据手册

1.信息采集的原则

目的性 明确的目的性

系统性 时间上连续,空间上广泛

及时性 反映当前社会的现状

经济性 考虑投入产出比

计划性满足当前需求 兼顾未来发展

可靠性 坚持调查研究

预见性 有超前性

1.信息采集的方法

网络上的信息资源的自动采集要依靠搜索引擎技术和链接分析技术

链接流行度的原理是,一个网页拥有的反向链接越多,就越有可能是高质量网页,不然也不会有更多人愿意

为其做链接。

定向采集法 在采集计划范围内,对某一学科、某一国别。某一特定信息尽可能全面,系统的进行采集。例如:

监听电台信号

定题采集法:根据用户指定的范围内,对某一学科,某一国别,某一特定信息尽可能全面,系统的进行采集。

例如:监听电台信号

定题采集法 根据用户指定的范围或需求有针对性的采集信息。例如:生物多样性专题调查。

定点采集法:聘请专门的信息采集人员定点采集相关信息资源,例如:交通路口摄像头

主动采集法:针对特定需求或根据采集人员的预测,事先发挥主观能动性,赶在用户提出要求之前即着手

采集工作。例如:春运

跟踪采集法:根据需要对有关信息资源在一段时间内进行动态监视和跟踪,及时采集出现的一切新情况,信息系,例如;:

犯罪案件

社交采集法:如参加各种会议。旅游 舞会 聚会 走亲访友 娱乐 网络 交流等,例如:国际会议。

现场采集法:参加展览会,展销会,订货会,科技成果展示会,交易会,现场会,参观访问等,

委托采集法:委托某一信息机构或信息人员采集,根据采集的质量支付一定费用。

间谍采集法:利用间谍窃取所需信息的方法。

1.信息采集的途径

内部途径 管理部门 咨询与政策研究部门 内部信息部门 研究开发部门 

外部途径 文献部门 大众传播媒介 学会与协会等团体 各种会议 政府部门 个人交往与观察 用户与消费者

1.信息存储的作用

方便检索 延长寿命 利于共享 方便管理

统一性 便利性 有序性 先进性 

信息的存储形式应该在全国甚至全世界范围内保持一致,要求信息遵守相关的国家标准或者国际标准;

3.信息存储的主要技术

缩微存储 存储信息密度高。存储方法简单,成本低。保存期长,忠实于原件,不易出错;(胶片)

按检索的内容分 文献检索 事实检索 数据检索 

基于电子文档 全文检索 多媒体信息检索

全文检索 1 是搜索引擎的核心技术 2.检索对象:文本信息

多媒体信息检索:多媒体信息检索是基于内容的检索,直接对图像,音频 视频等多媒体信息进行分析 抽取特征和

语义,建立索引,然后进行检索。

2.信息检索的基本程序

确定检索范围和深度->选择检索工具->选择检索途径->选择检索方法->实施信息查找->调取信息资料

信息加工与分析 

信息加工 筛选判别 分类排序 著录标引 

信息分析 定性分析 定量分析 逻辑分析 文献计量学

数据挖掘 关联分析 决策树 粗糙集,人工神经网络 遗传算法 归纳学习

1. 信息加工 信息加工:就是指将采集来的大量原始信息进行筛选和判别,分类和排序计算和研究,著录和标引,编目

和组织从而使之成为二次信息的活动。

2.信息筛选和判别的基本程序:

信息整理->浏览审核->再次审核

信息筛选和判别的基本方法 感官判断法 分析比较法 集体讨论法 专家裁决发,数学核算发 现场核实法

3.信息分类和排序

确定分类方法->实施信息分拣->进行信息排序

信息的著录是指按照一定的标准和格式,对原始信息的外表特征(如名称 来源 加工者)和物质特征(如载体形式等)

进行描述并记载下来的活动

做好前期准备工作 确定信息著录格式 加注标识符号

4.信息著录标引

信息的标引是指对著录后的信息载体按照一定规律加注标识符号的活动过程。

选择和熟悉分类表 进行主题分析 归入最恰当的类 审校

信息分析

信息分析是指以社会用户的特定需求为依托,以定性和定量研究方法为手段,通过对信息的整理,鉴别 评价 分析 综合

等系列化加工过程,形成新的,增值的信息产品,最终为不同层次的科学决策服务的一项具有科研性质的智能活动。

2.信息分析非方法

定性分析:综合法 对比法 相关法,因果法

综合法 来源 ,内容归纳汇集

对比法:两种 辨别优劣

相关法:已知推位置

因果法 因果关系

定量分析 文献计量分析法:文献量与发展的关系

插植法:内插外推

回归分析法:回归方程

决策分析法:运筹学;动态规划 决策树

预测分析法:概率论,时间序列分析

3. 文献计量学方法

文献计量学:是以文献体系和文献计量特征为研究对象,采用数学 统计学等计量方法,研究文献情报的分布结构,数据关系

变化规律和定量管理,并进而探讨科学技术的某些结构,特征和规律的一门学科。

计量对象:文献量

信息分析

文献计量学方法

文献计量学:是以文献体系和文献计量特征为研究对象,采用数学,统计学等计量方法,研究文献

情报的分布结构,数量关系,变化规律和定量管理,并进而探讨科学技术的某些机构,特征和

规律的一门学科。

计量对象:文献量(出版物,期刊 引文)

作者数(个人集体或团体)

词汇数(文献标识,叙词居多)

3.文献计量学方法

科学文献增长与时间成指数函数关系 普赖斯曲线

普赖斯指数:在某一个知识领域内,把对年限不超过五年的文献引文数据与引文总量之比当做指数,用以

量度文献的老化速度和程度。

普拉斯指数=被引文献数量(<= 5年)/被引文献总量*100%

网络计量学:应用文献计量学及信息技术,对网上信息的组织,存储,分布 传递 相互引证和开发利用等

进行定量描述和系统分析,以揭示其数量特征和内在规律。

4.数据挖掘

 是从大量的,不完全的,有噪声的,模糊的,随机的实际应用数据中,提取隐含在其中的,人们事先不知道的

但又是潜在有用的信息,和知识的过程。

数据挖掘方法和技术手段

关联分析 挖掘隐藏在数据间的关系;

决策树:树形结构表示分类和决策;

粗糙集: 研究不确定知识的归纳方法;

人工神经网络:非线性预测模型,模式识别;

遗传算法 基于进化理论,自然选择;

归纳学习: 大量数据中归纳出规则和模式;

1 知识管理 :是对知识。知识创造过程和知识的应用进行规划和管理的活动。

组织知识管理

包括:建立知识库;促进员工的知识交流,

 

个人知识管理

 

3.信息传递任务

1. 信息发送处理:信息编码和信息压缩技术

2. 传递处理:调制解调和信息加密

3. 接收处理: 信息还原和解密

4.信息共享的渠道

按信息提供者区分,按信息提供方式区分,按信息传递技术区分

5.信息共享技术

信息传递技术 信息存储技术 信息安全技术 信息标准化,信息定位和描述技术 信息转换技术 信息融合技术

信息标准化是信息共享的前提,信息定位和描述技术是查找和获取信息的依据

产生异构问题的原因:

计算机操作熊类型的差异

网络协议标准的差异

数据格式和标准的差异

语言文化的差异

 

转载于:https://www.cnblogs.com/simadongyang/p/10190133.html

转载地址:https://blog.csdn.net/weixin_34341229/article/details/93352365 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:Log4Net 添加自定义字段并保存到数据库
下一篇:html5-css的引入

发表评论

最新留言

很好
[***.191.171.22]2022年08月18日 10时11分39秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

最新文章

msck repair error 2019-12-12 23:02:29
Python代码规范与结构 2019-12-12 23:02:27
算法的时间复杂度与空间复杂度 2019-12-12 23:02:27
python并发与并行 2019-12-12 23:02:28
Power BI数据源之web 2019-12-12 23:02:28
python之logger 2019-12-12 23:02:26
python之爬虫 2019-12-12 23:02:27
Python读取配置文件之python2与python3的区别 2019-12-12 23:02:27
Hive SQL优化 2019-12-12 23:02:26
Python代码审查 2019-12-12 23:02:26
神经网络常见激活函数(包含tensorflow2的api) 2019-12-12 23:02:26
tensorflow2之数据管道Dataset 2019-12-12 23:02:25
tensorflow2之数学运算 2019-12-12 23:02:25
如何构建指标体系--笔记 2019-12-12 23:02:25
LaTeX数学表达式 2019-12-12 23:02:25
tensorflow2之切片 2019-12-12 23:02:25
AirFlow之安装 2019-12-12 23:02:24
实时数据同步 2019-12-12 23:02:24
数据库概况查阅 2019-12-12 23:02:24
hive metastore为MySQL时的中文乱码问题 2019-12-12 23:02:24