信息加工

1.什么是信息加工

信息加工是对收集来的信息进行去伪存真、去粗取精、由表及里、由此及彼的加工过程。它是在原始信息的基础上,生产出价值含量高、方便用户利用的二次信息的活动过程。这一过程将使信息增值。只有在对信息进行适当处理的基础上,才能产生新的、用以指导决策的有效信息或知识。

2.信息加工的内容

一般来说,信息加工的内容包括以下三个方面:

(1)信息的筛选和判别:在大量的原始信息中,不可避免地存在一些假信息和伪信息,只有通过认真地筛选和判别,才能防止鱼目混珠、真假混杂。

(2)信息的分类和排序:收集来的信息是一种初始的、零乱的和孤立的信息,只有把这些信息进行分类和排序,才能存储、检索、传递和使用。

(3)信息的分析和研究:对分类排序后的信息进行分析比较、研究计算,可以使信息更具有使用价值乃至形成新信息。

3.信息加工的注意事项

信息加工过程要注意以下两点:

(1)信息加工要善于运用创造性思维,对信息内容进行定性分析和定量分析,从中找出本质的规律性的东西。如果只局限于情况介绍、数据罗列,这种信息加工的作用很小。

(2)在信息加工过程中,要实事求是地对信息进行加工整理,切忌主观臆断,把不同时间、不同空间、不同性质的信息硬性拼凑,造成信息失真;切忌人为地加以夸大、缩小或在加工中使客观事物变样。

4.信息加工方式

从不同的角度,信息加工方式有各种不同的划分。

1.按处理功能的深浅分

按处理功能的深浅,可以把信息加工分为预处理加工、业务处理加工和决策处理加工三类方式。第一类是对信息简单整理,加工出的是预信息。第二类是对信息进行分析,综合出辅助决策的信息。第三类是对信息进行统计推断,可以产生决策信息

数据加工以后成为预信息或统计信息统计信息再经过加工才成为对决策有用的信息。这种转换均需要时间,因而不可避免地产生时间延迟,这也是信息加工的一个重要特征——滞后性,在使用中必须注意这一点。信息的滞后性与信息的时效性是有矛盾的,信息工作者要认识信息的滞后性,尽量减少以至消除滞后性对时效性的制约和影响。

2.按处理的响应时间分

按处理的响应时间的不同,信息加工的方式又可分为两种类型:

(1)一种是将送过来的数据立即进行处理,即时做出响应的“实时处理型”。一般实时处理系统只允许处理已确定的工作,只限于面向常规的作业业务,这是为了保证响应的及时性。

(2)另一种是将送过来的数据存起来达到一定数量或时间后,再集中处理的“批处理型”。这种处理方式适用于以下两种统计分析业务:如果不搜集一定数量的必要数据,就没有什么处理意义和效果;没有必要急于得到处理结果。

从目前的发展来看,信息加工正从批处理形式向联机处理形式发展,从事后处理为中心向实时处理发展。

3.按系统与用户之间的距离分

按系统与用户之间距离的远近,信息加工方式可划分为远程处理方式和局域处理方式。远程处理是指用户不必去信息中心,而通过通信线路使用远处的计算机进行处理的方式。实际上远程处理是一种远距离的联机处理方式。因为除了终端和通信控制器以外,它和批处理方式完全一样。与远程处理相反,局域处理是指在放置计算机的地方使用计算机的方式。事实上,只有在区分远程处理和局域处理的场合,才较多地使用这个概念,即在计算机网络中分布在各处的计算机各自进行处理的方式就叫做局域处理。

4.按企事业单位的管理和计算机配置分

按企事业单位的管理和计算机配置,信息加工处理的方式可分为集中式和分布式。集中式是将计算机放在单位机关等指定地方,由中心计算机集中承担处理功能和处理量;分布式是以统一的规划为基础,将适当规模的计算机系统安装在单位机关及其下属单位,分别承担处理功能和处理量。选择集中式还是分布式的时候,要考虑企业的各种内部和外部条件。

5.按是否运用计算机分

传统的信息加工主要是通过人脑进行,随后相继出现了手工设备和计算机。也就是说,进行信息加工一般有手工加工和计算机加工两种方式。采用手工管理方式进行信息加工,不仅繁琐、容易出错,而且其加工过程需要很长时间,已经远远不能满足管理决策的需要。计算机、人工智能等技术的不断发展和应用,大大缩短了信息加工时间,满足了管理者的决策需求,同时人们也从繁琐的手工管理方式中摆脱了出来。

计算机信息加工就是利用计算机进行数据处理,而且在处理过程中,又大量采用各种数学模型。这些模型的算法往往是相当复杂的,常常包含大量的迭代和循环。不过现在已经有许多可供选择的软件包,如统计软件包、预测软件包、数学规划软件包、模拟软件包等。

以前在管理工作中,多数是靠管理者的经验来加工信息,需要的少数运算也只局限于简单的算术运算和简单的统计加工。近年来,数理统计中的许多方法、运筹学中的许多方法随着管理现代化的进展,已进入了经济管理领域。尤其现代统计学方法与信息加工的关系日益密切,作为信息加工的一个基本工具,现代统计学方法将发挥越来越重要的作用。 现在许多大的计算机数据处理系统一般备有三个库,即数据库、模型库和方法库。一般地,模型库是核心,数据库为它提供必要的信息,而方法库为它提供相应的方法。方法库中备有许多标准的算法,而模型库中存放了针对不同问题的模型,数据库中备有要用的数据。其中,模型与方法二者既有联系又有区别,模型是在管理学的理论和实践的基础上提出的,反映了在管理工作中各种因素间的定量或定性的相互关系,它是描述本领域中的具体规律的;方法则是指一定的数学计算方法(例如,回归分析方法、趋势外推方法、博弈方法等),它是独立于管理学之外的。因此,模型可以使用各种方法,同一种方法也可以为多个模型所使用。从应用的角度看,模型是实质性的内容,而方法则是工具。

5.信息加工方法

针对不同的处理目标,支持信息加工的方法很多,概括起来可分为五大类:统计学习方法、机器学习方法、不确定性理论、可视化技术和数据库技术。

  • 机器学习方法
  • 可视化技术
  • 不确定性理论
    • 贝叶斯网络
    • 模糊逻辑
    • 粗糙集理论
    • 证据理论
    • 灰色理论
    • 可拓理论
  • 数据库/数据仓库技术
    • 面向数据集方法
    • 面向属性归纳
    • 数据库统计
    • 数据挖掘技术
    • 数据仓库技术
    • 联机分析技术

选择什么信息加工方法取决于问题本身,但实践证明很难判断这些方法的优劣,且处理结果对数据集的依赖程度很高。针对给定的数据集和给定的目标,到目前为止尚没有公认的标准选择恰当的信息加工方法。在实际应用中,信息加工往往是集成多种方法来实现的。

特别值得一提的是,统计学研究以往主要集中于预定假设的检验和数据的模型拟合上,所用方法的依据通常是概率模型。目前,统计学的焦点已逐步从模型估计转移到模型选择上来,不再只是寻找最佳的参数值,而是把模型的结构也作为搜索过程的一部分,这种趋势非常适合信息处理的目的。现代统计学方法与信息加工的关系日益密切,作为信息加工的一个基本工具,统计学方法正在发挥越来越重要的作用。