网上购物系统中数据库与数据仓库的比较分析
梁爽
辽宁大学信息学院,沈阳(110036)
E-mail:elevenandeleven@163
摘要:近年来,人们利用信息技术生产和搜集数据的能力大幅度提高,大量的数据库被用于商业管理、政府办公、科学研究和工程开发等。但是,在信息爆炸的时代,信息过量成为人人需要面对的问题。如何从信息的汪洋大海中及时发现有用的知识或者规律,从而提高信息利用率呢?要想使数据真正成为一个决策资源,只有充分利用它为一个组织的业务决策和战略发展服务,否则大量的数据可能成为包袱,甚至成为垃圾。本文对数据库及数据仓库技术进行了介绍,并着重将两者进行了比较,通过对网上购物系统功能平台的研究,分析了数据库及数据仓库在数据信息处理中的异同,从而达到让网上购物更加成熟,更方便的服务用户的目的。
关键词:网上购物;数据库;数据仓库
林永健主演的电视剧
1.引言
随着网络技术的日趋成熟,网上购物越来越多的商家在网上建起在线商店,向消费者展示出一种新颖的购物理念。网上购物系统的建设为商业零售企业提供信息化管理方式。网上购物中信息量的增大和复杂程度的加深使得传统的数据库技术已经渐渐不能满足商家在决策及预测方面的要求。数据仓库概念提出后,在不到几年的时间内就得到了迅速的发展。
当今世界,几乎所有国家都已经成为统一的世界大市场的有机组成部分。可以说,经济的全球化、全球的信息化和社会的网络化已经成为人类社会发展的总趋势。而随着网络的发达和交通工具的发展,网上购物为越来越多人们的人们所接受。网上购物的普及加大了人们购物前后及购物过程中的信息处理要求,商家们希望的不仅仅是能够记录交易信息的数据,更加需要在大量数据和经过长时间交易后数据所显示的综合信息和隐含特征。所以,较早期间的数据库技术已经不能满足企业及个人对数据处理的要求。随着决策分析的需求扩大,兴起了支持决策的数据仓库。它是以决策主题需求集成多个数据库,重新组织数据结构,统一规范编码,使其有效地完成各种决策分析。
2.数据库和数据仓库
2.1数据库
2.1.1数据
数据是数据库中存储的基本对象。[1]数据在大多数人头脑中的第一个反映就是数字。其实数字只是最简单的一种数据,是数据的一种传统和狭义的理解。广义的理解,数据的种类很多,包括文字、图像、图形、声音、语言等。可以对数据做如下定义:描述事务的符号记录称为数据。[1]
2.1.2数据库
数据库(DataBase,DB),顾名思义,是存放数据的仓库。这个仓库将数据按照一定的格式存放在计算机的存储设备上。
严格地讲,数据库是长期存储在计算机内、有组织的、可共享的大量的数据的集合。数据库中的数据按一定的数据模型组织、描述和储存。具有较小的冗余度、较高的数据独立性
和易扩展性,并可为各种用户共享。[1]
处理库存2.1.3SOL语言
SQL是英文Structured  Query  Language的缩写,意思为结构化查询语言。SQL语言的主要功能就是同各种数据库建立联系,进行沟通。按照ANSI(美国国家标准协会)的规定,SQL被作为关系型数据库管理系统的标准语言。SQL语句可以用来执行各种各样的操作,例如更新数据库中的数据,从数据库中提取数据等。
目前,绝大多数类型的关系数据库管理系统,如Oracle、Sybase、Microsoft、SQL Sever、Access等都采用了SQL语言标准。虽然很多数据库都对SQL语句进行了再开发和扩展,但是包括Select、Insert、Update、Delete、Create以及Drop在内的标准的SQL命令仍然可以被用来完成几乎所有的数据库操作。
2.2数据仓库
2.2.1什么是数据仓库
数据仓库和数据库只有一字之差,似乎是一样的概念,但实际则不然。
河南风味小吃
数据仓库(Data Warehouse, DW)是信息领域中今年来迅速发展起来的数据库新技术。数据仓库的建立,能充分利用已有的数据资源,把数据转换为信息,从中挖掘出知识,提炼成智慧,最终创造出效益。
数据仓库之父Bill Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受——数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-V olatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。[2]
2.2.2从数据库到数据仓库
由数据库(DB)发展到数据仓库(DW)主要在于如下几点:[1]
z数据太多,信息贫乏(data rich, information poor):随着数据库技术的发展,企事业单位建立了大量的数据库,数据越来越多,而辅助决策的信息缺很贫乏,如何将大量的数据转化为辅助决策信息成了研究的热点。
z异构环境数据的转换和共享:由于各类数据库产品的增加,异构环境的数据也随之增加,如何实现这些异构环境数据的转换和共享也成了研究的热点。
z利用数据进行事务处理转变为利用数据支持决策:数据库用于事务处理,若要达到辅助决策,则需要更多的数据。例如,如何利用历史数据的分析来进行预测。对大量数据的综合得到宏观信息等均需要大量的数据。
2.2.3数据仓库的特点
根据数据仓库概念的含义,数据仓库拥有以下四个特点:
①面向主题。操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库
中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。
②集成的。面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上
经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。
③相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓
库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。
④反映历史变化。操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据
通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
天上飞歌词
企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基础。数据仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者,供他们做出改善其业务经营的决策,信息才能发挥作用,信息才有意义。而把信息加以整理归纳和重组,并及时提供给相应的管理决策人员,是数据仓库的根本任务。因此,从产业界的角度看,数据仓库建设是一个工程,是一个过程。[2]
2.2.4数据仓库的数据处理工作
计算机系统中存在这两类不同的数据处理工作:操作型处理和分析型处理,即OLTP(联机事务处理)和OLAP(联机分析处理)。
ⅰ联机事务处理(on line transaction processing,OLTP)
联机事务处理是在网络环境下的事务处理工作,利用计算机网络技术,以快速的事务相应和频繁的数据修改为特征,是用户利用数据库能够快速地处理具体的业务。OLTP是事务处理从单击到网络环境发展的新阶段。[4]
OLTP的特点在于事务处理量大,但事务处理内容比较简单且重复率高。大量的数据操作主要设计的是一些增加、删除、修改、查询等操作。
在过去的三十多年中,OLTP系统发展的目标就是能够处理大量的数据。每时间单位能够处理更多的事
务,能支持更多的并发用户,且有更好的系统健壮性。
ⅱ联机分析处理(on line analytical processing,OLAP)
关系数据库之父E.F.Codd在1993年认为,联机事务处理已经不能满足终端用户对数据库决策分析的需要,决策分析需要对多个关系数据库共同进行大量的综合计算才能得到结果。为此,他提出了多维数据库和多维分析的概念,即联机分析处理概念。
OLAP专门用于支持复杂的分析操作,侧重对分析人员和高层管理人员的决策支持,可以应分析人员的要求快速、灵活地进行大数据量的复杂处理,并且以一种直观易懂的形式将查询结果提供给决策指定人,以便他们准确掌握企业(公司)的经营情况,了解市场需求,制定正确方案,以增加效益。OLAP软件以它先进的分析功能和以多维形式提供数据的能力,正作为一种支持企业关键商业决策的解决方案而迅速崛起。
2.3数据库与数据仓库对比
往国外寄东西用什么快递从数据库到数据仓库的演变,体现了以下几点。[3]
z数据库用于事务处理,数据仓库用于决策分析
事务处理功能单一,数据库完成事务处理的增加、删除、修改、查询等操作。决策分析要求数据较多。数据仓库需要存储更多的数据,不需要修改数据,主要提取综合数据的信息,
以及分析预测数据的信息。
数据库保持事务处理的当前状态,数据仓库既保存过去的数据又保存当前的数据
z数据库中数据随业务的变化一直在更新,总保存当前的数据。数据仓库中数据不随时间变化而变化,但保留大量不同时间的数据,即保留历史数据和当前数据。
数据仓库的数据是大量数据库的集成
z数据仓库的数据不是数据库的简单集成,而是按决策主题,将大量数据库中数据进行重新组织,统一编码进行集成。数据仓库的数据量比数据库的数据量大得多。
对数据库的操作比较明确,操作数据量少。对数据仓库操作不明确,操作数据量大一般对数据库的操作都是事先知道的事务处理工作,每次操作(增加、删除、修改、查询)涉及的数据量也晓。对数据仓库的操作都是根据当时决策需求临时决定而进行的。
表1 数据库与数据仓库对比
数据库数据仓库
面向应用
数据是详细的
保持当前数据
数据是可更新的
罗敏庄
对数据操作是重复的
操作需求是事先可知
一个操作存取一个记录
数据非冗余
操作比较频繁
查询的是原始数据
事务处理需要的是当前数据很少有复杂的计算
支持事务处理面向主题
数据是综合的或提炼的
保存过去和现在的数据
数据不更新
对数据的操作是启发式的
操作需求是临时决定的
一个操作存取一个集合
数据时常冗余
操作相对不频繁
查询的是经过加工的数据
决策分析需要过去、现在的数据很多复杂的计算
支持决策分析
3.网上购物系统
3.1网上购物的发展趋势
网上购物最经单的应用案例应该说是美国的亚马逊(Amazon)书店,该书店在网上销售250万种左右的图书。短短的两年时间内,就由一个无名的小网站,发展成为全世界最大的书店。Amazon的巨大成功,在全世界形成巨大的冲击波,掀起了全世界的浪潮。[4] 我国第一家网上购物发生在1996年,燕莎友谊商场首次通过网上商城售出一个景泰蓝,虽然货款的支付不是在网上进行的,但这毕竟为我国零售业奏出了网上购物的先声。根据CNNIC的统计结果,截止2004年1月中国有互联网用户7950万人,而又有40.7%以上的网民在过去的一年里有过网上购物经历,这就说明中国有网上购物的用户达是3235.7万人,并且这一数字还在以17%左右的速度增长,预计到2006年中国网上购物用户将达到6962万人,艾瑞市场咨询公司数据也显示:2001年中国网络购物用户数仅为208万人,到2005年中国网络购物用户数高达1855万人,复合增长率高达72.8%。这都说明了在中国发展网上购物具有良好的众基础,网上购物方式日趋被大家所接受。
未来5年之内中国网上购物市场的用户数量将会进一步增长。各项环境的改善,使网络购物的优势进一步凸现,交易额也将有较大的提高。预计到2010年中国网上购物市场市场的用户数将达到7400万人,交易额将可能达到1800亿元。随着互联网的发展,网上购物这一新型消费方式和购物观念也在逐步深入人心。
3.2网上购物系统平台功能
能够完成用户基本信息录入的注册和用户基本信息的个人前台与后台管理。
能够完成管理员对网站的商品资料(添加大类、添加小类、商品添加、商品审查)、商品交易(外理订单、发货查询)、会员管理(会员审查)、操作管理(管理员添加、管理员审查、管理员退出)的功能。
能过电子商品的名称,电子商品的分类进行搜索。
能够通过查看购物车对所选商品进行确定、挑选,通过定单查询对支付费用进行确定。
图1网上购物系统平台总体模块