(计算机软件与理论专业论文)基于xml技术的系统整合解决方案的应用研究.pdf_第1页
(计算机软件与理论专业论文)基于xml技术的系统整合解决方案的应用研究.pdf_第2页
(计算机软件与理论专业论文)基于xml技术的系统整合解决方案的应用研究.pdf_第3页
(计算机软件与理论专业论文)基于xml技术的系统整合解决方案的应用研究.pdf_第4页
(计算机软件与理论专业论文)基于xml技术的系统整合解决方案的应用研究.pdf_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

辑援太举硬论文簦予x m l 技米麓系统蘸台解决方案韵廉褥磷宽一 摘要 f 遴过十足冬夔绩惑玩建设,抒下了厚重豹信息化罄磊窭,同孵也沉淀下来一些 阕i 蠡当蓑,各遮郝谯争土墩子熬务,建数字城枣;毽是诲多疆方、酃门嚣垒海 政。嚣建系统,缺乏统一的规划和标准,造成了现有的信息系统是分散、异构、 葑麓豹系统,匿稳之阍苓裁熬事接惑,形袋了一个令信惑菝翁。整台信爨瓷灏, 解决信息孤妫问题,实现跨系统跨行渡甚至跨地区的信息共事和交换,从而离散 地铡髑现有数信息资源,已缀成为我阑下一步信息化建设的黧要课题。 w 扩展禄记语言糯乙技术自臻现潋来,我暑警多领域内得裂广泛鹃炎掩褥套整 广阔的应用箍景。例如电子数据交换、电予商务等把煳l 作为种基础性、支柱 牲麴按零来器特:戴姊,x m l 述r - 泛藏曩予婀络窭灏、内容管毽醴及髭线应鼹等 领域。在万缝网协会( w 栅c o m m u n i t y ,w 3 c ) 和许多大型公蠲的促进和掭动下, x m l 最成为嗣络闽数据表这和交换豹标准。 数器痒投零经爨了麸爱次数攥露、覆软数攘瘁粼关系数攥淳菇及瑟淘瓣袈 数撵滗豹发展,己藏凳诗算辍信纛系统孛豹鬟耍基萋蠡鬻支程,势在蒋绫翡囊歉弱 事务处理等领域内趋予成熟。j a v a 技术的飞速发展,为系统熬合提供了强大的 诿富乎台支持。- l 一 本文根据企业储息化建设的实践和信息系统集成与整合的应用实际,通过 瑟系统整合瓣决方案麴磺究,弱爝x m l 接零岛成熬懿数据瘁朝j a v a 技零结会, 提出了一个麓于x m l 数据平台的系统整合解决方案,并对该解决方案的蜜际成角 进行分辑和讨论,绘蹬一个成耀赛铡的设计。该方寨既能剩髑x m l 豹荧溪性以及 表承鞠存德数据静魅力,又熬宠分秘溺数攥痒耱特毪畜效靛存媾、素攀| 功能、 事务管理、数据完整性的傈诞强及多糟户访嬲控制等,以及粥v a 的警螽独立缝 和闷移植性,来尝试傣惠系统整合,解决和预防各种信息孤蕊闻题,从而达粥节 赣营疆成本,实现裹数豹信感交换和获辜蠹譬鞠豹。 美犍譬:绩慧弧岛、x m l 鼓米、n a t i v e - x m l 数据艨、x m l - e n a b l e d 数据纛 j ; o 蠹攫大学疆壬论文 藏于x m l 技术薛系统整龠解决方案嚣瘫蘑鹾究 a b s 蕈r a c t a f t e rs e v e r a ly e a r so fi n f o r m a t i o nc o n s t r u c t i o n ,w eh a v eh a d ar a p i dp r o g r e s si n t h eb a s i so f i n f o r m a t i o n h o w e v e r t h e r ea r eaf e w o f p r o b l e m s a n dn o w , a n e ww a v e o fi n f o r m a t i o nc o n s t r u c t i o na p p e a r si no u rc o u n t r yi n c l u d i n ge l e c t r o n i co f t ! i c e a tt h e s a m et i m e ,w es e tu pm a n yi n f o r m a t i o ns y s t e m st h a ta r ei n d e p e n d e n ta n dh a v en o u n i f o r mo r g a n i z a t i o no rs t a n d a r d t h e s ei s o l a t e di n f o r m a t i o ni s l a n d sm a k ei th a r dt o s h a r ei n f o r m a t i o nr e s o u r c ea n db l o c kt h ep r o c e s so fi n f o r m a t i o nc o n s t r u c t i o n t h a t s i s o l a t e di n f o r m a t i o ni s l a n d s oi nt h en e a rf u t u r e i ti si m p o r t a n tf o ru st or e s o l v et h i sp r o b l e mi no r d e rt h a tw e c a l ls h a r em u de x c h a n g ei n f o r m a t i o na m o n gi n f o r m a t i o ns y s t e m so ri n d u s t r y , e v e n d i f f e r e n ta r e a s i nr e c e n ty e a r s ,w i 也t h ed e v e l o p m e n tf o ri n t e r a c t , x m lh a sm a d e g r e a tp r o g r e s s a n db e e n a p p l i e d i nt h ef i e l d so fe l e c t r o n i c b u s i n e s s ,n e t w o r k p u b l i c a t i o n ,w i r e l e s sa p p l i c a t i o na n dc o n t e n tm a n a g e m e n t 。a n di t i se m e r g e da sa s t a n d a r df o rd a t ar e p r e s e n t a t i o na n d e x c h a n g e ,e x p e c i a l l y , b yt h ep r o m o t i o no fw 3 c a n ds o m e l e a d i n gi n f o r m a t i o nc o m p a n i e s x m li su s e dm o r ee a s i l yt h a ns g m l a n d x m ls e p a r a t e si n f o r m a t i o nc o n t e n t sf r o mi n f o r m a t i o n r e n d e r i n gc o n t r a s t i n g t o h t m lw h i c hb e n e f i t st ot h es h a r ea n dr e t r i e v a lo fi n f o r m a t i o no nt h ew e b 下k t e c h n o l o g yo f d a t a b a s ed e v e l o p sf r o mh i b e r a r c h yd a t a b a s e r e t i f o r md a t a b a s e t or e l a t i o n a ld a t a b a s e ,e v e n d a t a b a s e ,t h a th a sb e c o m et ot h eb a s eo f i n f o r m a t i o n s y s t e m s i n c e9 0 s ,a sak i n do fl a n g u a g eo f n e t w o r k p r o g r a m m i n g ,j a v am a k e s b e s t u s eo fn e t w o r kr e s o t l r c e sa n di t sp o r t a b l e ,c r o s s - p l a t f o r m , r e u s a b l ea n de x t e n d a b l e a l s oj a v ai s0 0 p r o g r a m m i n gl a n g u a g e ,a n di t ss e c u r i t yp o l i c yi n s u r e st h es e c u r i t y o f a p p l i c a t i o na n di ts u p p o r tc o l l a t e r a la n dm u l t i t a s kw o r kt h r o u g hm u l t i t h r e a d i n g m e c h a n i s m 。 t i l i sa r t i c l ed e s c r i b e sh o wt os o l v eq u e s t i o n so f i s o l a t e di n f o r m a t i o ni s l a n d sb a s e d o nx m l t e c h n o l o g yw i t hd a t a b a s ea n d j a v a t e c h n o l o g yt h a tm a k e s i tp o s s i b l et ou s e l e s sm o n e yt os h a r ea n de x c h a n g em o r ei n f o r m a t i o nr e s o u r c e k e y w o r d s :i s o l a t e di n f o r m a t i o ni s l a n d ,x m lt e c h n o l o g y ,n a t i v e x m ld a t a b a s e , x m l - e n a b l e dd a t a b a s e l 浙江大学硕士论文 基于x m l 技术的系统整台解决方案的应用研究 1 1 引言 第一章绪论 通过十几年的宏伟建设,我国在信息化方面打下了厚重的物理基础,同时也 沉淀下来一些问题。当前,以电子政务为龙头的新一轮信息化建设正在我国兴起, 各地都在争上电子政务,建数字城市;但是不能不看到,许多地方、部门各自为 政,各建系统,缺乏统一的规划和标准,造成了现有的信息系统都是分散、异构、 封闭的系统,互相之间不能信息共享,形成了一个个的信息孤岛。 以政府来说,有多少个委、办、局就有多少个信息系统,每个信息系统都由 自己的信息中心管着,有自己的数据库、自己选择的操作系统、自己开发的应用 软件和用户界面,完全是独立的体系。 又如电信业,先建了固定电话计费系统,后来又建移动电话计费系统,现在 又有数据业务计费系统,对于同一个用户,其电信费分别被3 个数据库管理。 企业中信息孤岛的问题也很严重。如一个大型企业,前后花了几百万元进行 信息化建设,有非常好的工业控制系统、办公自动化系统、客户管理系统、财务 系统、物流查询系统等,但这些系统都是在不同时间找不同公司做的,互不相通, 给企业综合分析、决策支持带来很大困难,更不要说与上、下游企业的信息系统 连在一起协同工作了。 信息孤岛使得大量的信息资源不能充分发挥应有的作用,效率低下,已经成 为阻碍我国信息化建设进一步发展的最大障碍,并给国家造成极大的浪费。 本文描述了采用x m l 技术结合数据库技术和j a v a 技术来整合各种数据类型 的信息孤岛,从而实现统一的数据平台,快速而高效她共享信息资源,为政府部 门和企业的决策提供强大支持。 1 2 信息孤岛问题 目前我国电子政务的建设已经初具规模,在几年以前各个省市开展的0 a 项 目其实就是我们现在所说的“电子政务”( e g o v e r n m e n t ) 的雏形,它为今天的电 子政务搭建了一个结实的框架,而现在的最主要的问题就是“信息孤岛”。所谓 “信息孤岛”就是指信息跨部门、跨行业的沟通存在障碍。例如,现在国内正全 面推进的“大社保”工作,它需要将养老保险、身份证管理与个人信用等信息相 关起来,需要涉及保险公司、公安、银行等相关的机关、部门,将信息充分地进 行共享,但是目前我们却做不到这一点。跨行业的信息共享的确有困难,涉及的 浙江大学硕士论文 基于x m l 技术的系统整合解决方案的应用研究 方面多、关系复杂。但是,目前在很多地方,连一个单位内部跨部门的信息共享 也没有很好解决。例如在某个机关,哪些人有权调阅哪些信息,这种信息的分级、 人员权限分级等的管理都无法做到。说到底,电子政务还是信息资源的问题,有 效率才会有效益,如何做到信息资源的有效利用,提高政府的办事效率才是真的。 国家提出了专门的国家资源开放法,其目的正在于此。 所以,电子政务建设,要警惕“数字鸿沟”,更要整合“信息孤岛”。电子政 务的开展应因地制宜,要充分考虑发达地区与不发达地区在基础设施建设、信息 化程度、意识上的差异。另一方面,电子政府是面向社会的全体成员提供服务公 共基础设施,必须避免“数字鸿沟”现象,即部分人群因为知识技能、居住区域、 职业等因素无法得到电子政府的服务,因此在服务方式、访问渠道、覆盖范围乃 至宣传培训等各个方面都应当保证各类人群都能够方便的访问和获取电子政府 的服务。电子政府必须连接各个政府部门的内部信息系统,实现高效的信息交换 和共享,同时还必须规划、组织好各类信息资源,以全面、一致的方式为社会提 供信息服务。因此在设计方案中必须考虑如何整合分散的信息来源、保证信息的 完整性和时效性等问题,杜绝信息孤岛”现象。 另一方面,在企业的应用中,g a r t n e rg r o u p 的调查显示:平均每个知识员 工每个星期在不增值的相关文档处理任务上需要花费8 个小时,包括文档的创 建、寻找、整理等。f o r r e s t e rr e s e a r c h 的最新调查显示:企业的信息内容量 在以每年2 0 0 的速度增长。可以说现实社会的一切经营活动都是从内容开始到 内容结束,作为提高实际业务活动效率和效果的信息技术的应用,尤其是软件技 术的应用,本质上也是一样。但由于以往技术和应用的局限以及主观认识程度的 局限,目前在几乎所有的单位都不同程度的存在信息孤岛问题,存在高度相关性 的信息无法关联使用。各应用系统的数据无法有效地进行交换和共享等等。分散、 混乱的数据和信息形成不了竞争力,必须将之整合为有组织的内容才能充分发挥 其价值,在现今时髦的协同商务、客户关系管理等应用中,内容管理更是重要的 组成部分和举足重轻的成功保证。 许多客户拥有大量的以数据为中心的系统,这些系统中的数据为客户带来了 巨大的应用价值。同时客户也需要去管理大量从职员、企业和合作单位收集的文 档信息,这些信息对于客户来讲同样具有非常大的使用价值。 但不同格式的文件信息,互不兼容的信息系统,成千上万的静态页面,形成 了众多星罗棋布的信息孤岛。我们的观点是,信息只有在各个系统中顺畅的流通 才能发挥其最大价值,没有信息流通的应用是僵化的,没有价值的。此外,数据 和文档具有不同的管理模式,使得客户很难做到互相的信息共享,而是必须分开 管理,必然增加了管理成本。 通常为了能够统一地、方便地、可靠地访问原有的系统数据,就需要打破文 7 浙江大学硕士论文 基于x m l 技术的系统整合解决方案的应用研究 档和数据的隔阂,能够将现有的以文档为中心的系统和以数据为中心的系统整合 在一起,为用户提供一个标准统一的操作平台。现在有很多解决方案用来解决众 多信息孤岛之间的信息共享问题,但是这些解决方案更多是遇到一个问题解决一 个,并不是一个完整的解决方案,而且在信息表示方面,倾向于用额外的元数据 来描述信息,而不是信息本身就包含描述信息。这需要花费大量的人力和财力, 是一项非常耗时的工程。 如何能够以一种灵活的、可扩展的、高效的方式来集成和分发信息,而且能 够和将来新一代的应用体系兼容? 如何积极地解决结构化和非结构化信息之间的隔阂,如何快速地建立新的应 用,如何快速获得投资回报? 业内人士把这些信息孤岛的特点归纳为:分散、异构,各自封闭、信息不能 共享。实现信息化显然要消灭信息孤岛,消灭信息孤岛靠什么? 第一,要有支持 消灭信息孤岛的工具;第二,要有实现信息整合的专业化服务。 1 3 解决之道 信息的连通性是相对于信息“孤岛”而言的。信息“孤岛”是指将信息简单 地堆积在一起,要寻找它们往往只能通过搜索程序或固定的渠道:而信息的连通 性是把有一定关系( 包括语义和逻辑) 的数据从逻辑上连接在一起,在不考虑安 全限制的前提下,从一个信息源可以到达连通的其他任何信息源。虽然这些信息 可能存储在不同的位置,但对访问者来说,它们就像是存储在同一位置,访问者 不必关心它们的实际存储位置。要真正解决信息的连通性,信息网格就必须解决 与信息表示和用户个性化密切相关的信息连通性模型的定义与实现。 随着互联网的发展,可扩展标记语言x m l 技术自出现以来,发展非常迅速, 在许多领域内得到广泛的支持而有着广阔的应用前景。例如电子数据交换、电子 商务等等更是把x m l 作为一种基础性、支柱性的技术来看待:此外,x m l 还广泛 应用于网络出版、内容管理以及无线应用等领域。在万维网协会( w wc o m m u n i t y , w 3 c ) 和许多大型公司的促进和推动下,) ( i i l 正成为网络间数据表达和交换的标 准。x m l 实现了文件的内容和数据表示形式的分离,是种有效的数据页面表示 和描述语言。x m l 与元信息的结合将使界面表示和数据存储统一起来。而且,与 通用标记语言s g m l 相比,x m l 简单易用;与超文本标记语言h t m l 相比,x m l 实 现了文档数据和格式的分离,有利于信息的交换和检索。 数据库技术及其应用系统经历了从层次数据库、网状数据库到关系数据库 以及面向对象数据库的发展,数据库及其管理系统已成为计算机信息系统中的重 要基础和支柱。9 0 年代以来,i n t e r n e t 和w e b 的飞速发展使人类社会的信息量 浙江大学硕士论文 基于x m l 技术的系统整合解决方案的应用研究 以指数级膨胀,而对信息管理和信息交换的需求更是空前强烈和迫切。这时,已 在传统的商业和事务处理等领域内趋于成熟的数据库技术,面临着许多新的问题 和挑战。j a v a 语言作为一种网络编程语言,最大限度的利用了网络资源,并且 可以跨平台、跨网络运行:也是一种新型的面向对象的程序设计语言,其代码可 重用和可扩展;具有强大的安全结构和策略,代码在编译和运行过程中都会接收 层层的安全检查;通过多线程运行机制来支持多任务和并行处理。 如果有效地把x m l 技术与成熟的数据库和j a v a 技术结合,既能利用x m l 的 灵活性以及表示和存储数据的能力,又能充分利用数据库的特点:有效的存储、 索引功能、事务管理、数据完整性的保证以及多用户访问控制等,以及j a v a 的 平台独立性和可移植性,来尝试解决企业政府的信息孤岛问题,达到连接企业政 府部门的内部信息系统,从而节省管理成本,实现高效的信息交换和共享的目的。 1 4 本文内容与组织 本文的研究目标是针对企业政府信息化过程中出现的信息孤岛问题,通过对 x m l 技术和系统整合解决方案的研究,提出了基于x m l 技术、结合成熟的数据库 和j a v a 技术的系统整合解决方案,并对该解决方案的实际应用进行分析和讨论, 给出了一个应用实例的设计。后续章节内容分别为: 第二章x m l 技术基础 全面系统的介绍了x m l 技术的产生根源,发展现状以及技术特点,分别 重点介绍了x m l 技术和j a v a 技术、数据库技术的比较以及结合的可行 性和优势,最后详细介绍x m l 数据库的技术要求,数据库模型和结构的 规划以及功能要求等方面内容。 第三章系统整合解决方案的研究 研究了系统整合的现状和分类,并对系统整合方案作了初步的探讨,在 此基础上,提出了基于x m l 技术的系统整合解决方案的设计思路。 第四章应用的分析与设计 通过对德清国税局内部的信息系统的分析,并根据国税局提出的性能需 求情况,提出了系统整合可行性方案的设想和设计思路。 第五章总结和展望 概括了现有的研究进度和成果,提出了可持续的研究方向,并对下一步 要进行的工作进行了探讨。 浙江大学项士论文 基于x m l 技术的系统整合解决方案的应用研究 第二章x m l 技术基础 2 1i m l 的发展 众所周知,计算机作为以文本为主的人与人之间交流的便利工具,其应用遍 及办公室及般家庭的每个角落。但是,随之而来的问题是,各种计算机所用的 格式不同造成它们之间不具有互换性,用某种系统处理的数据不能用于其它系统 之上;另外,人们也期待对电子化的信息进行检索。国际标准化组织( i s o ) 意 识到提高移植性的迫切,于1 9 8 6 年1 2 月制定了文档记述的标准一一 s g m l ( s t a n d a r dg e n e r a l i z e dm a r k u pl a n g u a g e ,标准通用标记语言) 8 8 7 9 。该 i s o 标准阐述了与特定的字处理软件或文本处理系统无关的、文档的内容部分和 显示、印刷时必要的格式排版信息部分分开记述的方法。由于s g m l 文档的结构 被明确记述,程序可解析它,所以,依s g m l 规则记述的文档,可在不同的系统 之间以不同的方法进行交换和处理,其结果也大大地方便了数据的管理和利用。 s g m l 在计算机辅助出版( c o m p u t e ra s s i s t e dp u b l i s h i n g ) 、电子出版 ( e l e c t r o n i cp u b l i s h i n g ) 、数据库出版( d a t a b a s ep u b l i s h i n g ) 、电子数据交 换( e l e c t r o n i cd a t ai n t e r c h a n g e ) 、数据转换( d a t ac o n v e r s i o n ) 的中介语 言( i n t e r m e d i a t el a n g u a g e ) 等领域被广泛地应用。其优点是: 不依赖于平台,可容易地进行文档交换; 文档格式与内容互相独立的通用化置标; 数据扩张性带来了应用程序的可独立性; 著者和编辑者明确易懂的格式。 近年,随着i n t e r n e t 的急速发展和普及,众多的用户通过i n t e r n e t 进行信 息交换,i n t e r n e t 上的信息交换的革命也提到日程上。在当今网络的大潮中, 像电子商务、数字图书馆、远程教育等应用领域,文档的共享成为最重要的问题 之一。虽然表达意志的各国语言不能统一,但通过计算机传递的信息,其存储、 利用格式的统一可以实现。然而,s g m l 的设计早于w e b 的出现,故在网络环境 下,s g m l 不能直接应用。作为从s g m l 衍生的在网络上应用的标记语言h t m l 登 上了历史舞台。 2 1 1i m 也的缺陷 “h t m l ( 超文本链接标示语言) 是我们的数据类型”比尔盏茨( 1 9 9 6 年2 月) 。这句话预示了互联网无可限量的发展前景。无论是公司,政府机构, 还是个人:无论是资产亿万的企业,个人网页的设计人,还是小学课堂,网络和 i o 浙江大学硕士论文 基于x m l 技术的系统整合解决方案的应用研究 它最初用以表达信息的方法h t m l 都获得了圆满的成功。这样看来h t m l 可以 解决绝大部分问题了。 但是,一些独具慧眼的人却已经认识到有必要重新发展一种新的语言 x m l 。因为h t m l 并不完美,它只是一种表达的技术。它并不一定能揭示h t m l t a g 中所包含的意义。举一个最简单的例子。 a p p l e 这句话在网络浏览器中有特定的表现。但是h t m l 却并没有告诉我们它到底 是什么。a p p l e 只是一个英文单词罢了。它在不同的环境之下可能会有不同的意 义:是一个计算机公司,一个水果,还是一个姓氏? h t m l 并没有告诉我们a p p l e 具体的内容。h t m l 中有一个大问题就是它的t a g 的集合是固定的。用户不能新 增有意义的能供他人使用的t a g 。网络浏览器只是一个应用平台,以h t m l 作为 数据标记,网络上的应用程序依赖服务器上的c g i ( 公共网关接口) 脚本来处理网 页上的数据。这样的结构是非常清晰的,但h t m l 却使在服务器的一端要处理 的数据量过大。这也使得网络速度降低,效率不高。归纳起来,h t m l 有下列的 缺点: 可用标签种类有限,不能精确地描述信息; 数据格式不能表现其内在意义; 不能表现深层的信息结构,因此不适于大量文档的存储; 除去电子阅览,将h t m l 用于其他领域应用时,机能欠佳; h t m l 的信息表现形式不适于再利用; 不具有印刷页的概念; 不能制定精细的编排; 全文检索的结果不精确; h t m l 和w e b 浏览器的机能强化的结果,造成了w e b 浏览器间互换机 能的部分消失。 2 1 2s g 她的变革 s g m l ( 通用标记语言标准i s o8 8 7 9 :1 9 8 6 ) 是h t m l 的前身技术。它是文件 和文件中信息的构成主体。s ( 3 m l 与h t m l 不同,它允许用户扩展t a g 集合,允 许用户建立一定的规则。s g m l 所产生的t a g 集合是用来描叙信息段特征的。而 h t m l 仅仅只是一个t a g 集合。所以我们可以说h t m l 是一个s g m l 的子集。 x m l 开发者源于s g m l 的设计和应用者。他们已经在s g m l 上投入了大量 精力,但他们却发现s g m l 并没有完全发挥它的作用。我们可以列举以下几个 重要方面给大家。在这些方面s g m l 带来的影响可以说是一场革命。 对e i ) i 的支持 e d i 就是电子数据交换。它是网络发展的一个主要目的市场。结构化信息的 浙江大学硕士论文 基于x m l 技术的系统整合解决方案的应用研究 一个主要目的就要使数据交换成为可能。不同的工业都制定本工业统一的模型。 就像是不同的国家有着不同的语言,这便于本国文化的交流。不同的工业内部 信息用统一的模型标识,便能方便和高效地共享。这样一个统一的模型就是d t d ( 文件类型定义) 。当然d t d 已经落伍了,它正被x m l 的s c h e m a ( 模式) 所 替代。很明显的,网络是一个理想的电子数据的集散地。在这里h t m l 是显然 有缺陷的数据形式。h t m l 不能完全表示不同工业中所需的不同的令人满意的模 型和它的语义。能不能有一种新的语言来解决这个问题呢? 答案就是x m l 。 对j a v a 技术的帮助 j a v a 技术是本世纪最重要的技术发展之一。j a v a 使浏览器工作时就像在通 用的应用平台上,而平台与平台之间却是独立的。但固定的t a g 集合和h t m l 语义上的贫瘠使得j a v a 的应用受到了极大的限制。正如前面提到的,在h t m l 中不同的语义无法表现。故数据元中丰富的信息得不到一种统一的表示。x m l 却能完全胜任这份工作。h t m l 页面要依赖网络服务器上的c g i 脚本来表现几 乎每一个编程函数。这显然使服务器工作量太大。有了x m l 和j a v a 技术,更多 的应用软件处理起来将不占用多少网络通信量。这使得网络更加快捷,客户可以 同时应用多个应用软件。x m l 真正使得j a v a 有了用武之地。 信息独立于平台之间 s g m l 作为h t m l 和x m l 的前身技术,一直是一种平台之间互相独立的信 息技术。这便于指定信息语义的结构。当企业正忙于展开各种各样的信息格式时 ( 例如微软的r r f ,a d o b e 的p o s t s c r i p t 和m i f ,以及w o r d p e r f e c t ,l o t u s ,b o r l a n d 等公司的格式) ,s g m l 已先人一步,确立了一套严格一致的,独立于平台之间 表达信息的格式。但在八十年代,正当s g m l 悄悄兴起时,绝大多数工业上的 计算机开发者都把目光集中在新的计算机平台上。人们并没有意识到多种私有信 息格式可能带来的麻烦。到了九十年代,网络技术的崛起之后人们才清醒过来, 试图寻找一种解决办法。 网络上的s g m l s g m l 已不适用于网络社会的需要。“如何使s g m l 能成功地运用于网络? ”, 这一问题已自然而然地提上了议程。1 9 9 6 年8 月,g c a ( 图形通信协会) 在s e a t t l e 召集s g m l 开发者们举行了一次会议。会议由s u n m i c r o s y s t e m s 公司的j o n b o s a k 主持。论题集中于两大方向: ( 1 )在软件应用中h t m l 是一种不理想的信息表现格式。讨论的结果是有 必要把s g m l 应用于网络。 ( 2 )s g m l 的某些方面已经落伍了。已成为了它广泛传播的障碍。讨论的 结果是有必要考虑怎样修补s g m l 。 既然s g m l 有着多重语义的t a g 集合,它早就应出现在网络上了。而具有讽 2 浙江大学硕士论文 基于x m l 技术的系统整合解决方案的应用研究 刺意味的是,在1 9 9 6 年8 月在网络上人们热衷的却不是s g m l ,而是h t m l 和 它的固定的t a g 集合。s g m l 开发者们立刻制定了一个紧急修改s g m l 标准的方 案。因为s g m l 是一个严格而完整的系统,方便软件应用并不是它的首要任务。 所以在s g m l 中有许多语法语义标准。它们既不方便而且消耗昂贵。它们必须 被修改或是删除。s g m l 开发者们首先所作的工作就是得到一个s g m l 中可移 给网络的,非关键的结构信息的清单。他们可以基于这个清单对s g m l 进行修 改。 2 1 3 】眦的出现 早在s e a t t l e 会议之前,b o s a k 和一些精心挑选的s g m l 结构信息专家就已向 w 3 c 提出了“网络上的s g m l ”计划。w 3 c 支持并赞助了他们的努力。工作于 1 9 9 6 年7 月正式开始起动。工作的早期,有较大的阻力。因为也存在反对s g m l 的人。一些制定x m l 标准的w 3 c 代表甚至声称“网络上的s g m l ”是不可能 实现。工作组( 原称“s o m l 编辑审议委员会”) 并未退缩。他们打算让s g m l 以全新的面目出现在网上,给s g m l 以全新的面貌,故给它命名为“可扩展标 识语言”,即x m l 。7 - 作组制定了一个雄心勃勃的计划来展示x m l 特色的计划。 计划的实施分三部分: ( 1 ) x m l 的句法。 ( 2 ) x l l ( 可扩展链接语言) :x m l 的语义链接。 ( 3 ) x s l ( 可扩展类型语言) :x m l 的表现。 x m l1 0 版本标准由w 3 c 正式批准公布于1 9 9 8 年1 月1 0 日。x m l 是性能 扩展性较高的标记语言,继承了s g m l 强大的功能,以2 0 的s g m l 难易度实 现了其8 0 的性能。x m l 的主要设计目标是: 3 , v w w ( w e b ) 的直接利用; 广范围应用程序的可利用性: 尽量保持和s g m l 的互换性; 处理x m l 的程序可简单地编写; x m l 的文档要具有较高的可读性; 严密但并不复杂的规则; 去掉选定o p t i o n 机能,减轻应用程序的处理负荷; 不要标记数量的减少作为重要的工作。 2 2 也的技术特点 与h t m l 一样,x m l 也源自s g m l ( s t a n d a r d g e n e r a l i z em a r k u pl a n g u a g e 一种老资格的通用标记语言) ,它保留了s g m l8 0 n 功能,使复杂程度降低到 浙江大学硕士论文 基于x m l 技术的系统整奄解决方絮的应用研究 2 0 ,尽管如此,x m l 却有着h t m l 语言所欠缺的巨大的伸缩性与灵活性。x m l 不褥象h t m l 一样有麓一成不变的格式。x m l 实际上怒种定义语离,即使用 者霹以定义无穷笼尽的标记寒描述文 牛中的任何数据元素,从两突破了h t m l 固定标记集合的约束,使文件的内容更丰鬻更复杂并组成一个完整的信息体系。 2 2 1x m l 的特点 x m l 语言可以让信息提供者根据需要,自行定义标记及属性名,也可以包 含擒述法,麸蔼便x m l 文 串豹结构可戳笺杂至g 任意程菠。x m l 主黉有三个要 素:s c h e m a ( 模式) 、x s l ( e x t e n s i b l es t y l e s h e e tl a n g u a g e 可扩展样式语言) 和 x l l ( e x t e n s i b l el i n kl a n g u a g e 可扩展链按语言) 。s c h e m a 蕊定了x m l 文件的 逻辑结构,定义了x m l 文件中的元索、元索的属性以及元素和元素的属性之闻 的关系,窀可以帮助x m l 的分析程序校验x m l 文件标记的合法性:x s l 是用 于戴定x m l 文搂群式豹语言,它能在窖户端镘w e b 浏览器改变文档瓣表示法, 从而不需要再与服务器进行交互通信;x l l 将进步扩展目前w e b 上已有的简 擎链接。 x m l 具有以下的特点: 1 ) 简单往。x m l 文档谮法包禽一个夺静麓掰集,不需改交基本结祷举身, 就可用朱代表复杂的信息集合。x m l 文档建立在基本嵌套结构的核心 集上,歼发者不需对内部结构作太多工作,就可获得复杂的应用需要。 2 )舞放性。x m l 标准是完全拜放的。 3 ) 高效且可扩展性。高效性体现在文档片断可以复用。用户可以使用自己 鸵标签,可与德人共事。扩暴性钵瑗在:它龛谗开发畿截建蠡己数文档 描述方式( d t d ) ,商效地创建用于多种应用的“可扩展的”标记集。 嚣钤,专车多跗麓靛搽准对x m l 浆辘力邃行了扩震,凳核心魏x m l 功 能集增加样式、链接和引用能力。 4 )黧际标准亿。新编码标难有统一代码,支持世界上掰青主要语言编写的 混合文本,从而可在世界不同的计算环境中使用。 x m l 具有鼹好的数据存储格式、可扩展性、高度结构化、便于网络传输的 特点,决定了其枣越的性能表现。盎予x m l 能钞慰特定的应用定义囊己鲍标记 语鬻,这一特征使得x m l 可以在电子商务、政府文档、报表、司法、出版、联 合、c a d c a m 、傈验掇梅、厂亵嚣巾分缝织羡患交换等领域审一震蹙手,投捃 不闷的系统、厂商提供各具特色的独立解决方案。 1 4 浙江大学硕士论文 基于x m l 技术的系统整合解决方案的应用研究 2 2 。2 儿的应用 作为互联网的新技术,x m l 的应用非常广泛,渗透了各行各业,归纳起来 可分为四类: 一、应用于客户需要与不同的数据源进行交互时。数据可能来自不同的数据 库,他们都有各自不同的复杂格式。但客户与这些数据库间只通过一种标准语言 进行交互,那就是x m l 。由于x m l 的自定义性及可扩展性,它足以表达各种 类型的数据。客户收到数据后可以进行处理,也可以在不同数据库间进行传递。 总之,在这类应用中,x m l 解决了数据的统一接口问题。但是,与其他的数据 传递标准不同的是,x m l 并没有定义数据文件中数据出现的具体规范,而是在 数据中附加t a g 来表达数据的逻辑结构和含义。这使x m l 成为一种程序能自动 理解的规范。 二、应用于将大量运算负荷分布在客户端,即客户可根据自己的需求选择和 制作不同的应用程序以处理数据,而服务器只须发出同一个x m l 文件。仍以上 例为论,如按传统的“客户服务器”工作方式,客户向服务器发出不同的请求, 服务器分别予以响应,这不仅加重服务器本身的负荷,而且网络管理者还须事先 调查各种不同的用户需求以做出相应不同的程序,但假如用户的需求繁杂而多 交,则仍然将所有业务逻辑集中在服务器端是不合适的,因为服务器端的编程人 员可能来不及满足众多的应用需求,也来不及跟上需求的变化双方都很被动。 应用x m l 则将处理数据的主动权交给了客户,服务器所作的只是尽可能完善、 准确地将数据封装进x m l 文件中,正是各取所需、各司其职。x m l 的自解释 性使客户端在收到数据的同时也理解数据的逻辑结构与含义,从而使广泛、通用 的分布式计算成为可能。 三、应用于将同一数据以不同的面貌展现给不同的用户。这一应用也可在上 例中体现出来。它又类似于同一个剧本,我们却可以用电视剧、电影、话剧、动 画片等不同形式表现出来。这一应用将会为网络用户界面个性化、风格化的发展 铺平道路。 四、应用于网络代理对所取得的信息进行编辑、增减以适应个人用户的需要。 有些客户取得数据并不是为了直接使用而是为了根据需要组织自己的数据库。比 方说,教育部建立一个庞大的题库,考试时将题库中的题目取出若干组成试卷, 再将试卷封装迸x m l 文件,接下来便是最精彩部份,在各个学校让其通过一个 过滤器,滤掉所有的答案,再发送到各个考生面前。未经过滤的内容则可直接送 到老师手中,当然考试过后还可以再传送一份答案汇编。此外,x m l 文件中还 可以包含进诸如难度系数、往年错误率等其他相关信息,这样只需几个小程序, 同一个x m l 文件便可变成多个文件传送到不同的用户手中。 浙江大学硕士论文 基于x m l 技术的系统整合解决方案的应用研究 综合以上四种不同类型的应用,我们可以总结出,x i v l l 其实源自一种“数 据归其主,用户尽其欢”的哲学。具体说来便是数据制作者并不考虑日后这些数 据具体会有哪些用途,只是尽量全面地考虑今后有可能会被用到的信息,并将其 完整、规范地制作成x m l 文件。综上所述,x m l 是一种灵活的、动态的、可 扩展的、并得到广泛支持的数据表示语言。将信息按照文档模式来存放和管理是 x m l 的一大特点,这种模式非常接近人类对信息的组织和管理模式。一方面 x m l 提供了丰富的、自描述、统一的信息表示,另一方面这种信息表示能够被 人类和计算机理解。信息一旦采用x m l 来表示,那它就可以方便地被其他系统 共享和利用。x m l 完美之处在于它能表示任何类型的信息,就象t c p h p 实现全 世界范围内不同网络间的信息通讯,x m l 使得全世界的信息变得开放和通用。 所以说,x m l 是信息的t c p i p 协议。 2 3 】眦与j a v a j a v a 实现了程序的跨平台性,而x m l 实现了数据的跨平台性。 x m l 是在因特网时代与j a v a 、c o r b a 等量齐观的一个概念。j a v a 解决了语 言实施的同一,c o r b a 解决了通讯协议的同一,而x m l 解决了信息表示、关联 的同一;0 0 面向对象是这三者的共同理论基础。x m l 是信息的高层封装与运输 的标准。据此x m l 也是不同应用系统之间的数据接口标准,是所有信息的中间 层表示;是中间层应用服务器( a s ) 的通用数据接口。甚至可以用于数据仓库技术 的数据迁移过程、数据库报告格式中。 整个i n t e r n e t 的网络应用开发商现在纷纷采用j a v a 技术以作为可移植 程序设计平台、使用扩展标记语言( e x t e n s i b l em a r k u pl a n g u a g e ,x m l ) 作为可 移植数据平台,并为结合两者所获的重大成就而雀跃不已。这两种技术以开放标 准为基础,结合成为强大的应用程序设计平台,能够在今日的服务导向网路中提 供w e b 服务。x m l 提供了可移植、可重用的数据;而j a v a 技术提供了可移植、 可维护的应用程序。 举例来说。随著电子商务日益受到欢迎,公司对公司( b 2 b ) 电子商务已经发 展为原先没有意想到的市场区段。但是连接两家公司只是开始而已。要真正在 i n t e r n e t 上进行交易,两家公司必须能够经常性的交换各种商务文件,像是电 子邮件讯息、报价要求、采购表格、收据、以及出货确认等等,讯息的种类不胜 枚举。听起来好像很容易,但是当购物人与销售者都是电脑、互相读取彼此的表 格时,事情可能没有那么简单。想象一下,信用卡帐号的收据、跟汽车零件出货 的收据,可能有不同的要求。x m l 为文件交换所带来的改变,正如j a v a 技术为 程序设计平台所做的改变。 t 6 浙江大学硕士论文 基于x m l 技术的系统整合解决方案的应用研究 事实上,j a v a 技术与x m l 的提供了两种截然不同的功能,j a v a 技术是一个 对象导向程序语言、一个平台;而x m l 则是一个定义、储存与交换结构化数据 的方式。x m l 将是下一代的数据格式语言,但是它在处理数据上不会太过复杂。 在过去,人们必须为一种数据编写一个驱动程式。但是x m l 的优点在于,各公 司不需要有相同的机制,就能传达常用的商务条件。然而要操控x m l 资料,就需 要诸如j a v a 技术的程序语言。由于这两种技术的共生利益,许多大型企业开始 使用x m l 与j a v a 技术的组合。大型氽业解决方案,部分必须依赖在杰出的撮 合数据的能力。在今日,顾客以许多方式与企业联系:透过传统程序进行交谈、 或是与顾客服务代表交谈、或是透过网站传送电子邮件。j a v a 技术的杰出表现 之一是在单一平台上整合诸多数据来源。 j a v a 技术与x m l 在分布式系统中显示了价值。在分布式系统中,人们只会 在乎两件事:首先,人们需要与系统无关的封装元件,j a v a 技术在进行该项工 作方面表现卓越。其次是数据本身,这点在所有系统都互相联网后便会显示出其 重

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论