跪求多媒体技术在电力系统毕业论文中的应用(附开题报告和任务书)
关键词:多媒体图像音频功能
多媒体技术的应用
摘要:多媒体通信技术是当今世界科技领域中最具活力和发展最快的高科技信息技术,它始终影响着世界经济发展和科技进步的步伐,并改变着人类的生活方式和生活质量。多媒体通信是各种媒体信息之间的通信,它是通过现有的各种通信网络来传送和接收多媒体信息并进行转储的通信手段,几乎涵盖了信息技术领域的所有领域,包括数据、音频和视频的综合处理和应用技术,其技术的关键是多媒体信息的高效传输和交互处理
关键词:多媒体音频特征图像
引用
随着科技的飞速发展,图像、视频等多媒体数据逐渐成为信息处理领域的主要信息媒体形式。多媒体通信是信息高速公路建设中的一项关键技术,是多媒体、通信、计算机和网络相互渗透和发展的产物。它将极大地提高人们的工作效率,改变人们的教育、娱乐等生活方式,是21世纪人们交流的基本方式。
第一章是对多媒体通信技术的简要介绍。
多媒体通信的基本概念和特征
1.1的基本概念
媒体是信息表征和传递的载体,是一个重要的概念。ITU-T I .374建议将媒体分为五类:感觉媒体、表现媒体、显示媒体、存储媒体和传输媒体。
多媒体数据是指各种风格信息的载体,如文本、图形、图像、声音等数据。其特点主要包括以下几点:
(1)多媒体数据种类繁多(多为非结构化数据),不同来源的媒体具有完全不同的形式和格式;
(2)多媒体数据量巨大;
(3)多媒体数据具有时间特性和版本概念。例如,在视频点播系统中,必须考虑媒体之间和媒体内部的时间同步。
可以看出,多媒体数据不同于传统的数值和字符,因此其存储结构和访问方式也是特殊的,其数据结构和数据模型也是不同的。在这种情况下,一种全新的数据库系统——多媒体数据库系统应运而生。
多媒体数据库是能有效实现多媒体数据存储、读取和检索功能的数据库系统。其主要特点是:
(1)继承了传统数据库的一些优点,如数据独立性、使用数据库查询语言的高级查询、开发控制、容错技术等。
(2)可以同步和管理具有时空关系的数据。
但是,目前我们对多媒体数据库的功能和实现方法还没有达成* * *的认识,所以出现了各种形式的媒体数据库,实现方法也各不相同。从其总体发展来看,多媒体数据库的数据模型可分为三类:关系数据模型、面向对象数据模型和超媒体数据模型。
基于不同数据模型的多媒体数据库管理系统(DBMS)的功能也大不相同。通常基于关系数据模型的多媒体DBMS可以访问多媒体数据,多媒体数据对象之间的语义关系、时间关系和空间关系不做处理,所以这部分工作留给了应用程序。面向对象的数据模型和超媒体数据类型可以支持多媒体数据对象之间的语义关系、时间关系和空间关系的处理,其抽象性较高,但DBMS的实现相对复杂。
多媒体通信系统中另一个经常使用的词是“超媒体”。“笔记”这个词经常出现在出版物中,你可以通过“笔记”找到与之相关的一段文字或一篇文章。这种从“笔记”到一段文字或一篇文章的链接称为超链接拨号。同样,一个超链接也可以链接几个不同的媒体,其集合称为“超媒体”。
1.2多媒体通信的特点
多媒体通信技术的发展打破了传统的单一媒体和单一电信服务的通信系统格局,反映了一种高层次通信的趋势,这是人们对未来社会工作和生活方式的向往。多媒体通信技术是一门综合性技术,涉及多媒体技术、计算机技术、通信技术等多个领域。多媒体通信系统必须具备三个主要特征:集成性、交互性和同步性。
1.2.1集成
多媒体通信系统的集成是指存储、传输、处理和显示内容数据信息、多媒体和超媒体信息、脚本信息和特定应用信息等四种信息的能力。
(1)内容数据信息
(2)信息以一定的结构形式存在。有两种典型的结构:一种是对象。
结构,其中可以处理的最小单位是对象;另一个是文件结构,其中
最小的处理单位是文件。
多媒体和超媒体信息
多媒体和超媒体信息不同于单一媒体信息,它们是结构化信息,由结构框架和内容数据两部分组成。多媒体和超媒体信息的最小表达形式分为两类,一类称为对象,另一类称为文件。
(3)脚本信息
脚本信息是由语义关系链接的一组特定的结构化多媒体和超媒体信息,需要提供这组多媒体信息的操作过程以及与外部处理模块的关系。
(4)具体应用信息
以上三类信息都是低级信息,可以用标准来定义和表达。具体应用信息是高层信息,与应用密切相关,会因应用场合不同而有较大差异。它的表示方法是基于以上三类。
1.2.2交互性
交互性是指通信系统中人与系统之间相互控制的能力。在多媒体通信系统中,交互性有两个方面。一个是人机界面,即人们使用系统的终端时,用户终端提供的操作界面;第二个是用户终端和系统之间的应用层通信协议。
多媒体通信终端的用户对整个通信过程具有完全的交互控制能力,这是多媒体通信系统的主要特征,也是区分多媒体通信系统和非多媒体通信系统的主要标准。
1.2.3同步
同步意味着多媒体通信终端上出现的图像、声音和字符都以同步的方式工作。如果用户想检索某个重要历史事件的片段,该事件的活动图像或静止图像存储在图像数据库中,其文字描述和语言描述放在其他数据库中。多媒体通信终端通过不同的传输通道从不同的数据库中提取所需的信息,并将这些图像、声音和文字同步,形成一个完整的信息提供给用户。
多媒体通信系统中的同步是多媒体通信系统最重要的特征之一,信息是否同步决定了该系统是多媒体系统还是非多媒体系统。同步可以在链路层、表示层和应用层实现。
第二章多媒体音频技术
音频技术发展较早。几年前,一些技术已经成熟并商业化,甚至进入家庭,比如数字音频。音频技术主要包括音频数字化、语音处理、语音合成和语音识别四个方面。
目前,音频数字化是一项成熟的技术,多媒体声卡就是用这种技术设计的,数字音频也采用了这种技术来代替传统的模拟方式,取得了理想的音效。音频采样包括两个重要参数,即采样频率和采样数据位。采样频率是指每秒钟对声音进行采样的次数。人的听觉上限约为20KHz。目前常用的采样频率有11KHz,22KHz,44KHz。采样频率越高,音质越好,存储的数据量越大。CD唱片的采样频率为44.1KHz,达到了目前最好的听觉效果。采样数据位数是每个采样点的数据表示范围。目前常用的有三种:8位、12位、16位。不同的采样数据位决定不同的音质。采样数越高,存储的数据量越大,音质越好。CD唱片采用双通道16位采样,采样频率44.1KHz,达到专业级水平。
音频处理涉及的范围很广,但主要方面集中在音频压缩上。目前最新的MPEG语音压缩算法可以压缩声音6倍。语音合成是指将文本合成为语言进行播放。目前国外几大声部的合成水平已经到了实用阶段,中文合成也在近几年有了长足的发展,实验系统正在运行。在音频技术中,语音识别是最困难也是最有吸引力的技术。虽然目前仅处于实验研究阶段,但其广阔的应用前景使其成为研究热点之一。
第三章多媒体图像和视频技术
3.1视频技术
虽然视频技术的发展比较短,但是产品的应用范围已经很大,结合MPEG压缩技术的产品已经开始进入家庭。视频技术包括视频数字化和视频编码技术。
视频数字化就是通过模数转换和色彩空间变换,将模拟视频信号转换成计算机能够处理的数字信号,使计算机能够显示和处理视频信号。目前有两种采样格式:Y:U:V4:1:1和Y:U:V4:2:2。前者是早期产品使用的主要格式,Y:U:V4:2:2格式将色度信号的采样提高了一倍,数字化视频的色彩、清晰度和稳定性都有明显提高,是下一代产品。
视频编码技术是将数字化的视频信号编码成电视信号,可以录制在录像带上,也可以在电视上播放。不同的应用环境可以采用不同的技术。从低档游戏机到电视台播出级别的编码技术已经成熟。
3.2图像压缩技术
图像压缩一直是技术热点之一,其潜在价值十分可观。它是计算机处理图像和视频以及网络传输的重要基础。目前ISO制定了两个压缩标准,分别是JPEG和MPEG。JPEG是静止图像的压缩标准,适用于连续色调的彩色或灰度图像。它包括两部分:一是基于DPCM(空间线性预测)技术的无损编码,二是基于DCT(离散余弦变换)和霍夫曼编码的失真算法。前者图像压缩没有失真,但压缩比很小。目前主要采用后一种算法,图像有损失,但压缩比很大,压缩20倍左右看不出失真。
MJPEG指的是MotionJPEG,使用JPEG算法以每秒25帧的速度压缩视频信号,完成动态视频的压缩。
MPEG算法是一种适用于动态视频的压缩算法。它不仅对单幅图像进行编码,而且利用图像序列中的相关原理去除帧间的冗余,从而大大提高图像的压缩比。通常图像质量高,压缩比高达100倍。MPEG算法的缺点是压缩算法复杂,难以实现。
第四章多媒体通信系统
1,建筑
多媒体通信是不同地理位置的参与者之间的一种会议或通信。压缩的数字图像和声音信号通过局域网(LAN)、广域网(WAN)、内联网、互联网或电话网络传输。像电视这样的多目标广播、像录像机这样的流式广播、电话会议、视频会议、IP电话、可视电话和IP传真都是多媒体通信技术的具体而独特的应用。多年来,国际电信联盟(ITU)为公共和私人电信组织制定了许多多媒体计算和通信系统的推荐标准,以促进各国之间的电信合作。在ITU的26个(A ~ Z系列)系列推荐标准中,与多媒体通信关系最密切的7个系列标准见表4-1,三类多媒体通信系统的核心技术标准集见表4-1。
表4-1 ITU系列推荐标准
系列名称的主要内容
G系列传输系统、媒体数字系统和网络
H系列视听和多媒体系统
系列I综合业务数字网(ISDN)
传输电视、声音节目和其他多媒体信号
Q系列电话交换和控制信号传输方法
T系列远程信息服务终端设备
2.网关的功能和结构
网关是一台功能强大的计算机或工作站,负责电路交换网络(如电话网)和分组交换网络(如互联网)之间的实时双向通信,并提供异构网络之间的连接。它是传统电路交换网络和现代IP网络之间的桥梁。
IP电话的出现(参见“7.4 IP电话”)允许在分组交换网络上进行电话呼叫,从而引发了电信行业的一场革命。然而,IP电话在成为主流电话服务的道路上遇到了许多障碍。最大的问题之一是IP电话网和公共交换电话网之间缺乏连通性。一个重要的原因是早期的网关限制了IP电话进入主流电话服务。比如,很难通过网关建立通话,需要使用非常规的电话号码;不同网关之间的兼容性阻碍了呼叫的建立;音质差,有回音,延迟时间长。这促进了允许IP和PSTN客户端相互通信的网关的发展,其中一个措施是提高网关的处理能力。低端网关有1 ~ 6个端口,一般采用高端奔腾处理器的PC方案,提供媒体处理、呼叫控制、分组处理等网关功能。高端网关将网关功能分配给几个处理器,称为计算机电话集成(CTI)平台,可以提供超过100个端口。
网关的基本功能可以归纳为三种类型:
(1)翻译协议:网关作为一个解释器,使不同的网络建立联系,例如,它允许PSTN和H.323网络相互通话,以建立和清除呼叫。
(2)转换信息格式:不同的网络使用不同的编码方式,网关会对信息进行转换,使异构网络自由交换信息,如语音、电视等。
(3)传递信息:负责不同网络间的信息传递。
网关的主要组件包括:
(1)交换电路网络(SCN)接口卡是一种典型的T1/E1或PRI ISDN线路接口卡,它与SCN通信。主速率接口(PRI)由23个B通道和一个64 kb/s的D通道组成,称为23b+D,相当于T1线路的带宽。
(2)数字信号处理器(DSP)卡,执行声音信号压缩和回声消除等任务。
(3)网络接口卡,用于与H.323网络通信。典型的网卡包括10/100网络接口卡(NIC),或者它们的功能集成在主板上。
(4)控制处理器,它协调其他网关组件的所有活动,通常位于系统的主板上。
网关的主要软件包括:
(1)执行所有基本网关功能和选择功能的网关软件。例如,H.323网关平台执行协议转换、消息格式转换和信息传输等基本功能,支持语音压缩、协议转换、实时传真解调/再调制以及H.323系列协议的实现。
(2)特定网关的应用软件,其执行定制功能以及管理和控制功能。
3、会议设备的功能和结构
网守用于连接IP网络上的H.323视频会议客户端,是视频会议的关键组件之一。很多人将其视为视频会议的“大脑”。它提供授权和验证,保存和维护通话记录,执行地址转换而不需要您记住IP地址,监控网络,管理带宽以限制同时通话的数量,从而确保视频会议的质量,并提供与现有系统的接口。通常,会议服务器的功能由软件实现。会议设备的功能分为两部分:基本功能和选择功能。
会议服务器必须提供的基本功能包括:
"地址转换:使用可由注册消息更新的转换表来将别名地址转换成传输地址。当电路交换网络上的电话试图呼叫IP网络上的PC时,此功能尤其重要,并且在确定网关地址时也很重要。
准入控制:通过ARQ/ARC/ARJ(准入请求、确认和拒绝)消息来授权对局域网的访问。H323标准规定必须有用于授权网络服务的RAS消息。RAS是一种注册/接纳/状态协议,但它没有定义授权访问网络资源的规则或策略,因此服务提供商需要服务器来干预现有的授权方法。此外,业务经理和服务提供商可能希望使用它。
按你自己的标准授权,例如,按押金、信用卡等。
带宽控制:支持RAS带宽消息,即BRQ/BCF/BRJ(请求、确认和拒绝)消息来实施带宽控制。至于怎么管理,要根据服务商或者企业管理者的政策来决定。在许多情况下,如果网络或特定网关不拥挤。
在任何情况下,对任何带宽的请求都应该得到满足。
区域管理:用于管理所有已注册的H.323端点,并为它们提供上述功能。至于确定哪个终端可以注册以及地理或逻辑区域的组成(由单个会议服务器、网关和多点控制单元MCU管理的终端),则由网络设计者决定。
会议服务器提供的选择功能包括:
呼叫控制信令方式:H.323中有两种呼叫控制信令模型:网守路由呼叫信令模型和直接端点呼叫信令模型。可以根据接入提供商的要求来选择会议服务器。
呼叫授权:会议服务器可以根据服务提供商指定的条件授权或拒绝给定的呼叫。其条件可以包括会议时间、预定的服务类型、对受限网关的访问权限或可用带宽等。
带宽管理:根据服务提供商指定的带宽分配,确定呼叫是否有足够的带宽。
通话管理:提供智能通话管理。会议服务器维护H.323呼叫表以指示被叫终端是否忙,并为带宽管理功能提供信息。
会议设备的结构
会议设备通常设计为内外层,如图4-8所示。会议设备的内层称为核心层,由实现H.323协议栈的软件和实现多点控制单元(MCU)功能的软件组成。一些软件开发公司称之为H.323会议设备的核心功能组件。MCU的主要功能是在会议主持人的指导下,自动或手动连接多条线路,交换电视号码。会议服务器的外层由许多应用程序的接口组成,用于连接网络上许多现有的服务。外部软件