如何判别分布式系统的优劣
如今,分布式系统正在对各行业产生巨大影响,已经进入军队、公安、气象、交通、电力等重要机构的指挥中心、监控中心,为用户系统可视化、对接和互联互通带来强大的应用,分布式系统的优劣判别,主要看以下七个方面:
一、看核心技术
分布式产品的核心基础是音视频网络编解码算法,优秀的编解码算法是一款好的分布式产品诞生的前提。通过了解一款分布式产品采用的核心技术算法,可以快速的初步判定一款分布式产品的性能优劣,从而选择最适合的分布式产品。市场上主流的分布式根据其技术特点与产生时间可以划分为以下3种,第一代深压缩分布式技术、第二代浅压缩分布式技术与第三代双引擎分布式技术。
1、第一代深压缩分布式
深压缩分布式产品是以H.264 和 H.265算法为主的第一代分布式产品类型,也是市面上主流的分布式产品类型,它的优势是占用带宽低、具备完善的功能、采用标准视频编解码协议,劣势是画面损失较大、画面延时较大。
2、第二代浅压缩分布式
浅压缩分布式是区别于深压缩分布式的第二代分布式,主要针对性的解决了深压缩分布式产品显示画面质量差、延时高等问题,优势在于画面质量好、传输延时低,劣势是占用带宽大、标准化程度低。
3、第三代双引擎分布式
双引擎分布式通过采用双分布式核心的设计,首次将前两代分布式产品特点优势进行整合。一方面通过“浅压缩核心”实现视频高质量无损显示效果、低延时传输、完善了多种使用功能;同时具备“深压缩核心”在保持浅压缩显示效果的同时,解决了实际使用中与市面上H.264/H.265设备兼容、低网络带宽下远距离视频分享的需求。
二、看功能覆盖
随着显控市场的逐步发展,各行业对于音视频显控的应用也愈加复杂。考量一款分布式产品的优劣,其中很关键的一点,便是看其是否覆盖了行业常用的功能需求。各分布式厂商往往提供了多种功能应用,但其中真正具备考量意义与值得评估的主要有以下三大功能:网络信号切换功能、大屏拼接显示功能与实时坐席控制功能。
1、网络信号切换功能
音视频的网络编解码能力是分布式系统产品最重要的基础能力。主要功能包括:不同种类的音视频信号传输、不同分辨率的音视频信号传输、画面无黑场、无中间状态切换、音频视频独立传输切换等。
2、大屏拼接显示功能
分布式大屏拼接显示功能主要包括:大屏拼接功能、大屏多画面显示、画中画显示、任意布局调整、预案快速切换、大屏底图显示、信号预览、大屏状态回显、大屏滚动字幕等。
3、实时坐席控制功能
分布式坐席协作功能可以快速便捷的解决坐席间信息共享和处理的问题,其主要核心功能包括:“一人多机”控制,“人机分离”远端PC实时控制,坐席与大屏的视频互动,坐席与坐席间的视频互动,UKey、硬盘、摄像头、打印机等USB设备识别,信号源实时预监等。
三、看画面还原度
基于指挥中心、控制室等分布式系统应用场景对超高图像画质呈现的需求,画面还原度也是衡量分布式系统优劣的一大标准。好的分布式系统采用业界领先的图像处理引擎技术,确保所有视音频信号实时处理显示,同时显示画面不偏色、不丢失细节、不出现黑屏/马赛克。分辨分布式产品的画面还原度主要有两种方法:
1、专业静态测试图片
通过对比原始画面与编解码画面的差异,进行测试,在图片全屏显示的情况下:是否会出现线条虚化、甚至完全丢失问题;文字内容、花纹是否保留完整;色彩是否丰富、色彩变化是否平滑;图像4:4:4是否清晰可见。
2、高清动态画面测试
播放快速变化、内容复杂、色彩鲜艳的视频,通过肉眼观察,是否出现画面模糊、马赛克、画面卡顿、黑屏等问题。
四、看大屏同步性
指挥调度离不开可视化,尤其对于指挥中心而言,高清图像呈现、实时同步传输尤为关键。部分分布式产品由于每个节点画面传输至拼接大屏的时间不同,会直接导致大屏幕显示不同步及图像抖动、撕裂的现象出现,非常影响用户的观看体验。分布式系统的同步性优劣可通过专业的测试视频及方法进行测试:
1、专业视频播放
多块拼接屏播放同一个视频(推荐专业测试视频),对比画面中显示的动态线条、秒表与帧号的差异。将播放测试视频的信号源,显示在大屏的不同屏幕上。通过相机进行拍照或者慢动作摄影,对比不同屏幕上显示的秒表数值、与画面帧率序号是否为同一帧、同一毫秒。如果出现帧序号不同,则大屏不同步。根据对应的秒表时差,可以明确不同步的严重程度。
2、快速动态图像播放
在不具备条件的情况下,也可以通过播放快速运动的动作视频、人物视频等进行肉眼观察。好的分布式系统应采用专业的同步显示技术,在画面细节丰富、切换迅速的情况下,依然可以保证卓越的同步性与图像显示质量,保证视频每一帧输出均可以完全同步。
五、看坐席延时性
视频信号由信号源传输至坐席显示的过程中不可避免的会出现显示延迟的现象,延迟时间从几十毫秒到几百毫秒甚至更长,然而键盘鼠标等控制信号的传输延时远小于视频信号的传输延时,使得坐席控制中出现屏幕显示画面慢于实际鼠标数据传输的现象,尤其是当鼠标键盘配合视频画面对信号源进行控制、操作时由于图像的变化跟不上人的动作以及大脑的反应,会出现鼠标无法控制、点击不精确等现象,极大的影响用户的操作体验。测试方法有:
1、专业延时测试视频
通过专业的演示测试视频可以快速精确的判断分布式系统的延时。使用相机水平拍摄“原始图像”与“KVM坐席图像”,对比原始图像与分布式传输图像的“时间差”即可得到分布式传输的具体数值。由于不同相机的快门曝光时间与网络固有差异,可以采用多张图片取平均值的方式确定延时。
2、实际操作体验
在没有条件的情况下,可以通过鼠标实操,来体验延时差异。具体方法包括:
(1)连续晃动鼠标,查看鼠标灵敏度;
(2)快速移动鼠标点击某处,查看是否可以精确点击到目标位置;
(3)通过键盘键入文本内容,查看字符显示速度。
分布式系统应在保障高品质图像传输质量的前提下,大幅度降低音视频编解码传输所产生的视频延时,保证原始信号画面实时传输、音视频实时同步传输以及坐席鼠标操作流畅。
六、看集中管控
随着科学技术的不断发展,指挥中心、控制中心、监控中心、数据中心、会议室等场景的信息化系统愈加复杂,是否可以将多个独立系统进行统一管控也是衡量分布式系统优劣的一大标准。好的分布式系统应该将多个独立的系统进行统一接入和管控,并通过触控终端设备实现统一的指挥调度,为客户带来自由方便、快捷准确、灵活可视的操作体验。集中管控主要看这几个要点:
1、视频可视化操作
视频控制可视化是集中管控的基础功能需求,不仅要在操作过程中能够查看信号源的预监以及大屏幕的回显画面,还要可以对预案的布局进行实时预览,从而方便操作人员的画面调取和预案切换,减少误操作的几率。
2、音频可视化调节
除了视频系统以外,音频系统也是分布式系统控制中的重要部分。用户在音频调节时,经常需要实时查看全部通道的实时音量大小及静音状态,这样才能进行精准的操作。此外,每个通道的实时电平反馈也是用户进行操作的重要参考,音频调节的可视化可以给用户带来直观的操作控制体验。
3、环境可视化控制
除了分布式系统内的音视频设备,周边环境中的灯光、屏幕、电源等周边设备,也是系统集中管控的重要对象。如果不能在同一个界面中进行管控,就失去了集中管控的意义。对于系统内的各类设备,不仅要能准确的控制各类设备的开关,还要能够实时查看各个设备的运行状态,实现真正的环境控制可视化。
4、多用户同步控制
分布式系统的“分布”不仅仅体现在音视频节点的分布,还体现在控制终端的分布。因此,多用户之间如何进行协作控制,就成为了分布式系统集中管控的关键。系统应能将各个用户进行统一管理,并将控制反馈实时同步在各个管理员的终端界面上,这样才能够准确的进行协作控制。
七、看运维管理
智能化的运维管理就像人体的免疫系统一样不可或缺,它可以围绕业务系统进行日常安全监测,掌握系统的各项指标,并根据指标作出“健康”与否的判断;对检测到的设备运行不正常状态或者设备故障发生预警,并及时通知运维管理人员进行维护。这种运维方式侧重于设备故障隐患和缺陷的早期发现和处理,提高了设备的稳定性和可靠性。专业的运维管理解决方案涵盖如下要点:
1、动态展示系统连接的拓扑图
与分布式相关的周边系统,尤其是网络系统,都与最终画面上屏的响应速度、图像质量、操作延迟、拼接同步性等效果息息相关。分布式节点通过交换机、路由器等网络设备连接,任何一个网络节点故障、掉线,都会使得某路画面黑屏,这时需要能够及时定位到故障点,才可以在最短时间内解决网络故障。
因此分布式系统的运维管理软件需要能提供一个动态变化的设备连接拓扑图,通过拓扑图直观地看到分布式设备及周边设备的在线状态与故障状态,不用实际到现场排查,就可以反馈给用户到底是哪个环节发生问题。
2、图形化查看设备详细运行指标
除了设备的在线与否之外,为了更好的掌握系统运行状态与趋势,设备的详细运行指标也同样关键,如各个分布式节点的输入输出分辨率、帧率、视频传输速率等。与分布式设备连接的交换机,也需要实时了解其运行时间、温度、CPU占用率、内存占用率、某端口流量、抖动、丢包率等。只有掌握了这些信息,才能在发生画面抖动、卡顿、错位等“软问题”时,精准定位到问题所在,降低分布式系统可能受到的外界环境干扰。
3、具备故障告警与预警提示
传统的运维模式通常是被动式的,即用户发现问题,再排查问题所在。而现代化的分布式运维更应该是主动式的,即系统一旦发生故障,分布式系统要能主动以页面的弹窗、声音或邮件、短信等渠道,为用户做出告警提示,即使用户不再指挥中心或会议室内,也能通过手机等方式远程掌握分布式系统的状态。另外,智能化的运维管理应不仅仅是发生问题、解决问题,更应该利用大数据等手段,记录系统运行数据,并对未来趋势进行预测,在设备可能发生某个问题之前,前置性的做出预警提示,真正提高分布式系统的稳定性。
4、建立完善并有记录的运维工作流程
拥有了设备的监测与告警,用户可以最短时间内掌握系统故障点,但如何解决这些故障,依旧是一个值得深究的问题。分布式系统具有无限的扩展性与覆盖度,往往部署在大地域中。管理分布式的运维人员也常常不是一个人,而是上下级单位、各个机构多人配合。
效率最高的运维解决方案是多人分工配合,如管理员在指挥中心对整个分布式系统监管,发现故障点后,远程指导操作员实际到现场处理,并可通过系统实时判断问题是否解决。这就需要分布式系统提供一个科学的运维工作流程,从发现问题、派工单下发、到现场解决与问题反馈,运维人员只需按照标准化的运维流程来操作,并在系统内记录相关工作信息,即可高效率的完成运维管理工作。
5、覆盖系统级别的统计与分析
真正的分布式运维管理是一门系统性的科学与工作,应该做到“精细化运维”。所谓“精细化运维”,即不仅仅对设备运行状态进行监管,也要收集并记录运维工作流中的告警响应时间、工单解决时间、故障处理时间等信息,同时通过数据的挖掘与关联,对各类设备的故障率、高风险参数、视频质量影响率等进行分析,生成综合性的多维度系统运行报表,帮助用户持续改善分布式系统的运维管理工作与应用方式。