CUDA对决Stream

上传人:yx****d 文档编号:160167133 上传时间:2022-10-10 格式:DOC 页数:10 大小:59KB
收藏 版权申诉 举报 下载
CUDA对决Stream_第1页
第1页 / 共10页
CUDA对决Stream_第2页
第2页 / 共10页
CUDA对决Stream_第3页
第3页 / 共10页
资源描述:

《CUDA对决Stream》由会员分享,可在线阅读,更多相关《CUDA对决Stream(10页珍藏版)》请在装配图网上搜索。

1、C对决tram!谁才是视频转码之王7月6日提起G(Gra-Purpoe cotingoGU,P通用计算),很多人可能觉得是天方夜谭,离实际应用还遥不可及。事实上目前GU已经在科学研究和超级计算领域取得突破性进展,随着数百万支持UDA的P已经遍布全球计算机,软件开发人员、科学人士和研究人员正在利用D探测到更多更广的领域中,包括图像和视频编辑、计算生物学和计算化学、流体力学模拟、CT图像重组、地震分析、光线追踪以及其它更多。当前世界超级计算机五百强的入门门槛为2Tflp/s一个三节点,每节点4GPU的集群,总处理能力就超过2Tps,如果使用G280只需1万元左右,使用专用的Tesla也只需0万左右

2、。U的高性能期权分析系统(左上)、地下地质学模型(右上)、绑定病毒基因组的离子(橙色)位置以及全乳房超声波系统都使用CUDA加速的程序来进行计算。就目前而言,GPU在家用电脑的应用也是发展迅速,基于D和trem技术的软件已经占领了视频编辑/转码应用领域,比如Baabo、VIO、Mediahw等。前不久通过对国内首款DA视频转码软件ediaCdr的测试发现,该软件完美支持多核P及指令集、再加上CUDA加速的助阵,其性能轻松超越CUDA代表作adbom,让电脑视频转换性能更上一层楼.但因为手持设备支持格式五花八门,Medaoer的设置也是繁琐晦涩,很多朋友对如何进行视频转码还是一头雾水,认为我们的

3、测试偏重于性能而忽略了详细实际操作过程。汲取网友宝贵的意见,我们决定对目前已正式发布的支持PU转码的软件做一次横评,详细对比各款软件之间的性能差异、输出画质及兼容性,通过不同平台对比高中低端GPU的通用计算能力,同时帮大家真正玩转视频转码.CD加速的鼻祖:Badaboom G视频编码的鼻祖应该是I的AVIVVideoConvert,在X100时代AT就随驱动附赠这款小工具,但由于输出画质差、功能有限、高中低端显卡毫无差别的原因,该软件争议比较大,此后AVIV沉寂了很长一段时间,并不再对H2000/H300显卡提供支持。真正使用PU进行转码的软件,Badaoom是第一款,Baom再次唤醒了人们对

4、GPG的认识,现在笔者就主要介绍下Badabom这款软件,该软件版本更新很频繁,经过一年多时间的发展,兼容性不断加强、转换效率越来越高,虽然还存在一些问题,但作为CUDA应用的鼻祖,也是一款好用且速度快的视频转码软件.Bao支持的视频种类: 输入视频编码:PG、MPEG2、V1、H。4/VC、AVCD、DV、AW、MV、VC、DiX、Xvid、FRAPS 输入音频编码:C-3、MP、PCM、AC输入视频格式:M2V、MPG、VOB、VI、TRP、S、M2、M2S、MPEG、MT、MOV、MP4、V、WMV输出视频编码:H.26(MP),支持BselinePro rfile,最高支持.1版本,支

5、持CABAC、动态比特率、反交错输出视频分辨率:最高1080,最低32,常见分辨率均支持 输出视频码率:500Mp2500Ms输出音频编码:AAC-LC(2 Cannl) Badabom的特点和优点: 界面简洁,极易上手 专门针对手持设备和娱乐设备设计,输出兼容性很好 对GPU利用率很高,转码速度快 Badboom的缺点:界面支持中文,却不支持中文文件名和目录 网络流行的RVB不支持,很多VI和WMV也不支持不支持压字幕到视频里面 不支持批量转换Badabom最新版本:1。2。1.测试版3次转换机会,转出视频带EenalLoo完整版售价2.9美元(2048人民币)国产最佳免费编码软件:Medi

6、aCderBadabo的种种局限让它在大陆水土难服。作为用户来说,CUDA技术有多强悍并不重要,最重要的是它能带来什么样的好处,在媒体铺天盖地的宣传UDA优势之时,最终用户却还在忍受PU转换视频那蜗牛般的速度,情何以堪?终于,完全开源并且永久免费的MediCder在最新版本当中加入了CUDA编码器。引用Medaode开发人员的话说就是:“近两年NIDI的UA技术似乎成为业界新宠,其优良的科学运算加速能力确实首屈一指,引领着并行运算潮流,各行业都纷纷采用它来加速,搞得我们也跃跃欲试,呵呵,另外还有很多网友对MediaCoder的厚爱,希望在上体验一下CUDA加速的快感,于是我们决定了用UD加速M

7、diCoder转码。” Mediaoe 的CP核心使用控制技术非常成熟,你甚至可以自定义每个核心做什么工作!笔者一直都是MedaCodr软件的忠实用户,该软件由于对多核CPU优化支持非常到位,因此我们经常用它进行CPU视频编码测试,也常用它给iPo转视频看。现在它率先支持CUDA,笔者自然要对其进行深入测试,从兼容性、易用性、速度等各方面考察,与CUA的代表作Badbom进行全面对比! MediaCder软件介绍:终极转码or完美转码或许很多人还没用过MeiaCoder这款软件,下面就先对它进行简要介绍:ediod是一个免费的通用音频/视频批量转码工具,它将众多来自开源社区的优秀音频视频编解码

8、器和工具整合为一个通用的解决方案,可以将音频、视频文件在各种格式之间进行转换。MeiaCoder具备一个可扩展的架构和丰富的功能,可满足各种场合下的转码需求。目前,MediaCoder的用户已经遍布全世界17多个国家.通俗一点的说:玩高清的朋友一定用过终极解码或者完美解码吧,终极解码就是整合了一大堆播放器和解码器的视频播放软件,而MediaCode就是整合了一大堆编码器和插件的视频转码软件。功能大而全、灵活性高、开源、免费是这类软件的共性,如果要为MediCder起个中文名称的话,笔者认为“终极转码”或者“完美转码”都不错. Miade功能简介:实现各种音频视频格式间的相互转换丰富的可调整的编

9、码参数丰富的视频处理滤镜,包括反交错、裁剪、分辨率调整、亮度色彩调整等丰富的音频处理滤镜,包括声道映射、重采样、音量调整等 MedaCode主要特点:基于优秀的众多的开源编解码后台,能够解码和编码的格式多良好的多线程设计,为多核处理器优化,在四核上可达到0%以上的平均CP使用率 极为丰富的可调整的编码参数全部编解码器自带,不依赖于系统的编解码器和任何组件良好的可扩展的程序架构,快速适应新的需求,不断增加新的格式的支持可用脚本语言扩展界面,支持众多影音设备 MedaCoder支持格式:MP3, Vrbis, AAC, C/HE-AAC, AAC+2/HEAC 2, MsePa,peex, AMR

10、, WMA, RealAuo,mp3PRO*FA,WvPack, Monkes Audio, ptimFrg, AC osess,TA, WAV/CM, Waveom。26, XviD, DivX, MPEG1/2/, heora,Flah Vdo,Dira,3vx, ealVideo, Window Meda VideoAI,MPGV, Matrsa,M, PMP, Realia, ASF, ucktime, OGM*CD, D,C, SD, CUEShe, HP*, FTP, RTSP,UDPMediaCde 0.。3。4685最新版下载链接: 官方网站 同时支持UDA与tram:Medi

11、ahow Cybrink(讯连科技)旗下大名鼎鼎PoweDVD相信大家都非常熟悉,作为一家专注视频与多媒体的软件开发商,Cyberlik不久前推出了一款专业的快速视频转换软件-MeiaSho,需要注意的是MediaShw(魅力四射)是一款集视频编辑、视频转换、图片处理等功能为一体的应用软件,功能非常实用. Mdiahow 是第一款同时支持CUD与Stream加速的视频转换软件,除此之外它还对IntlCoei7处理器的超线程及SE4指令集做了优化,因此无论纯CPU转码还是GPU加速,其速度比一般的传统软件快。界面简洁明了,功能和操作方法一目了然,这就是MedaSw spso的最大特色,它与Bad

12、bm的类似,主要针对手持设备或娱乐设备转换视频。其兼容性与aboom不相上下,但视频输出格式更多,没有局限于MP4这一种,但在自定义分辨率和码率方面,没有Badaoom那么灵活。 每种设备提供的分辨率有限、码率不可调,软件能自动识别显卡是否支持U或Srea,默认为开启。这种内置输出模式的设定,对于高级用户来说可能不够灵活,但对于初级用户来说还是很方便的,用户无需关心视频的画质及分辨率,软件内置的模式肯定是最优的方案.MeiaSw Espresso支持的视频种类:输入视频格式:A、PEG、MPEG、MOV、WMV、MP4、VR-MS、T、MPG、AS、M2T、M2T、M、DV-AV、VOB、VR

13、O、MD、DAT、T、Tio、WT 输出视频格式:PG2、MPEG4、MPEG4AVC、WMV 兼容输出设备:iPhon、iPod uch、iod Nano、o lasic、SP、PlaSatin 3、Box、Zue 输出视频分辨率:针对特殊设备设定,分辨率有限,无法自定义输出视频码率:针对手持设备优化,无法自定义码率 MedSh的特点和优点:界面友好,操作方便 专门针对手持设备和娱乐设备设计,输出兼容性很好 同时支持UDA和Strm,并对i7优化 支持批量转换MediaShow 的缺点:网络流行的RMV不支持,和不少MT、VI等也存在兼容性问题 不支持压字幕到视频里面 分辨率和码率都无法自定

14、义MediaSho 最新版本:5.0.0430。121Mediahow最新试用版下载链接30天使用期限,免费转换H.264视频50次 完整版售价60元人民币三款软件设置:输出视频保持一致 测试视频的选择:两部具有代表性的视频为了更加贴近广大用户日常操作时的应用,笔者选择了两部视频进行转码测试,考虑到一整部电影的转码时间动辄好几个小时,因此测试用影片为片段。第一部为280X0(72P)转iPhone(480X27),这个设定非常贴近喜欢给手机MP4等手持移动设备转视频的用户需要。影片为波斯王子:遗忘之沙预告片,转换后为。6编码P封装.第二部为1080p转2p,模拟经常为网络提供7视频下载的那部分

15、热心用户、或者想把高清视频压缩保存至D刻盘的那部分“光盘党”.影片仍然为波斯王子:遗忘之沙预告片,1080p 24编码2TS封装,将其转换为720p H.4编码MP4封装。 测试软件设置:保证三款软件拥有相同的码率和格式三款软件中,只有MiaShw是无法自定义码率和格式的,因此所有的测试均以MedaShow Eseso为准,通过分析MediaShow rso转换输出文件的码率和格式,让adabom和MediaCode向它看齐,最大限度的保证三款软件输出视频拥有相同的画质。MeiSho设置说明: 第一部视频,edaShow直接输出iPhoe 4800分辨率即可,最终视频码率为149bps.第二部

16、视频,MedaShow Esrsso输出为P3 1287分辨率,最终视频码率为约9000Kbs。aShow的UDA加速默认为开启,除了测试四款显卡的加速能力之外还测试了纯CPU编码时的转码速度,作为对比。Badabom设置说明:第一部视频,Badaboom内置的iPhone转码方案与MeiaSow完全相同,视频码率也是142Kps,因此不用做任何设置直接转码即可,最终获得的视频文件体积也与MdiSw基本相同。第二部视频,Badoo选择右侧最下方的自定义方案,码率设定为94Kbps,选择Main Pri、开启CAC、H26 4。0版(为了与MediaShow保持一致),音频码率提高到256Kbp

17、,这样就能获得与ediaShow差不多画质/大小的视频。Bdabo不支持纯CPU转码,也不支持A卡,因此不进行软解测试。MediaCr设置说明: idCod其实也提供了参考转码方案,但必须安装Fiox浏览器并联网才能访问“功能”“设备转码平台”,然后选择iPhone设备。或者使用针对各种移动设备的专用版本,这样做太麻烦,还不如自行手动设定,参考设置如下:修改“视频”中的“编码器”设置,选择是否启用G加速,必须相应修改“画面”中的“效果”菜单选项,如上图所示。第一步视频,使用上图所示的设定,转换出来的视频就与Badbom没有太大差别,都是Belin 。1版本,接近10ps的码率,输出文件体积相差

18、不过1M。第二部视频稍作更改,分辨率改为72,码率增至90Kbp,H24版本调为与edahw和Bdaboo相同的High4。0配置,并开启CABAC,最终获得的视频文件码率和体积都差不多。将编码器换为X4就能禁用PU编码,完全使用普通的CP编码,这样就能直接对比D编码器与X264编码器的转换效率,看看性能提升幅度到底有多大。颗CPU、3款软件、颗GP一网打净 测试系统配置: PU高端、主流各选一款 4核8线程的Corei可以说是当前压片的神器了,现在已经有很多视频相关软件加入了对S4。1指令集以及H超线程技术的优化.但是顶级re i7价格依然高高在上,没有性价比可言,所以我们此次测试选择的是8

19、7。新产品的出现让老牌双核王者E8400退居二线,所以此次笔者特意选择了目前最受追捧的主流双核i3 3,它的主频和i75一样,同样支持超线程,单核性能也不输给它。 六款显卡,两大阵营的另类对决 显卡两大阵营的游戏性能P屡见不鲜,而正儿八经的转码PK却是并不常见,此次也尽量选择了市场上的主流产品,并注意拉开距离,高端GTX40 VS HD587巅峰对话,主流及入门GTX45和G P H30和HD670,6款显卡均为两大阵营明星产品.两颗CPU、6款显卡鏖战MeiaCoder 首先还是在顶级的Coi7平台上进行测试,作为ntel新一代处理器,i7支持SE41、SSE4.2指令集,对多媒体性能优化最

20、好,而且超线程技术也能让视频转码性能提升不少。目前包括MediShow、ediaCd、TMPEGnc、PwerDirct在内的很多视频编辑/转换软件都对i指令集提供了优化支持.720(180X70)转Pe(4802H264)MP4大家可以看到,事实上因为MdaCoder不支持A卡加速,所以在用A卡的平台上,转码就是在用CPU软解。而MedaCd对PU的要求不算高,TX465已经完全可以满足它的胃口,更高端的显卡并不能让转码进行的更快.而Mediade让多核P的潜力发挥的非常出色,整体成绩都很不错,即使i3也仅仅用了8秒就转完了2分30秒的视频,速度很快。 H。6编码1080p转72数据量更为庞

21、大的100p压720p的测试中,N卡平台依然借助CUA全面领先,有意思的是i3+GT40恰好和i7软件性能一样。而3和i7在性能上拉开了差距。MediaCode的转码性能显然是最强的,因为它不但充分利用了CPU资源,而且GU的贡献也不少,采用NIDI显卡的平台在转码中都有不小优势,当然,这款软件并不能榨干显卡的潜力,GTX460和GT480性能基本没有区别。两颗C、6款显卡鏖战Mdahw 720P(128X720)转iPhone(48270 。64)P4edahow对A/N卡均提供了支持,从测试的结果来看,似乎A卡要比N卡稍快一点。但是这款软件似乎既不能榨干CPU也不能用尽GPU,转码速度要比

22、MedCoder整体慢不少,而高中低端平台也没有拉开多少差距。 H。264编码08转20数据量更为庞大的1080压20的测试中,情况发生戏剧性变化,原本棋逢对手的局面被打破,N卡中高端两款显卡发挥出色,将对手抛在了身后.而HD670和G24则打成了平局。而随着分辨率码率的大大提升,CPU软解也显露疲态,即使低端显卡+i3也能轻松灭掉四核八线程的i7.NIA的舞台:Baoom dao作为最早实现P加速的实用解码软件,目前为止仍然和A卡无缘。所以这个项目的测试变成VII的内战。在显卡利用率方面,恐怕没有人能比boom更厉害,从测试结果来看,显卡性能提升对转码速度有非常明显的帮助。采用中高端显卡转手

23、机视屏居然比Mdisow 中CGPU的速度还要快。当然,一条腿走路的它最终还是无法打败edaCoder。前文将三款软件分开来写,可能对于速度的比较大家看起来不是很方便,这里就100P转20的成绩,将三款转码软件做一个汇总。从上表中我们可以看出,虽然MdiaCode不支持卡加速拖了整体成绩的后腿,然而和MeiaSho相比,依然以很大优势胜出,就连CP软解,MediaShow也是难以望其项背!难道这里面存在猫腻?流言止于真相,目前的CUA ncoder主要模块实际上是由NVIDI自己编写的,然后透过CDA AP的方式把这些模块提供给诸如Cybrink、Nero、BIT等公司完成软件整合.因此在输出

24、码率相近、设置相同的情况下,几款UDA转码软件输出视频的画质基本没有区别。而小编通过仔细对比几款软件输出的视频,也印证了这一说法.因此,我们完全不用担心视频输出画质的问题,只关心速度就够了。现在问题就是:那个环节导致MiaCoder能以如此大的优势胜出呢?由于编码器相同,那么转码软件的速度差异就主要体现在视频“解码”这一环节了。Badabom使用UDA进行解码,因此对CP的要求很低,如果使用高端显卡则速度会有很大的提升;MedCoe和MediaShw使用CPU进行软解码,对于P的依赖性非常大,而MediaCoer还使用GP进行分辨率缩放处理。也许有人会问,视频解码很消耗资源吗?现在随便一颗主流

25、双核都可以软解高清视频,解码也会成为速度瓶颈?话是没错,但要知道我们平常看片是用24fps X普通倍速解码视频,此时的CPU占用率不会很高,但在视频转换过程中,解码速度动辄上百帧,此时CU资源消耗就不容小视了。转码速度越快、解码所消耗的PU资源就越高,因此解码器效率的高低会对转码速度造成很大幅度的影响。 视频转码的瓶颈在哪?CDA加速的奥秘解析: 通过任务管理器监控MdaCoder的几大模块,我们就可以进一步了解DA是如何加速视频转换的。下图就是MediaCoer在视频转换过程中的四大进程: 可以看到,CPU占用率最高的就是X24编码器,达80-90%,解码器次之10%左右,而主程序和音频编码

26、器在前两者面前几乎就是微不足道的。显而易见,编码器是视频转换过程最大的瓶颈,将24编码器换为CUDA之后,编码器本身的CP占用率下降不少,而解码器的U占用率上升不少,也就是说编码器节省出来不少CU资源给解码器用,此消彼长之后达到了一个更为合理的平衡状态。由于GP参与运算,消除了解码器等待编码器这一严重的瓶颈,从而使得转码效率大大提高。水落石出!同为GGU加速,效率大不同 通过前面的测试和分析我们已经对三款软件的实力有了比较全面的了解,MediCod虽然不支持卡但是靠它对U的合理支持,弥补了这一不足,而用N卡加速以后更是如虎添翼,成绩大幅领先其它两款转码软件。Bdaboom因为只能用GPU一条腿

27、走路,性能受到局限自不必说。Meiahow CU+GU转码成绩也是和iaCode相去甚远,同样的平台,转码效率却是大相径庭。如果您对这一测试结果还有疑虑的话,看下面的截图就豁然开朗了! Badabm显然对CPU的利用率很低,而ediCe和Meiah虽然都支持P+UDA转码,但对CP的利用率MediSo显然要差了很多,从截图我们可以看出,Meiaod转码时PU八个虚拟核心都达到了左右,GX4也是运行在标准频率。反观MeiaShow转码时CP只有6个虚拟核心利用率在0%左右震荡,其它两个核心无所事事。GPU居然也是降频到了00Hz,如此磨洋工,难怪成绩不如人,这也印证了我们上文分析的观点。总结:C

28、UA前途光明 NIDIA通过Bdaoo证明了GU及CUDA的强大,但是视频转码速度却没有得到质的提升,也许把所有任务都交给GPU处理并不是最好的选择,尤其是在高端平台。如果比绝对速度的话,使用CP解码、GPU编码的Mediaoe是目前速度最快的视频转换软件,它充分利用了PU的资源,也较好的利用了PU资源,两者相辅相成,让视频转换速度得到了飞跃式提升。这就是近年来最常提及的GUCP异构计算的概念.异构计算是指系统内不同的运算部件负责各自擅长的计算,从而达到最佳的运算效率。在视频转码领域,如果能让CPU和GU的所有资源都达到10满负荷运行,那么性能肯定是最高的,目前来看,无论Badabm、Mdia

29、Codr还是Mediahow都没能实现,相对来说MediaCder是做的最好的,相信随着CA编码器和软件优化不断完善、进一步平衡算法,视频转码速度还能更上一层楼!总得来说,显示芯片的性质类似trem pcesr,适合一次进行大量相同的工作。CP则比较有弹性,能同时进行变化较多的工作。伴随着高清时代和移动影音娱乐大潮的袭来,消费者对视频转码的需求也越来越高.而面对视频转码这样的超大数据量并行计算应用,仅仅靠CP很难达到最佳效果,专为并行计算而生的GPU成了高质量快速转码的最佳选择.通过今天我们的测试大家可以发现,在旗舰级、玩家级、入门级显卡的视频转码性能对比上,NVIDIA显卡凭借CDA视频编码

30、引擎的高效率,总体成绩大幅度领先于竞争对手的产品,可以有效的缩短用户在视频转码过程中的等待时间,从而节约更多的电能。同时,由于GPU硬件加速的引入,转码过程中CPU将不会长时间保持在00占用率的满负荷状态下,而且转码工作并非抢占资源形。也就是说,只要玩家配置一台相对较高端的PC,在使用NIDIA显卡帮助进行视频转码的过程中,依然可以同时进行办公、上网等低负荷操作,将纯粹的等待时间降低到.相比之下,AD虽然也为自己的显卡产品提供了硬件加速视频转码软件,但现在拿的出手的仅仅只有Mediaho这么一款独苗,而且转码效率差强人意。曾几何时,玩家们在阅读显卡测试文章时,最关注的都是同级别产品间在游戏或专

31、用测试程序中的得分比较。但相信大家在这些对比中,也从未看到过同级别产品出现如今天测试这么巨大的差距.在游戏性能难分伯仲的情况下,NVID显卡通过CUDA架构的引入,给软件开发提供了良好的平台和支持,从而诞生出了大量优秀而又实用的应用软件,为用户提供了更多的附加价值,因而更具性价比.可能目前来看CUDA在桌面的应用范围主要停留在转码倍线3转换这些应用中,但是随着更新的操作系统问世,GPU非图形计算必将发展壮大。在这些全新的操作系统中,GU也许将不仅仅是图形处理器,它还将成为所有应用程序均可使用的通用并行处理器,让CPU从繁杂的并行计算中解脱出来,而让整个系统更加高效。文中如有不足,请您指教!10 / 10

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!