您现在的位置是:首页 > 科技资讯科技资讯

ati stream sdk(请问CUDA是什么意思)

编辑 2024-06-05 10:27:58 科技资讯

1. ati stream sdk,请问CUDA是什么意思?

CUDA呢简单来说就是GPU通用运算的一种编程框架。我这么说一定是不好理解了。 我得从头讲了。 GPU通用运算的含义简单地说就是让显卡的GPU去帮助cpu去干事儿。通用,是相对于专用而言,GPU用于游戏加速,那就是专用处理器,在普通软件的运用中,GPU的计算资源一般是闲置的,而承担运算工作的是CPU,CPU就是典型的通用计算处理器。所以在游戏的时候cpu也要工作。这就是为什么一般游戏都有个cpu的要求。用gpu通用运算是有好处的。一般来说衡量运算能力使用浮点运算速度。(浮点运算简单地说就是 加减乘除)cpu要远远低于gpu 就拿I7 来说 i7 950的浮点运算能力基本上才相当于GTX580gpu的四十分之一。这么强的能力不用 那就浪费了。所以大家就开使动脑子打gpu的主意。 最开始ATI提出了stream框架 来调用GPU协助cpu工作 但是没有之后Nvida、推出的CUDA有名。当然除了这俩还有其它的框架。 stream和 CUDA只适用于 各自的品牌 还不能完全称得上通用。 OpenCL 和 DirectCompute 就是两个大家全能用的通用框架。前者时apple所倡导的 后者是微软所开发的。这就是为什么 iso6系统的safari要比之前的都要快很多 这就是为什么ie10要比ie9快很多的原因 因为它们都可以调用了gpu来帮助运算。加快速度。前者被苹果低调的使用 后者被微软写入到DirectX11中 成为了标准。 再说回CUDA,CUDA是Compute Unified Device Architecture的缩写。我也不大会翻译 就叫cuda好了 这东西 用他的好处就是能调用GPU的平行运算能力 和强大的浮点运算能力。在视频解码。或者处理游戏中物理**的时候有非常好的效果(如果用cpu 去算现在游戏所运用的物理** 那cpu就会累死)其实日常用处很少。也就游戏和视频编码用得上。 cuda的用处还有很多 其实用在消费级的地方cuda很少大部分用在了特殊领域了。 很多超级计算中心 比如计算天气预告需要进行海量的数据计算 就应用得到gpu的运算能力了。销售人员忽悠你买所以一定会说这个好。 而且CUDA这个英文 听起来也很高端 心里作用下 可能更会打动你买。

ati stream sdk(请问CUDA是什么意思)

2. 4850显卡好不好?

很好。4850显卡是ATI(现在被AMD收购)公司推出的一款中高端显卡,采用了40纳米工艺,具有比较不错的性能。

该显卡采用了GDDR5显存,频率为2000MHz,这种显存是比较出色的,可以提供快速的数据读写速度,从而提高显卡性能。GPU核心频率为 625MHz,基本可以满足大多数游戏和软件的需求。

此外,4850显卡也采用了ATI公司的技术,例如Stream Technology和Unified Video Decoder等,可以为用户提供更好的图形和视频性能体验。

不过需要注意的是,4850显卡使用时需要较高的功耗,这可能导致显卡发热问题。同时,它也不能支持DirectX 11等新技术,虽然这对于那些旧的游戏来说无所谓,但它在当前游戏中可能就有所不足。

总的来说,4850显卡的性能比较出色,它是一款相对优秀的显卡,但由于年代比较久远,已经无法满足目前现代游戏和软件的要求,已经过时。如果您是在购买新显卡时,建议考虑更高端的显卡,以满足更高的性能需求。

3. hd5450?

HD5450是5系列显卡中入门级的产品,2010年2月发布。HD5450显卡支持三大技术,分别是微软最新的3D API DirectX 11、多屏显示技术ATI Eyefinity以及并行计算技术ATI Stream。下面是HD5450的显卡参数:

显存容量:512MB。显存位宽:64bit。流处理量: 80个。核心频率:650MHZ。

4. 海尔的笔记本电脑好吗?

1、优点:海尔电脑是国内品牌中唯一一个拥有自有笔记本电脑制造工厂的厂商,并有自己的笔记本电脑研发中心。它先后推出的海尔润眼电脑、润清笔记本,取得了市场和消费者的高度认可。它以用户健康为出发点,不断开发和升级润眼技术,并把润眼技术先后移植到笔记本、一体机等产品上,受到广大"关注用眼健康"用户的一致好评。

2、缺点:海尔的配置相对其他类型的笔记本电脑来说稍弱,更适合作为家用电脑,而不宜作为商务电脑。另外,其机箱大,温度高,散热性较差。

5. R600内部的这5个ALU与传统GPU的ALU有所不同?

第一章:第二代及以后的GPU工作流程简介简单(而不一定绝对科学)的说:GPU主要完成对3D图形的处理--图形的生成渲染。GPU的图形(处理)流水线完成如下的工作:(并不一定是按照如下顺序)顶点处理:这阶段GPU读取描述3D图形外观的顶点数据并根据顶点数据确定3D图形的形状及位置关系,建立起3D图形的骨架。在支持DX8和DX9规格的GPU中,这些工作由硬件实现的Vertex Shader(定点着色器)完成。光栅化计算:显示器实际显示的图像是由像素组成的,我们需要将上面生成的图形上的点和线通过一定的算法转换到相应的像素点。把一个矢量图形转换为一系列像素点的过程就称为光栅化。例如,一条数学表示的斜线段,最终被转化成阶梯状的连续像素点。纹理帖图:顶点单元生成的多边形只构成了3D物体的轮廓,而纹理映射(texture mapping)工作完成对多变形表面的帖图,通俗的说,就是将多边形的表面贴上相应的图片,从而生成“真实”的图形。TMU(Texture mapping unit)即是用来完成此项工作。 像素处理:这阶段(在对每个像素进行光栅化处理期间)GPU完成对像素的计算和处理,从而确定每个像素的最终属性。在支持DX8和DX9规格的GPU中,这些工作由硬件实现的Pixel Shader(像素着色器)完成。最终输出:由ROP(光栅化引擎)最终完成像素的输出,1帧渲染完毕后,被送到显存帧缓冲区。总结:GPU的工作通俗的来说就是完成3D图形的生成,将图形映射到相应的像素点上,对每个像素进行计算确定最终颜色并完成输出。第二章:DirectX8和DirectX9 GPU的传统流水线前面的工作流程其实已经说明了问题。本章来总结一下,承前启后。传统的GPU功能部件我们不妨将其分为顶点单元和像素流水线两部分。顶点单元由数个硬件实现的Vertex Shader组成。传统的像素流水线由几组PSU(Pixel Shader Unit)+TMU+ROP组成。于是,传统的GPU由顶点单元生成多边形,并由像素流水线负责像素渲染和输出。对于像素流水线需要做的说明是:虽然传统的流水线被认为=1PSU+1TMU+1ROP,但这个比例不是恒定的,例如在RadeonX1000(不包括X1800)系列中被广为称道的3:1黄金架构,PSU:TMU:ROP的数量为3:1:1。一块典型的X1900显卡具有48个PSU,16个TMU和16个ROP。之所以采用这种设计方法,主要考虑到在当今的游戏中,像素指令数要远远大于纹理指令的数量。ATI凭借这个优秀的架构,成功击败了Geforce7,在DX9后期取得了3D效能上的领先。总结:传统的GPU由顶点单元生成多边形,像素流水线渲染像素并输出,一条像素流水线包含PSU,TMU,和ROP(有的资料中不包含ROP),比例通常为1:1:1,但不固定。第三章:顶点和像素操作指令GPU通过执行相应的指令来完成对顶点和像素的操作。熟悉OpenGL或Direct3D编程的人应该知道,像素通常使用RGB三原色和alpha值共4个通道(属性)来描述。而对于顶点,也通常使用XYZ和W 4个通道(属性)来描述。因而,通常执行一条顶点和像素指令需要完成4次计算,我们这里成这种指令为4D矢量指令(4维)。当然,并不是所有的指令都是4D指令,在实际处理中,还会出现大量的1D标量指令以及2D,3D指令。总结:由于定点和像素通常用4元组表示属性,因而顶点和像素操作通常是4D矢量操作,但也存在标量操作。第四章:传统GPU指令的执行传统的GPU基于SIMD的架构。SIMD即Single Instruction Multiple Data,单指令多数据。其实这很好理解,传统的VS和PS中的ALU(算术逻辑单元,通常每个VS或PS中都会有一个ALU,但这不是一定的,例如G70和R5XX有两个)都能够在一个周期内(即同时)完成对矢量4个通道的运算。比如执行一条4D指令,PS或VS中的ALU对指令对应定点和像素的4个属性数据都进行了相应的计算。这便是SIMD的由来。这种ALU我们暂且称它为4D ALU。需要注意的是,4D SIMD架构虽然很适合处理4D指令,但遇到1D指令的时候效率便会降为原来的1/4。此时ALU 3/4的资源都被闲置。为了提高PS VS执行1D 2D 3D指令时的资源利用率,DirectX9时代的GPU通常采用1D+3D或2D+2D ALU。这便是Co-issue技术。这种ALU对4D指令的计算时仍然效能与传统的ALU相同,但当遇到1D 2D 3D指令时效率则会高不少,例如如下指令:ADD R0.xyz , R0,R1 //此指令是将R0,R1矢量的x,y,z值相加 结果赋值给R0ADD R3.x , R2,R3 //此指令是将R2 R3矢量的w值相加 结果赋值给R3对于传统的4D ALU,显然需要两个周期才能完成,第一个周期ALU利用率75% ,第二个周期利用率25%。而对于1D+3D的ALU,这两条指令可以融合为一条4D指令,因而只需要一个周期便可以完成,ALU利用率100%。但当然,即使采用co-issue,ALU利用率也不可能总达到100%,这涉及到指令并行的相关性等问题,而且,更直观的,上述两条指令显然不能被2D+2D ALU一周期完成,而且同样,两条2D指令也不能被1D+3D ALU一周期完成。传统GPU在对非4D指令的处理显然不是很灵活。总结:传统的GPU中定点和像素处理分别由VS和PS来完成,每个VS PS单元中通常有一个4D ALU,可以在一个周期完成4D矢量操作,但这种ALU对1D 2D 3D操作效率低下,为了弥补,DX9显卡中ALU常被设置为1D+3D 2D+2D等形式。第五章:统一渲染架构相对于DirectX 9来说,最新的DirectX 10最大的改进在于提出了统一渲染架构,即Unified Shader。传统的显卡GPU一直采用分离式架构,顶点处理和像素处理分别由Vertex Shader和Pixel Shader来完成,于是,当GPU核心设计完成时,PS和VS的数量便确定下来了。但是不同的游戏对于两者处理量需求是不同的,这种固定比例的PS VS设计显然不够灵活,为了解决这个问题,DirectX10规范中提出了了统一渲染架构。不论是顶点数据还是像素数据,他们在计算上都有很多共同点,例如通常情况下,他们都是4D矢量,而且在ALU中的计算都是没有分别的浮点运算。这些为统一渲染的实现提供了可能。在统一渲染架构中,PS单元和VS单元都被通用的US单元所取代,nVidia的实现中称其为streaming processer,即流处理器,这种US单元既可以处理顶点数据,又可以处理像素数据,因而GPU可以根据实际处理需求进行灵活的分配,这样便有效避免了传统分离式架构中VS和PS工作量不均的情况。总结:统一渲染架构使用US(通常为SP)单元取代了传统的固定数目的VS和PS单元,US既可以完成顶点操作,又可以完成像素操作,因而可以根据游戏需要灵活分配,从而提高了资源利用率。第六章:G80和R600的统一渲染架构实现以下我们着重讨论G80和R600的统一着色单元而不考虑纹理单元,ROP等因素。G80 GPU中安排了16组共128个统一标量着色器,被叫做stream processors,后面我们将其简称为SP。每个SP都包含有一个全功能的1D ALU。该ALU可以在一周期内完成乘加操作(MADD)。也许有人已经注意到了,在前面传统GPU中VS和PS的ALU都是4D的,但在这里,每个SP中的ALU都是1D标量ALU。没错,这就是很多资料中提及的MIMD(多指令多数据)架构,G80走的是彻底的标量化路线,将ALU拆分为了最基本的1D 标量ALU,并实现了128个1D标量SP,于是,传统GPU中一个周期完成的4D矢量操作,在这种标量SP中需4个周期才能完成,或者说,1个4D操作需要4个SP并行处理完成。这种实现的最大好处是灵活,不论是1D,2D,3D,4D指令,G80得便宜其全部将其拆成1D指令来处理。指令其实与矢量运算拆分一样。例如一个4D矢量指令 ADD R0.xyzw , R0,R1 R0与R1矢量相加,结果赋R0G80的编译器会将其拆分为4个1D标量运算指令并将其分派给4个SP:ADD R0.x , R0,R1 ADD R0.y , R0,R1 ADD R0.z , R0,R1ADD R0.w, R0,R1综上:G80的架构可以用128X1D来描述。R600的实现方式则与G80有很大的不同,它仍然采用SIMD架构。在R600的核心里,共设计了4组共64个流处理器,但每个处理器中拥有1个5D ALU,其实更加准确地说,应该是5个1D ALU。因为每个流处理器中的ALU可以任意以1+1+1+1+1或1+4或2+3等方式搭配(以往的GPU往往只能是1D+3D或2D+2D)。ATI将这些ALU称作streaming processing unit,因而,ATI宣称R600拥有320个SPU。我们考虑R600的每个流处理器,它每个周期只能执行一条指令,但是流处理器中却拥有5个1D ALU。ATI为了提高ALU利用率,采用了VLIW体系(Very Large Instruction Word)设计。将多个短指令合并成为一组长的指令交给流处理器去执行。例如,R600可以5条1D指令合并为一组5DVLIW指令。对于下述指令:ADD R0.xyz , R0,R1 //3DADD R4.x , R4,R5 //1DADD R2.x , R2,R3 //1DR600也可以将其集成为一条VL

6. hd5450是什么芯片?

HD5450是ATI芯片的一种,采用了80个Streaming Processor处理单元,硬件规格上支持DirectX 11 API和AMD独有的Eyefinity宽域技术。

镭风 HD5450夜蜥版采用了40nm新工艺制程,核心研发代号也许会是RV810,它采用了80个Streaming Processor处理单元,硬件规格上支持DirectX 11 API和AMD独有的Eyefinity宽域技术。散热方面,镭风 HD5450夜蜥版搭配了静音显卡散热器,提供了良好的静音使用环境。它搭配了GDDR2显存颗粒,组成了512MB/64bit的显存规格,显卡默认频率为650/800MHz。

7. DP和HDMI电脑用哪个效果好?

在我们的电脑出现的历史中,有很多接口出现了,仅视频接口我们目前能常接触到的就有VGA、DVI、HDMI和DP接口,而且到目前为止,还是有很多显卡还在支持老式的VGA、DVI接口。目前的公版显卡上会有HDMI和DP两种接口,但是一般的显卡制造商会在显卡上添加一个DVI接口,不过目前我们新买的显示器接口齐全的话也会带着这三种接口,VGA目前被淘汰掉了,这是因为VGA传输的是模拟信号。那除了形状不一样,这几个接口又有什么大的差别呢?

HDMI接口

HDMI既能传输高清图形画面信号,也能够传输音频信号,一般来说家里会接电视,而且抗干扰强。目前最高的HDMI2.1标准,支持8k 60Hz和4k 120Hz,分辨率最高可以达到10K。其还支持高动态范围HDR,并且带宽提高到了48Gbps。

DP接口

DP接口也是一种高清数字显示接口标准,可以连接电脑和显示器,也可以连接电脑和家庭影院。DP接口可以理解是HDMI的加强版,在音频和视频传输方面更加强悍。目前情况下,DP与HDMI在性能上没有多大区别。如果你使用3840*2160分辨率(4K),HDMI由于带宽不足,最大只能传送30帧,DP就没有问题。

上面我们了解了各个接口的区别,还提到了色深、带宽等概念。其实目前主流的已经是HDMI和DP两种接口了,但是两者之间还是有很大的区别,特别是在带宽上,其实我们的图像信号传输,所需要的带宽也是很高的。

下面就来了解一下接口、带宽、分辨率、色深之间的关系。

色深(bit)

我们先来了解一下色深吧。

我们常常能看到一些面向色彩专业领域的显示器有标上8bit/10bit面板,那bit是什么意思,我们该怎么去理解?

其实bit代表的还是计算机二进制中的基本单位,而二进制信息是由0和1组成的,套用到显示器上也是一样的。

我们假设我做了一台显示器,采用的是1bit面板,表示显示器的像素点只能识别1位信息,那么这个像素点可以展现的信息是“1”或者是“0”,那么这个像素点可以显示2(2^1)位颜色,而每个像素点是由RGB三种颜色组成,所以最终我们显示器可以展现出2^1^3=8种颜色。

而我们假设我做的显示器是2bit面板时,表示显示器的像素点只能识别1位信息,那么这个像素点可以展现的信息是“00”“01”“10”和“11”四种,那么这个像素点可以显示2^2^3=64种颜色。

以此类推,显示器如果是8bit面板将可显示2^8^3=16777216种颜色。

可能有的网友就要问了,色深和带宽接口有什么关系。前面我们就已经说到了,bit代表的是一个数据(0/1),而我们的接口是用来传输数据的,带宽则代表了接口传输数据的快慢。

计算各种分辨率下所需要的带宽

很多时候并不是我们的电脑不行,很可能是你用的接口限制了你的画面传输。

目前我们一般使用的显示器是8bit色深的显示器,那我们就来计算一下在8bit色深(因为一个像素点是由RGB三色组成,所以一个像素点的数据需求24bit),60fps的情况下,1080p、2K、4K各自需要多少的带宽进行数据传输:

1080p:1920×1080×24bit×60fps=2.99Gbps

2K:2048×1556×24bit×60fps=4.59Gbps

4K:4096×2160×24bit×60fps=11.94Gbps

这个计算结果是非常理论化的,还有别的因素要考虑。HDMI使用的TMDS(最小化传输差分信号)机制,8bit/10bit编码方式,实际效率是理论值的80%,所以那个11.94Gbps的带宽实际需要1.25倍带宽,也就是14.9Gbps。而DP则不会出现这种问题。

面对来势汹汹的4K高清我们怎么选?

国际电联ITU设定的观看4K最佳帧频是120Hz,最低色彩编码是10-bit,否则的话,不能称得上是真正的4K。目前4K分为了入门级4K、运营商级4K、极致4K。其中运营商级4K体验标准可以满足60Hz帧率、10-bit色深,接入带宽要求在50兆以上。目前大规模宣传的是4K 30Hz,而极致4K则需要4K/120Hz/12bit。

接下来继续计算:

入门级4K:4096×2160×24bit×30fps=6.37Gbps

运营级4K:4096×2160×30bit×60fps=15.93Gbps

极致级4K:4096×2160×36bit×120fps=38.22Gbps

目前HDMI2.1的速率为48Gbps,DP1.4的速率为32.4Gbps,虽然看起来HDMI速率比DP要好,但是HDMI传输仅仅只能达到80%效率,而且还有音频要占用带宽,面对极致4K使用HDMI2.1的线材也不一定够用。所以目前两种接口最新标准最高都仅仅能支持比较好的4K/120Hz/10bit画面和显示器。

相信这一篇分析能够让大家在选择显示器和线材上有一个清晰的了解,希望能帮助大家在选择线材和显示器上有一定的帮助。不过话说回来,虽然现在有了4K分辨率120Hz的显示器,电视方面也有了8K级别面世,但目前连入门4K都还未全面普及,谈极致4K似乎还为之过早了些。

本文标签:

很赞哦! ()

横幅广告