软件学报英文版

你要看你是找哪个专业的或者哪个方向的？？

发的是什么类别的期刊，可以上国家新闻总署查询的。

many helpless in life, we always

这个级别的范围有点广阔，你要哪类的这样好说点

你这篇中国知网也好，万方数据也好都有例子！甚至百度文库都有！英文原文最好用谷歌学术搜索！==================论文写作方法===========================论文网上没有免费的，与其花人民币，还不如自己写，万一碰到人的，就不上算了。写作论文的简单方法，首先大概确定自己的选题，然后在网上查找几份类似的文章，通读一遍，对这方面的内容有个大概的了解！参照论文的格式，列出提纲，补充内容，实在不会，把这几份论文综合一下，从每篇论文上复制一部分，组成一篇新的文章！然后把按自己的语言把每一部分换下句式或词，经过换词不换意的办法处理后,网上就查不到了,祝你顺利完成论文!

软件学报是三大学报之一，权威性最高，难度大，审稿漫长模式识别与人工智能好投一点

知道知网的检索式怎么写吗？有知道知网的检索式怎么写吗？比如说:摘要:大数据。关键词:数据可用性，但没有数据挖掘。分类号:TP311。刊名:软件学报。作者单位:哈尔滨工业大学。这些词构成的检索式是什么？展开

这个还得等待大神来帮忙

软件学报英文缩写

软件学报核心其月刊亻弋写发口口①⑦⑥0④⑤⑦⑥⑨③ ②⑤⑧⑨③①⑥⑥⑥④主管单位：中国科学院主办单位：国科学院软件研究所;中国计算机学会快捷分类：计算机计算机软件及计算机应用出版地区：北京国际刊号：1000-9825国内刊号：11-2560/TP创刊时间：1990发行周期：月刊期刊开本：A4审稿时间：1-3个月所在栏目：信息科技综合影响因子：642期刊级别： CSCD核心期刊　北大核心期刊　统计源期刊

软件学报是三大学报之一，权威性最高，难度大，审稿漫长模式识别与人工智能好投一点

中国知网的检索方法有一框式检索、高级检索、专业检索、浏览检索、作者检索等多种，写出专业检索式进行检索的方法为“专业检索”，在专业检索页面给出了专业检索式的编写方法，具体查找步骤：打开中国知网→点击右侧的“高级检索”→进入高级检索界面→点击上方的“专业检索”（见下图中1处）→可见“可检索字段”（字段代码）和“示例”（见下图中2处），除此之外还会用到布尔逻辑算符、条件限定（如and、or、not等）等代码，即可编写专业检索式。

这个还得等待大神来帮忙

软件学报英文怎么说

文章标题：一般不超过300个汉字以内，必要时可以加副标题，最好并译成英文。作者姓名、工作单位：题目下面均应写作者姓名，姓名下面写单位名称（一、二级单位）、所在城市（不是省会的城市前必须加省名）、邮编，不同单位的多位作者应以序号分别列出上述信息。提要：用第三人称写法，不以“本文”、“作者”等作主语，100－200字为宜。关键词：3－5个，以分号相隔。正文标题：内容应简洁、明了，层次不宜过多，层次序号为一、（一）、1、（1），层次少时可依次选序号。正文文字：一般不超过1万字，用A4纸打印，正文用5号宋体。数字用法：执行GB/T15835－1995《出版物上数字用法的规定》，凡公元纪年、年代、年、月、日、时刻、各种记数与计量等均采用阿拉伯数字；夏历、清代及其以前纪年、星期几、数字作为语素构成的定型词、词组、惯用语、缩略语、临近两数字并列连用的概略语等用汉字数字。图表：文中尽量少用图表，必须使用时，应简洁、明了，少占篇幅，图表均采用黑色线条，分别用阿拉伯数字顺序编号，应有简明表题（表上）、图题（图下），表中数字应注明资料来源。注释：是对文章某一特定内容的解释或说明，其序号为①②③……，注释文字与标点应与正文一致，注释置于文尾，参考文献之前。参考文献：是对引文作者、作品、出处、版本等情况的说明，文中用序号标出，详细引文情况按顺序排列文尾。以单字母方式标识以下各种参考文献类型：普通图书[M]，会议论文[C]，报纸文章[N]，期刊文章[J]，学位论文[D]，报告[R]，标准[S]，专利〔P〕，汇编[G]，档案[B]，古籍[O]，参考工具[K]。基金资助：获得国家基金资助和省部级科研项目的文章请注明基金项目名称及编号，按项目证明文字材料标示清楚。作者简介：第一作者姓名（出生年月-），性别，民族（汉族可省略），籍贯，现供职单位全称及职称、学位，研究方向。其他：请勿一稿两投，并请自留原稿，本刊概不退稿，投寄稿件后，等待审查。审查通过编辑部会通知您一般杂志社审核时间是1-3个月：如果要是到我中心给你论文代发请详细看。

软件学报核心其月刊亻弋写发口口①⑦⑥0④⑤⑦⑥⑨③ ②⑤⑧⑨③①⑥⑥⑥④主管单位：中国科学院主办单位：国科学院软件研究所;中国计算机学会快捷分类：计算机计算机软件及计算机应用出版地区：北京国际刊号：1000-9825国内刊号：11-2560/TP创刊时间：1990发行周期：月刊期刊开本：A4审稿时间：1-3个月所在栏目：信息科技综合影响因子：642期刊级别： CSCD核心期刊　北大核心期刊　统计源期刊

中国知网的检索方法有一框式检索、高级检索、专业检索、浏览检索、作者检索等多种，写出专业检索式进行检索的方法为“专业检索”，在专业检索页面给出了专业检索式的编写方法，具体查找步骤：打开中国知网→点击右侧的“高级检索”→进入高级检索界面→点击上方的“专业检索”（见下图中1处）→可见“可检索字段”（字段代码）和“示例”（见下图中2处），除此之外还会用到布尔逻辑算符、条件限定（如and、or、not等）等代码，即可编写专业检索式。

知道知网的检索式怎么写吗？有知道知网的检索式怎么写吗？比如说:摘要:大数据。关键词:数据可用性，但没有数据挖掘。分类号:TP311。刊名:软件学报。作者单位:哈尔滨工业大学。这些词构成的检索式是什么？展开

软件学报模版

中国知网

实时流体模拟是计算机图形学中的另一个热点问题为了真实地描述流动现象,许多研究者不得不求解复杂的运动方程,如纳维-斯托克斯方程组(Navier-Stokes equations,简称NSEs)然而,NSEs的求解相当耗时,对时间步长极为敏感,易导致结果发散直到几年前,Stam[4]在计算机图形学领域中引入半拉格朗日算法,才使得实时流体计算成为可能该方法允许采用较大的时间步长,同时保持良好的稳定性虽然这种方法的计算精度不能满足工程上的应用,但能捕获流体运动的基本特征,满足很好的视觉效果所以,计算机图形学界逐渐开始广泛应用该方法来模拟流动现象[5 9]为了更进一步加速求解,人们开始利用GPU的并行性和可编程性来求解偏微分方程(partial differential equations,简称PDEs)[10 13]但是,由于目前GPU上缺乏像CPU那样的灵活性,编程也不如在CPU上那样容易,所以大多数研究者只是集中在二维问题域而且,对于边界条件的处理过于简单,以至于很难满足实际问题的需要本文的贡献在于:在GPU上采用半拉格朗日方法来求解三维NSEs,且保证GPU能够处理任意复杂的边界条件,整个计算与场景的几何复杂度无关对于中等规模的问题,整个模拟和显示能够实时进行,充分利用了GPU的并行性以加速计算为了能够处理任意障碍物形成的复杂边界,我们结合模板缓冲对三维场景进行剪切操作,形成一系列实心的剖切截面,以构成整个流动边界我们将整个三维计算域离散成一组切片,并将这组切片平铺到一个二维空间,所以这组切面也被组织成一幅二维纹理这样,通过将障碍物信息转化到图像空间,使得整个流体计算与场景几何复杂度无关我们根据障碍物的位置信息将体素划分为不同的类型,并利用像素程序生成偏移坐标,然后在偏移坐标的基础上,根据边界条件形成边界修改因子,从而使得该方法能够处理任意的内部边界条件,比文献[11]的方法更为通用另外,为了充分利用像素处理的并行性,我们将相似的变量组织在一起,压缩到纹元的4个颜色通道,以减少绘制的次数,达到性能提升的目的而在绘制方面,由于流体为半透明的物质,所以本文采用光线投射的思路,直接在GPU上利用像素程序进行积分运算计算出光的衰减,然后通过基于GPU的颜色融合以获得着色效果 1 相关工作为了模拟烟雾中的湍流现象,文献[14]采用分解的方法将湍流风场分成确定分量和随机分量两部分其中,确定分量用来模拟风场的大尺度行为,采用几种常见的风的形态进行叠加,而随机分量则采用Kolmogorov频谱来模拟小尺度行为为了更精确地描述流体的运动,Foster等人[15]采用直接数值模拟来求解流体方程,用以模拟水面形态以及漂浮物体的运动但由于这种方法采用显式格式,要求时间步长很小,否则整个计算不收敛为了在保证计算稳定的情况下能够获取较大的时间步长,Stam[4]采用半拉格朗日法来求解NSE但半拉格朗日方法的数值耗散很严重,因此,在文献[6]中引入一个漩涡约束因子(vorticity confinement)以弥补耗散,从而得到很好的烟雾视觉效果文献[5,7]采用该方法来求解level-set方程以模拟复杂流体表面在模拟火焰的过程中,文献[9]对于气态燃料和气态生成物分别采用了类似的处理方法同样,文献[8]中为了模拟大尺度烟的效果,在二维平面570 Journal of Software 软件学报 V17, N3, March 2006 上采用半拉格朗日法来求解NSEs,三维上尺度上则只采用Kolmogorov频谱来增加细节随着GPU的发展,特别是可编程性和实时绘制语言的普及,很多人利用GPU提供的并行性,将它作为流处理器来做一些通用计算方面的工作,甚至用来求解有限差分方程组2001年,Rumpf等人[16]利用图形硬件提供的多纹理操作和图像子集函数来求解传热和各向异性扩散有限单元方程,以实现图像处理的功能2002年,文献[17]采用LBM(lattice Boltzmann method)来模拟流动效果通过将粒子包合成纹理,将Boltzmann方程组映射到光栅化和帧缓冲操作上,采用Register Combiner实现整个计算Harris等人[18]通过Register Combiner结合Texture Shader来求解CML(coupled map lattice)问题,从而实现交互的对流扩散模拟从2003年开始,Krüger等人[13]利用像素编程,在基本代数运算的基础上实现了共轭梯度法和高斯-赛德尔迭代法,从而更进一步地求解2D波动方程和不可压NSEs;Bolz等人[10]则实现了基于像素编程的稀疏非结构化矩阵的共轭梯度法和多重网格法,以求解流体运动方程;Goodnight等人[12]在GPU上应用多重网格算法求解边界值问题;Harris等人[11]则基于像素程序对云彩的运动方程进行求解来得到动画效果;文献[19]给出了一个采用Cg实现的流体简单效果的模拟;Batty等人[20]在GPU采用共轭梯度法来模拟流体运动 2 基于GPU的三维流动模拟为了模拟流动现象,计算流体力学领域(CFD)的众多研究者已经做了大量的工作但在计算机图形学领域,目前主要是针对不可压的无粘低速流动现象模拟,以满足电影特效或者游戏特效的需要,如烟,火,云彩,流水等[5 9,11]这里也只是针对不可压的无粘低速流动现象而言 1 流体运动方程整个流体运动方程主要由两部分构成:一是连续性方程;另一个是动量方程 0u =r(1) rfpuvuuturrrr+ + = 2)(/ (2) r这里,为速度矢量,v为动力粘性系数,urf为外部施加的作用力,p为压强为了表现流动效果,引入密度ρ和温度T两个标量本文不仅考虑其自身的扩散效果,也考虑计算速度场所带来的对流效应 2()tukSρρρρ = + +rρ (3) 2()TTtuTkTST = + +r(4) 为了能快速模拟,我们采用半拉格朗日算法求解上述方程更多关于半拉格朗日算法的细节可以参考文献[4]整个计算与我们在二维问题上的计算方法[28]类似由于温度和密度会导致速度发生变化,所以将其影响以浮力的形式[6,8,9,28]传递给速度场 yTTyfambbuoyrrr)( + =βαρ (5) 这里,为向上的矢量方向,即(0,1,0),Tyramb为周围环境的温度,α和β分别用来控制密度和温度的影响程度为了密度半拉格朗日方法的数值耗散,我们引入漩涡约束因子来增加流动的细节,以外力的形式传递给速度场(conffhn)εω=×这里,uω= ×rr,||/|||n|ωω= rrr,ε用来控制加入到流场中细小尺度细节的量,h为空间步长,以确保加入的漩涡约束是合理的 2 计算纹理准备为了加速偏微分方程组的求解,我们将整个计算映射到GPU上来完成文献[20]将拉普拉斯算子重新组织成7幅纹理与其不同的是,我们直接将整个计算域组织成纹理[11],利用像素程序在pbuffer中计算整个NSE 在离散整个三维计算域的时候,首先确定出需要计算的整个场景的包围盒如图1(a)所示,沿某根坐标轴对整个包围盒切片操作,每个切片为一个二维数组,即二维纹理,这样,每个体素就代表一个节点为了计算方便,我们采用两套网格来表示主要变量,包括速度,密度和温度这样,通过时刻t的状态量,计算出时刻t+1的状态量,柳有权等:基于GPU带有复杂边界的三维实时流体模拟 571 然后交换由于在压强泊松方程和扩散方程的计算过程中需要迭代计算,而在GPU上,像素程序对纹理不能同时进行读写操作,所以迭代方法受到很大的限制,目前有雅可比迭代法[11],共轭梯度法[10,13,20]以及红黑高斯-赛德尔法[11,12]在本文中只要求满足视觉效果,所以只需设定固定的迭代次数,而没有像文献[12]那样迭代直至收敛如果需要,我们可以类似地采用硬件支持的occlusion query特征来进行收敛条件的判断共轭梯度法需要进行矢量削减[10,13]的运算,需将数据从GPU返回给主内存,所以虽然该法整体收敛快,但单次迭代的效率不如雅可比迭代法;而红黑高斯-赛德尔法也需要两遍绘制才能完成一次迭代故此,我们仍然选择雅可比迭代法该方法不仅更简单,而且单次迭代的效率较高[3] 尽管我们可以像以前的方法[22]那样将某个标量和速度变量(3个分量)压缩到纹元的RGBA这4个颜色通道以减少绘制的次数,但由于目前在我们使用的硬件上,像素程序尚只支持一个输出,所以当要求的变量多出4个时,不可避免地需要较多的绘制操作来完成整个变量的求解但即使这样,我们仍可将密度和温度变量的求解压缩到一起,以减少绘制的次数这样,我们首先计算整个速度场,然后再计算标量,最后利用密度场和温度场用来绘制流动的效果[6] 由于整个计算域是三维的,而GPU对于三维纹理的读写操作很慢,如果采用一系列二维切片的方式,则对应一个切片就需要一遍绘制过程,这样,需要多遍绘制才能完成整个计算域的一次迭代计算为了避免性能的损失,尽可能地减少状态量的改变和绘制句柄的反复切换,我们采用与Harris等人[11]类似的方法,即将整个三维的计算域平铺到一个二维域上,如图1(b)所示但与文献[11]方法不同的是,我们预计算一幅二维索引纹理包含该切片的前后两个切片的位置,而不是一个简单的一维查找表纹理,这样,避免在像素程序中重新对每一个像素点进行定位计算,提高了整个模拟的运算效率 (a) 3D texture (b) Flat 3D texture (a) 三维纹理 (b) 平铺二维纹理 F1 Flat 3D texture 图1 平铺三维纹理yzx 1 边界生成对于实际问题而言,任意边界条件的处理至关重要边界条件的不同使得各个问题不同,也才能体现出丰富多彩的流动效果对于三维问题域来说,尽管我们可以像文献[23]那样在CPU上很容易地实现边界条件的处理,但那样每迭代一次,我们就需要将数据从GPU通过AGP通道读回到主内存进行边界处理,而这个过程很耗时,而且不得不在CPU上进行边界的判断以确定每个体素是否被障碍物占据,这无疑也十分耗时由于主要计算是在GPU上进行的,所以希望边界条件的处理同样在GPU上完成但目前GPU远不如CPU的操作灵活,为此我们提出一种新的方法,将所有的计算包括边界处理都放在GPU上完成,保证了整个计算的效率目前,我们使用的GPU上像素程序尚不支持分支和循环操作所以,我们预先在图像空间生成边界障碍物图像,用这个障碍物图像来生成每个体素的偏移纹理;然后,根据边界条件生成主要变量(如速度,压强等)的修正因子这里,采用两个像素程序就可以完成整个初始化的过程,这样就在GPU上完成了边界条件的处理,避免了GPU和CPU之间的频繁通信,加速了整个计算过程图2给出了整个初始化的过程,在第3节中将详细展开 572 Journal of Software 软件学报 V17, N3, March 2006 Boundaries3D ScenePosition offsets(c)(b)(a)Actual offsets(d)Velocity factor(e)F2 The whole initialization procedure 图2 初始化过程文献[24]采用深度剥离的方式来体素化整个场景,以生成LBM的动态边界与此方法不同,我们采用直接体素化的方式,就是将整个场景不断剖切,然后正交投影,在图像空间形成障碍物图但由于整个场景由几何面片构成,单纯的剖切操作会出现一些空洞的区域,如图3(b)所示为了形成实心的剖切截面,我们结合模板缓冲进行剪切,以得到正确的障碍物信息图由于已将三维计算域转换到二维空间,所以在形成边界图的时候,我们同样将这些边界图组织成一幅纹理集,如图3(c)所示可以参见文献[25]了解形成实心剖切截面的具体实现过程 (a) The solid model (b) The texture chart with just clipping (c) The capping clipped texture chart (a) 原始几何场景 (b) 单纯剪切操作得到的障碍物纹理图 (c) 实心剖切截面纹理图 F3 Boundary generation with 16 slices along z-axis 图3 边界生成,沿z轴作16次切片 3 边界条件处理在得到边界纹理以后,我们就可以根据边界条件对边界上的变量进行修正任意复杂边界条件的处理对于实际问题的求解至关重要这个问题在CPU上很容易解决,因为CPU提供了灵活的控制机制,但GPU为了保持高度的并行性而缺乏灵活的控制,所以不得不另辟蹊径这里提供的方法可以处理任意复杂的边界,并且可以处理用户的任意交互输入的障碍物边界为了能够适应一般的边界,文献[12]利用模版缓冲将边界值作为状态量模拟的一个扩充与其不同的是,我们借鉴Foster等人对边界的处理方法[15]对边界进行分类,从而较文献[12]更为灵活,与Harris的方法[11]有些类似但Harris的方法只能处理四周边界,我们的方法则可以处理任意复杂的内部边界通常情况下,边界条件可以分为3类,即Dirichlet边界,Neumann边界和混合型边界,但都可以统一到一个方程: abncφφ+ =r(6) 这里,φ指的是速度,密度,温度和压强等,a,b和c分别代表一定的系数首先,根据障碍物纹理图将体素划分为障碍物和流体两类(如图3(c)所示),用0或1表示对于边界条件方程(6)的作用,我们采用一阶精度离散化,这样,边界上节点的值就由其周围的某一个节点来决定由于方程(6)对法线方向求偏导数,为了在GPU上求解方便,柳有权等:基于GPU带有复杂边界的三维实时流体模拟 573 我们将任意法线方向简化为28个方向,所以采用式(7)编码的方法只需对每个节点周围的7个节点进行考察就可以求出该节点的类型,从而得出相对方位关系,如图4所示这样,边界条件就转化为φboundary=dφoffset+e,d和e由方程(6)的具体离散情况来决定,即表示为修正因子纹理 (7) 32)1,,(16)1,,(4),1,(8),1,(2),,1(),,1(64),,(),,('× +×++× +×++× +++×=kjiObstaclekjiObstaclekjiObstaclekjiObstaclekjiObstaclekjiObstaclekjiObstaclekjisTypeNode这里,Obstacle(i,j)即1(被流体占据的节点)或者0(被障碍物占据的节点)由于计算在图像空间进行,所以一旦得到障碍物信息,整个计算就与场景的几何复杂度无关了 Node types yx zF4 Relative orientation of voxels 图4 各个体素的相对方位关系表1给出了整个编码运算的过程与结果这样,我们将编码的64个结果组织成28个方向,存储到位置偏移纹理中(如图2(c)所示)然后,根据该偏移纹理,结合索引纹理,生成在二维平铺纹理空间的真实偏移(如图2(d)所示)同时,根据边界条件计算出速度修正因子纹理(如图2(e)所示)该过程只需两个像素程序即可完成 Table 1 Code results 表1 编码运算的过程与结果 Relative orientation Binary coding 3D offset Actual offset Velocity modification factor Right 000001 (1,0,0) (1,0) (0, 1, 1) Left 000010 ( 1,0,0) ( 1,0) (0, 1, 1) Bottom 000100 (0, 1,0) (0, 1) ( 1,0, 1) Top 001000 (0,1,0) (0,1) ( 1,0, 1) Front 010000 (0,0,1) (Toffset x,Toffset y) ( 1, 1,0) Back 100000 (0,0, 1) (Toffset z,Toffset w) ( 1, 1,0) Bottom-Right 000101 (1, 1,0) (1, 1) (0,0, 1) Top-Right 001001 (1,1,0) (1,1) (0,0, 1) … … … … … 由于边界条件的处理涉及到速度,压强,密度和温度等变量,我们将为这些变量分别根据系数d和e形成修正因子在目前的系统中,我们对压强采用Neumann边界条件,即0pn =这样,边界上的值等于其相邻节点上的值,所以压强的修正因子一直是对于静态的障碍物,我们认为垂直于其表面的节点速度对应分量等于0;而对于非滑移边界,由于障碍物对流体有拖曳力的作用,将边界上的切向速度赋为附近流体节点上对应分量的负数;对于滑移边界,边界上的切向速度则直接赋为附近流体节点上对应分量这样,根据边界类型既可动态地计算偏移位置,也可以预先计算好,对于当前处于边界上的值,根据偏移位置取出对应的值,结合d和e进行滑移或者非滑移处理后赋予它对于流体本身和障碍物内部,其纹理偏移均为(0,0,0),即该边界处理的像素程序不改变其节点上的数值在本文中,我们对速度变量只考虑了非滑移边界条件,通过速度修正因子纹理来体现(如图2(e)所示)这样,我们通过两个不同的像素程序分别处理压强和速度边界条件这些在二维域更容易理解,可以参阅我们以前的工作[22]对于标量(密度和温度)的边界处理将更为简单,我们直接指定边界上的值等于障碍物的574 Journal of Software 软件学报 V17, N3, March 2006 对应值显然,这种思路同样可以处理周期性边界条件不过,需要修改一端的偏移位置指向整个计算域的另一端这种方法还可以进一步推广到动态边界,如模拟运动物体对流体造成的影响,只不过我们需要不断更新坐标偏移纹理和修正因子纹理通过以上方法,结合平铺三维纹理的方式,整个计算化为二维问题整个流体计算完全在GPU中实现,模拟过程高效在目前的系统中,我们尚只求解了静态场景,但该方法本身对于动态场景仍是适用的 3 结果与讨论本文所采用的实验平台为Intel Pentium 8GHz,主内存为2G,显卡采用的是GeForce FX5950 Ultra,显卡内存为256M,显卡的核心频率为375MHz,驱动的版本为16,操作系统为Windows 整个实现基于OpenGL这里给出了一些实验结果,这些结果显示了本文所提出的方法的有效性和高效性在图形硬件上,我们不仅完成了整个基于物理的流体方程求解,同时也将计算的结果实时绘制出来图5给出了气流在迷宫中流动的场景,图6给出了气流在一个城市中流动的情形,充分体现了本文算法处理复杂边界的能力,从而可以用来实时模拟诸如有害气体泄漏,火灾等事故更多的演示动画可以访问 /~lyq/demos/gpgpu/ F5 Flowing in a maze F6 Flowing in a city 图5 气流在迷宫中流动的场景图6 城市中气体流动情形目前,我们只是在pbuffer中使用复制到纹理这种思路,所以在性能上还有提升的空间如果采用绘制到纹理,可以得到更好的性能但这时存在的一个问题是,整个计算需要多个pbuffer句柄的不断切换,这样使得其整体性能并不比采用一个pbuffer然后使用复制到纹理这种思路高效为了避免这个问题,就需要使用pbuffer的多个表面[12,21]作为绘制对象,而这个问题目前各个硬件支持的情况不太一样在我们的实验中,整个花费的时间由4部分构成在静态场景中,边界生成和边界条件的准备只需要做1次这样在实时模拟过程中,我们只需要求解流体方程,然后绘制出整个效果,其中流体方程的求解占用了整个时间耗费的绝大部分无疑,模拟耗费的时间与绘制的遍数成一个简单线性正比的关系,如果我们设定固定的迭代次数为N,并考虑扩散对流,浮力,漩涡约束等所有因素,则总绘制遍数等于11+6N当然,迭代次数越高,整个计算越精确图5中计算域的分辨率为64×34×16,N=6,绘制尺寸为512×512,模拟效率大概为通过实验可以看到,在计算流体运动方程中,GPU相对于CPU而言性能要高出很多虽然GPU在编程上比较复杂,而且不如CPU那样灵活,但它提供的可编程性使得人们能够根据方程本身的特点来设计算法,以充分利用GPU的并行特性来加速,从而有效地实现快速求解 4 结论与讨论本文利用目前新的图形硬件求解流体的运动方程,从而达到实时模拟的效果,将方程的求解与绘制整合在一起,减小了CPU处理的压力,让CPU解放出来做其他事情在求解过程中,为了更进一步加速整个计算过程,柳有权等:基于GPU带有复杂边界的三维实时流体模拟 575 我们将多个标量压缩在一起,以减少绘制的次数另外,对于复杂边界的处理更加通用化,通过将整个几何场景转化到图像空间,使得算法与几何场景的复杂度无关在图像空间修正边界值,使得整个算法更加实用化,能够模拟出各种复杂的流动可以看出,图形硬件对于整个计算的加速是很明显的但目前利用GPU来求解流体运动方程仍存在很多限制:首先,该方法不太适合像文献[8]那样的大规模问题求解,内存有限,而且存在最大纹理尺寸的限制,使得所需求解的问题分辨率不能太高,不过这个问题可以通过纹理压缩或者多遍的方法得到缓解;而灵活性的缺乏以及指令集的局限性使得GPU编程的复杂度增加,而且难以实现一些运算,如位操作等另外,由于整个计算基于像素,所以瓶颈亦在于此通常情况下,高效的计算应该是寻求在CPU,AGP通道,顶点级以及像素级这几者之间达到一个很好的均衡文献[21]为我们提供了一个很好的思路,即利用GPU与CPU之间的消息机制来维持整个计算的负载均衡更多关于GPU的讨论可以参考文献[3,26] 目前,整个算法完全基于汇编来实现,而高级实时绘制语言,如Cg应该有助于编写更高效的代码所以在将来的工作中,我们准备将现有的工作转到Cg上去另外,由于半拉格朗日方法的精度不够高,使其在计算流体力学领域的应用很受限制,而多重网格法[12]从某种程度上可以提高整个计算的精度,从而满足工程应用的要求需要进一步完成的工作还包括烟雾或者火焰本身的高度真实感绘制等随着新的硬件特性的不断出现,如nVidia和ATI公司的Frame Buffer Object(FBO)和Render Buffer Object(RBO) [27],它们将完全代替pbuffer,从而将更方便我们利用GPU并行处理的能力基于此,我们还将设计一些更为精巧的算法来加速PDEs的计算并增强绘制效果

首页

> 论文期刊知识库

软件学报英文版