在下面的代码中,我首先将名为ref的纹理绑定到全局内存中名为gpu的数组。然后我调用一个名为getVal的函数,其中我首先将gpu1的值设置为5,然后使用使用tex1Dfetch(ref,1
的绑定纹理读取它。但是,在本例中,tex1Dfetch()不显示已更改的gpu5值,而是显示旧值。
然后,我调用另一个名为getagain的函数,它再次读取tex1Dfetch(ref,1)。然而,这一次我得到了新的价值。我真的不明白为什么在第一个函数中我没有得到改变的值。
#include<cuda_runtime.h>
#include<cuda.h>
#include<stdio.h>
texture<int> ref;
__global__ void getVal(int *c, int *gpu){
gpu[1] = 5;
*c = tex1Dfetch(ref, 1); // returns old value, not 5
}
__global__ void getagain(int *c){
*c = tex1Dfetch(ref, 1); // returns new value !!!????
}
void main(){
int *gpu,*c;
int i,b[10];
for( i =0 ; i < 10; i++){
b[i] = i*3;
}
cudaMalloc((void**)&gpu, sizeof(int) * 10);
cudaBindTexture(NULL, ref, gpu,10*sizeof(int));
cudaMemcpy(gpu, b, 10 * sizeof(int), cudaMemcpyHostToDevice);
cudaMalloc((void**)&c, sizeof(int));
//try changing value and reading using tex1dfetch
getVal<<<1,1>>>(c,gpu);
cudaMemcpy(&i, c,sizeof(int), cudaMemcpyDeviceToHost);
printf("the value returned by tex fetch is %d\n" , i);
cudaMemcpy(b, gpu,10*sizeof(int), cudaMemcpyDeviceToHost);
for( i =0 ; i < 10; i++){
printf("%d\n",b[i]);
}
getagain<<<1,1>>>(c);
cudaMemcpy(&i, c,sizeof(int), cudaMemcpyDeviceToHost);
printf("the value returned by tex fetch is %d\n" , i);
getchar();
}
发布于 2011-07-11 01:11:32
在同一个内核调用中,纹理缓存不保持与全局内存的一致性。见CUDA 4.0 C编程指南第3.2.10.4节。纹理缓存在连续内核调用之间的一致性是通过驱动程序在启动内核之前刷新纹理缓存来实现的。
https://stackoverflow.com/questions/6643526
复制相似问题