以算法为内核的娱乐化app_以非门为oracle的Deutsch算法_以所有顶点为源的Dijkstra算法 - 腾讯云开发者社区

、

我正在将一些代码移植到GPU上，并且我已经实现了大部分代码，除了我的算法需要执行列归一化步骤(或者它应该在没有它的情况下算法也可以工作，但为了算法的稳定性，最好是进行归一化)。我正在努力想出实现这一点的最好方法。我已经有了一个内核，它可以进行归约，所以我可以重用它来获得列总和。列的数量可以少到几千个元素的几十个列，多到几千个列，每个列都有几千个元素。如果我在每一列上反复调用缩减<e

浏览 6提问于2012-08-23得票数 1

回答已采纳

2回答

隐马尔可夫模型的并行前向-后向算法

、、

作为一个辅助项目，我想为我的NVidia显卡实现一个隐马尔可夫模型，这样我就可以让它快速执行并使用多个内核。谢谢, mj

浏览 6提问于2012-02-27得票数 1

1回答

将磁盘上的inode读取到内存中

、、、

我相信有两种类型的inode磁盘上和内核inode(fs.h中的结构inode)。磁盘上inode是基于文件系统实现的。我试着理解基本的概念，并有几个问题- 能告诉我读取/复制磁盘inode到inode inode的代码(或者遍历步骤)吗？也就是说，当内核inode被创建时，它必须是从磁盘inode中创建的.那么，这是如何发生的呢？为什么内核inode不存储指向磁盘inode的指针？，如果

浏览 1提问于2011-02-11得票数 8

回答已采纳

1回答

核PCA约简的核参数和超参数的选择

、

我在读一种方法是训练一个有监

浏览 1提问于2018-11-30得票数 2

回答已采纳

3回答

蒙德里安笔画的再创作

、

下午好,娱乐活动可以使用实际的颜色，也可以用来自Windows默认16色调色板.的适当颜色替换。您的娱乐活动可以在PNG、BMP或NetPBM中输出，可以输出到文件或STDOUT，也可以直接输出到屏幕。你的娱乐</

浏览 0提问于2013-09-21得票数 23

2回答

对于自定义TCP服务中缓冲区的使用和调优，有哪些建议？

、、、

我可以理解app/lib对读取缓冲区的使用: app /lib从内核缓冲区读入应用程序缓冲区，应用程序对数据进行处理(例如，对其中的消息进行反序列化)。但是，我对写缓冲区的需要/使用感到困惑。为什么不直接写到内核的发送/写缓冲区呢？这是为了避免系统调用(写)的开销吗？我认为关键在于，当内核通知app/lib套接字是“可写的

浏览 8提问于2010-01-22得票数 2

2回答

为什么GPU比CPU更强大

、

如果是这样的话，为什么不能用与GPU相同的方式设计CPU，使其速度更快呢？

浏览 0提问于2011-06-22得票数 74

回答已采纳

1回答

我正在尝试使用来自gesvd的cuSOLVER函数，我发现它比MATLAB中的svd函数慢得多，无论是使用double数组还是使用gpuArray。**使用svd函数的Matlab代码*A = rand(64, 64) + eye(64);[~, ~, ~] = svd(A);fprintftime: %f ms\n', t*1000); % >> CPU time: 0.947754 ms % >> GPU time: 2.

浏览 0提问于2017-01-20得票数 3

回答已采纳

2回答

在Thrust::device_vectors函子中创建host device函子

、、、

我目前正在尝试并行化目前在一个主要函数中顺序运行的推力cuda代码(因此不能利用GPU的能力)。实际上，我已经将函数式代码转换成函式，thrust::for_each可以使用库达流来调用函式。但是，如果我定义函子时使用VS2013抛出各种各样的警告，表示我正在尝试从设备上启动主机功能。它特别引用了thrust::device_malloc_allocator的问题。如果我将函子定义为严格的宿主函子，那么这些错误都会消失，但是当

浏览 5提问于2016-07-22得票数 1

回答已采纳

2回答

CUDA :具有公共(共享)参数的内核并发性

数据自动化系统代码看起来像(k0和k1是在专用流stri中启动的)：k1<<<..., str[1]>>>(arg4, arg2内核是而不是重叠:这与公共参数(arg2)有关吗？如果是，在这种情况下，如何使内核相互重叠？我使用开普勒K20m：计算能力为3.5。该算法总是访问数据，因此我希望它具有很高的带宽限

浏览 2提问于2015-06-08得票数 0

1回答

在16 on的拇指驱动器上运行Ubuntu

、、、、

我是全新的-一个Ubuntu转换-到目前为止，我已经能够找到如何将操作系统刻录到DVD，以及我如何可以让它在一个拇指驱动器。我甚至把这两件事都解决了。然而，我关心的是:我能否继续只通过我的拇指驱动器运行Ubuntu，如果是的话，当我得到屏幕告诉我我可以“尝试Ubuntu”或者安装它，我可以选择哪一个？我只做了前者的选择，但是如果我做了后者，我是要擦除我的comp，还是它实际上只安装在拇指驱动器上？我想我在想，我是否可以把我的拇指驱动器当作一个外部硬盘，把它放在那里，这样我就可以在我想要<

浏览 0提问于2014-02-18得票数 1

1回答

将linux内核实现为路由器

、、、、

我正在尝试在Linux内核中实现一个路由算法。即当Linux主机被配置为充当路由器时。是否可以将路由算法添加到内核代码库中，并像在大多数内核服务中一样注册它？比如创建我们自己的调度策略，注册usb设备等等？提前谢谢你，Binoy

浏览 6提问于2014-01-30得票数 0

1回答

从CUDA设备函数/内核中并行化方法

、、、、

我有一个已经并行的CUDA内核，它执行一些需要频繁插值的任务。__global__ void complexStuff(...)该插值算法在三维上连续进行WENO插值。这是一个高度并行的任务，我迫切地想要并行化！很明显，通过使用complexStuff()语法从主机代码调用内核<<<...>>>，可以很容易地并行化它。同样重要的是，complexStuff()已

浏览 5提问于2014-01-29得票数 0

回答已采纳

1回答

以分布式或顺序方式工作的算法的术语

、、、、

我正在研究一种算法，该算法可以细分大型数据问题，并跨多个节点对其执行工作。如果每个细分都知道关于其周围细分的有限数量的信息，则可以修改问题的每个细分的局部解以匹配全局解。这可以通过每个分区之间固定数量的通信来实现，从而允许几乎令人尴尬的并行解决方案。然而，最后的结果是，如果问题是在单个内核上执行的，那么每段数据只需要加载固定的次数，无论问题的大小

浏览 0提问于2016-04-20得票数 2

2回答

如何使用本身是外键的字段获取Django模型的对象列表？

、、

目前，我的模特看起来是这样的： main_category = models.CharField(max_length = 25以保持所有的分离和可访问的独立。因此，有些文章的主要分类是“娱乐”。也就是说，self.category.main_category =‘娱乐’。我的问题是，如何获得所有具有相同main_category的文章？我试过Article.

浏览 4提问于2015-09-20得票数 1

回答已采纳

2回答

在CUDA内核中声明变量

假设在CUDA内核中声明了一个新变量，然后在多个线程中使用它，如下所示：int i = blockIdx.x* blockDim.x + threadIdx.x;a = delt[i] + deltb[i];}int threads在初始化每个线程时，是否为它们创建了一个新的"a“？或者每个线程会在未知<em

浏览 3提问于2013-07-29得票数 5

回答已采纳

2回答

“良好并行化”算法不会被多线程加速。

背景：，我在和我的一个在计算机科学研究领域工作的朋友交谈。我大部分是临时开发的，所以我对大多数CS概念的理解都是在功能层面(我知道如何使用它们，而不是它们是如何工作的)。他说，将运行在单个线程上的“良好并行化”算法转换为运行在多个线程上的算法并不会带来他预期的处理速度的提高。推理:我问他运行这个算法的计算机的体系结构是什么，他

浏览 4提问于2013-01-24得票数 0

1回答

Cuda::Entry函数使用了过多的本地数据

、

我试图在Tesla C2075上运行一个多边形相交算法，但当我试图编译这个算法时，编译器给了我错误:"Entry Function 'Polygon_Intersection'uses too much我的算法有点复杂，它利用了内核中的大量局部变量。所以我的问题是，有没有办法解决这个问题，比如我可以为每个内核的局部变量声明使用全局内存，或者以某种方式使用共享内存？

浏览 0提问于2012-07-18得票数 1

回答已采纳

1回答

内核在引导时无限期挂起

、、、

我已经用linux slob allocator对内核进行了配置以实现最佳匹配算法。我构建并安装了内核映像，以便下次可以从它引导。现在，当我尝试引导这个内核时，它会无限期地挂起，光标甚至不会闪烁。我想知道一些内核调试技巧，它们可以帮助我解决这个问题或一些好的读物。我也配置了kdb，但不知道如何在这种情况下使用它。任何帮助都是值得的！！其他详细信息：我修改了slob_page_alloc函数以实现best-fit算法，该算法<

浏览 2提问于2012-11-02得票数 1

2回答

帮助组织我的数据来解决这个机器学习问题

、、、

我想把推特归类在一组特定的类别中，如{“体育”、“娱乐”、“爱”}等等。在体育和娱乐(“我在看比赛”和“我在看我最喜欢的节目”)中，“手表”这个词经常出现在...Therefore上，我至少把它缩小到了这两个类别。但是“游戏”这个词在<

浏览 3提问于2010-12-28得票数 3

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

用于列归一化的cuda内核(分段缩减)

隐马尔可夫模型的并行前向-后向算法

将磁盘上的inode读取到内存中

核PCA约简的核参数和超参数的选择

蒙德里安笔画的再创作

对于自定义TCP服务中缓冲区的使用和调优，有哪些建议？

为什么GPU比CPU更强大

与MATLAB相比，使用cuSolver时SVD非常慢。

在Thrust::device_vectors函子中创建host device函子

CUDA :具有公共(共享)参数的内核并发性

在16 on的拇指驱动器上运行Ubuntu

将linux内核实现为路由器

从CUDA设备函数/内核中并行化方法

以分布式或顺序方式工作的算法的术语

如何使用本身是外键的字段获取Django模型的对象列表？

在CUDA内核中声明变量

“良好并行化”算法不会被多线程加速。

Cuda::Entry函数使用了过多的本地数据

内核在引导时无限期挂起

帮助组织我的数据来解决这个机器学习问题

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐