首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏硅光技术分享

    光子硬件加速器

    最近APL photonics刊登了一篇关于光子加速器的review文章"Novel frontier of photonics for data processing—Photonic accelerator 光子硬件加速器(photonic accelerator,简称PAXEL)是用光子处理一些特殊的计算任务,辅助已有的数字计算机。其典型的框架图如下图所示, ? (图片来自文献1) 与电子硬件加速器相比,光子加速器方案中信号加载在光信号上,因而会需要额外的光电转换步骤。PAXEL的主要优势是计算速度快、功耗小。 文献1中列出了光子硬件加速器的几个应用情景, 1)人工神经网络(articifical neural network) 深度学习的计算涉及大量的矩阵计算, ? (图片来自文献1) 以上是文献1中提及到的光子加速器的几个应用场景,相比较而言,在深度学习方面的应用,受到了更多的关注,并且也在往商业化的道路推广。

    3.1K30发布于 2020-08-13
  • 来自专栏FPGA技术江湖

    数据中心中的FPGA硬件加速器

    再来看一篇FPGA的综述,我们都知道微软包括国内的云厂商其实都在数据中心的服务器中部署了FPGA,所以这篇论文就以数据中心的视角,来看下FPGA这个硬件加速器。 还是一样,想要论文原文的可以私信我。 Xilinx 开发了专用的自适应加速器硬件模块 ALVEO,用于数据中心相关应用。 案例研究:用于数据处理的可重构设备 硬件加速器 谷歌、微软和亚马逊已经更新了部署 FPGA 的数据中心,以增强后端的机器学习。FPGA 为节能可编程硬件架构提供了一种很有前景的替代方案。 与 Xeon 类型的处理器相比,此硬件架构产生的结果快 4.3 倍、5.3 倍和 1.3 倍。FPGA 实现的功耗也降低了。 表 9 显示了上述应用程序的实现时间。 基于 FPGA 的密码分析在成本、功耗和吞吐量方面的性能优于 GPU 和 CPU,如表 9 和表 10 所示。 基于 ZU102 FPGA 的配置与纯软件数据传输相比,延迟降低了 25%。

    53310编辑于 2025-01-11
  • 来自专栏技术让梦想更伟大

    9个嵌入式硬件转软件小技巧

    那做了几年硬件能不能转软件呢?当然能,相信看了下面的内容,你会更有方向与底气! 嵌入式系统设计不仅要求了解硬件,还要求了解软件的作用方式,以及如何与之交互。 设计硬件需要的某种范式可能与设计软件完全相反。当从硬件设计转向包含软件的设计时: 硬件工程师应牢记以下十个技巧! 这样的方法会使开发人员对应用所需的不同部分与组件形成一个概念,就像电路逻辑图可以告诉工程师需要哪些硬件元件一样。 建议6:使用处理器示例代码做外设的实验 设计硬件时,做原型测试电路总是有益的,这样可确保工程师对电路有正确的理解,然后再做电路板布局。此点对设计软件也同样适用。 建议9:代码做详细说明 在软件开发的激烈战斗中,开发人员很容易把注意力集中在编写和代码上,因此会忽略详细解释的需求。在压力之下,说明工作往往是项目的收尾工作,因为开发人员认为它是最后的一项工作。

    70040编辑于 2022-12-22
  • 来自专栏网络工程师笔记

    9个Linux 常用查看系统硬件信息命令(实例详解)

    在Linux下,我们经常需要查看系统的硬件信息, 这里我罗列了查看系统硬件信息的实用命令,并做了分类,实例解说。 158 Model name: Intel(R) Core(TM) i5-7500 CPU @ 3.40GHz Stepping: 9 下面命令可以查看所有硬件摘要信息,并输出成一个html文件,把此html文件导出到电脑上,直接打开,可以清楚的看到硬件信息: lshw -html > /hardware.html 8. lsscsi 9. 这些信息包括了硬件以及BIOS,既可以得到当前的配置,也可以得到系统支持的最大配置,比如说支持的最大内存数等。 如果要查看所有有用信息 dmidecode -q 里面包含了很多硬件信息。

    6.2K30发布于 2021-05-17
  • 来自专栏AI研习社

    谷歌全面开源 MLIR 及生态联盟,全球 95% 的加速器硬件都在使用

    TensorFlow 生态系统包含许多编译器和优化器,可在多个级别的软硬件堆栈上运行。 这些抽象包括 TensorFlow 运算、嵌套的多面循环区域乃至 LLVM 指令和固定的硬件操作及类型。 MLIR 没有众所周知的固定或内置的操作列表(无「内联函数」),方言可完全定义自定义类型,即 MLIR 如何对 LLVM IR 类型系统(拥有一流汇总)、域抽象(对量化类型等经机器学习 (ML) 优化的加速器有着重要意义 它提供了新的基础设施和设计理念,使得机器学习模型能够在任何类型的硬件上一致地表示和执行。 ,Mediatek,NVIDIA,Qualcomm Technologies,Inc,SambaNova Systems,Samsung,Xilinx 的小米——占全球数据中心加速器硬件的 95%以上,

    1.8K20发布于 2019-09-17
  • 来自专栏新智元

    【谷歌硬件发布会全回顾】9大新品重磅发布,DeepMind强力助攻硬件AI化

    【新智元导读】 谷歌昨天夜间进行了本年度规模最大的一场硬件发布会,一口气发布了多款新品,包括拍照完爆iphone 8 Plus的手机、笔记本电脑、能实时翻译的耳机、价格亲民的音箱、电子笔、摄像头等。 从软件到硬件,谷歌现在已经全面AI化。本文带来这些产品的全面介绍,带你一览谷歌的AI黑科技。 谷歌CEO Sundar Pichai : 计算要学习和适应我们的需要 发布会一开始,谷歌CEO Sundar Pichai 首先阐述了谷歌的AI战略,包括软件和硬件层。 十三大产品/功能发布:硬件不甘落后的谷歌,能带给大家多少惊喜 接下来我们再看谷歌发布会上推出的各种新产品,从最新款的手机到机器学习驱动的可穿戴摄像头,高科技应用应有尽有。

    1.1K80发布于 2018-03-22
  • 来自专栏新智元

    揭开Groq LPU神秘面纱:世界最快硬件加速器的底层架构设计!

    凭借自研的硬件加速器LPU,达成了500个token/s的神级推理速度,当场秒杀了ChatGPT。 TSP编程模型依赖于两个关键要素: 硬件中的确定性数据路径 通过ISA获得的有关指令延迟的信息 编译器的后端可以跟踪片上任何流的位置和使用时间,称为软件定义硬件。 将9个这样的TSP节点和8个TSP组合成一个机架。机架中的每个节点都有32个端口,因此机架总共有288个全局端口。 TSP的计算模型基于确定性硬件,所以整个分布式系统也应具有同样的确定性。 使用硬件对齐计数器同步TSP的时钟 每个TSP设备都包含一个称为硬件对齐计数器(HAC)的硬件计数器,溢出周期为256。 计划的数据流 在传统的网络系统中,通过网络的数据包流由硬件管理,硬件在感应到网络中的负载时会优化路由。数据流中的这种被动调整会增加延迟,并在数据流中引入非确定性。

    48010编辑于 2024-03-13
  • 来自专栏天下风云

    .NET9 PreView6硬件内部生成和浮点SMID运算

    注意,.NET9 PreView6并没有对AOT进行重大更新。 在.NET9 PreView2里面曾经对AOT进行了自举模式,参考:.NET9 AOT ILC的重大变化.NET9 AOT ILC的重大变化‍ 硬件内部生成 大部分硬件内部有其相应的优化,而应用层级只需要传递相应的参数即可 比如一些硬件希望用户为硬件内部的API的某些参数传递常量,这些常量可以直接编码到硬件内部底层的指令当中。不需要加载到寄存器或者内存当中,然后进行访问。 许多新功能的示例: 浮点二进制运算,其中一个操作数是一个常量: x + NaN现在折叠成 .NaN x * 1.0现在折叠成 .x x + -0现在折叠成 .x 例如,硬件内部函数假设是:xVector

    26610编辑于 2024-07-25
  • 来自专栏reizhi

    微软:IE9可实现Web页面所有内容硬件加速

    如今,各大浏览器都开始使用硬件来加速图形性能,IE9 Beta也即将发布,微软在此时对比了完全硬件加速和部分硬件加速之间的区别,向众人揭示了IE9的优越性。 在7月发布的平台预览第三版中,IE9引入了硬件加速HTML5 canvas。 IE9硬件加速 浏览器可以使用硬件来加速一个HTML页面所有步骤中的一些或是全部,下图中就描述了IE9中的HTML页面渲染主要步骤: IE9页面渲染共分为三大阶段: 内容渲染:IE9在第一个阶段使用Direct2D 完整硬件加速VS.部分硬件加速 在IE9中,开发人员能够使用完整的硬件加速。 当你使用其它支持硬件加速的浏览器测试IE Test Drive网站上的项目时,你会发现其性能在某些方面能与IE9不分上下,但是在很多方面相差甚多。这种差距就反应了完整硬件加速和部分硬件加速之间的区别。

    93320编辑于 2022-09-26
  • 来自专栏帅云霓的技术小屋

    局域网SDN技术硬核内幕 9 从软件Overlay到硬件Overlay

    为了解决这一矛盾,工程师们期望利用数据中心交换机强大的数据包处理转发能力,将各宿主机的CPU从封装Overlay的枯燥工作中解放出来,这叫做硬件Overlay。 上图是软件Overlay的实现,OVS作为VTEP节点封装VXLAN隧道; 上图是硬件Overlay的实现,数据中心接入交换机(TOR, Top of Rack)作为VTEP节点封装VXLAN隧道; 二者对比如下: 硬件Overlay的基本模型如下图所示: 我们看到,在这个模型中,OVS仅对来自VM的数据包打上VLAN标签,在TOR上进行VLAN到VXLAN的封装。 明天介绍的内容——层次化端口绑定 (Hierarchy Port Binding),将详解这一机制,也是硬件SDN的精髓。这一机制不但能解决基于VM的IaaS云,还可以应用于容器云平台。

    79510编辑于 2022-07-22
  • 来自专栏帅云霓的技术小屋

    硬件融合技术内幕 终极篇 (9) —— 得民心者得天下

    在上期,我们提到了,DRAM从FPM,EDO,EDO Burst,SDRAM一路进化,在SDRAM 133MHz时代,每片芯片(16bit)理论上可实现266MBps的吞吐性能。每内存通道64bit理论上最高(burst方式)可提供1066MBps吞吐性能,两个内存通道合计约2GBps。

    65220编辑于 2023-02-25
  • 来自专栏linux运维

    硬件维护问题:硬件维护不当,导致硬件故障

    检查当前硬件状态首先,我们需要检查当前系统的硬件状态。 常见的硬件维护问题及解决方案2.1 硬盘维护不当问题:硬盘维护不当,导致数据丢失或性能下降。解决方案:定期检查硬盘健康状态,备份重要数据。 2.6 散热维护不当问题:散热维护不当,导致硬件过热或性能下降。解决方案:定期清理散热器和风扇,确保散热良好。示例:使用压缩空气清理散热器和风扇:关闭计算机并断开电源。 2.7 环境维护不当问题:环境维护不当,导致硬件受潮或积尘。解决方案:保持良好的工作环境,避免潮湿和灰尘。示例:保持机房通风良好,使用防尘网和除湿器。3. 使用自动化工具进行硬件维护工具:Ansible介绍:Ansible 是一个自动化工具,可以用于远程管理和配置多台主机。

    47310编辑于 2025-02-07
  • 来自专栏网络技术联盟站

    AI芯片设计与优化:算力提升、能耗降低与硬件加速器的发展趋势

    本文将详细介绍AI芯片设计与优化中的算力提升、能耗降低以及硬件加速器的发展趋势,并分析其对AI技术发展的影响。图片1. 硬件加速器的发展趋势为了满足日益增长的AI计算需求,硬件加速器成为了芯片设计与优化的重要方向之一。硬件加速器通过专门设计和优化的硬件结构,能够显著提升芯片的计算能力和能效比。 3.1 图像处理单元(Image Processing Unit,IPU)IPU是一种针对图像处理任务的硬件加速器,通过并行处理、特定指令集和定制化架构等方式,实现对图像处理任务的高效加速。 3.2 神经网络处理单元(Neural Network Processing Unit,NPU)NPU是一种专门用于神经网络计算的硬件加速器,具有高度的并行计算能力和低能耗的特点。 优化算力、降低能耗和发展硬件加速器是提高AI芯片性能的关键要素。随着技术的进步和需求的不断变化,AI芯片设计与优化的趋势将持续演进,并为各个行业带来更多的应用机会。

    1.6K30编辑于 2023-07-04
  • 来自专栏前行的CVer

    硬件

    电机驱动电路 单片机引脚输出的电流最大为20mA左右,远远不能满足电机的电流需求,因此需要电机驱动电路。常用的驱动电路有H桥电路,它比较复杂和庞大,一般用于控制几十安的电机。对于较小电流电机,可以直接选择集成芯片,如RZ7899,一个芯片可以驱动一个电机,需要注意的参数为工作电压、输出最大电流。绘制原理图时,参考芯片手册中提供的应用电路进行绘制。单片机引脚连接芯片的中间可以放一个300欧的电阻,起到保护单片机和芯片的作用。芯片输入引脚接10k的下拉电阻到GND,让芯片不接单片机时不受外来信号的影响,即默认输入LL让电机处于浮空状态。电机正负极两端接一个104电容,避免火花。

    30210编辑于 2024-05-15
  • 来自专栏VRPinea

    9月VR圈以硬件技术消息为主,元宇宙热度居高不下

    (啥也不是……) 除了上述信息以外,P君已将9月VR圈大事件整理完毕,小伙伴们注意查收哦~ 硬件技术及产品 Facebook发布智能眼镜 99日,Facebook发布了首款智能眼镜产品。 VR硬件厂商展示新PC VR手柄 VR硬件厂商Megadodo Simulation Games,展示了一对全新PC VR手柄。该手柄与其将推出的PC VR头显DecaGear相匹配。 小派科技成立于2015年,是一家集产品研发、生产与销售为一体的VR硬件厂商,产品主打高性能PC VR头显。 此外,小派科技将将于10月20日在线上,召开Pimax Frontier 2021全球发布会,届时将推出创新的硬件产品。 2021东京VR游戏展 于9月30日举行 2021东京VR游戏展(TGSVR)于9月30日在线举办,该游戏展将是首个以VR为特色的大型消费类游戏展会。

    67020发布于 2021-10-20
  • 来自专栏腾讯云TStack专栏

    腾讯云9大政务产品为WeCity加速器注入新势力

    2019年10月29日,腾讯全球数字大会成都峰会上,正式推出了九大政务生态产品和WeCity加速器,这是腾讯布局WeCity生态的重要一环,也是腾讯和合作伙伴在城市管理规划、城市民生服务、市场监管治理等领域的一次成功尝试 腾讯势能——WeCity加速器 物理学中,有个概念,叫做“势能“,势能是存储在一个系统内的能量,是一种无限能源。于生态伙伴而言,WeCity加速器正是腾讯生态系统中的“势能”。 ? 腾讯公司高级执行副总裁、腾讯公司云与智慧产业事业群总裁汤道生宣布推出腾讯WeCity加速器 本次大会后,腾讯WeCity加速器将联合腾讯大学、腾讯研究院,整合全球顶级产学研资源,期望与优秀的产业互联网企业

    2.6K20发布于 2019-11-08
  • 来自专栏物联网思考

    【GD32L233C-START】9硬件SPI1驱动RC522

    开发板 rc522 PB12 <----------------------------->SDA(NSS) PB13 <----------------------------->SCK PB14 <----------------------------->MISO PB15 <----------------------------->MOSI PB0 <----------------------------->RST 3.3V <----------------------------->3V3 GND <----------------------------->GND

    78830编辑于 2022-04-04
  • 来自专栏林德熙的博客

    硬件分配

    以前做的是把一个软件分配到硬件,只需要让用背包问题最大化硬件的使用,但是没有让所有资源最大化。 对于下面的软件,假设 A 的性价比是最高,那么使用的算法就会优化A。 ? 假设 A 不使用硬件优化时需要运行时间是 12 如果使用硬件优化,需要硬件面积是5,优化后运行时间是3 B 不使用硬件优化时需要运行时间是 5 如果使用硬件优化,需要硬件面积是2.5,优化后运行时间是3 C 不使用硬件优化时需要运行时间是 5 如果使用硬件优化,需要硬件面积是2.5,优化后运行时间是3 D 不使用硬件优化时需要运行时间是 6 如果使用硬件优化,需要硬件面积是5,优化后运行时间是2 硬件总面积是 优化A会占有所有的硬件,也就是BCD无法使用硬件。 如果A使用硬件,那么不仅占用宝贵的硬件面积,而且软件部分没有被使用,而如果能同时使用软件资源和硬件资源,这样是最好的。 当然,在A的性价比高到一定程度,使用A硬件也是很好。 如果优化A,使用时间是 A=3,B=5,C=5,D=6 ,需要时间是19。

    1.1K10发布于 2018-09-19
  • 来自专栏linux运维

    硬件故障

    检查电源问题电源问题是常见的硬件故障之一,可能导致系统无法启动或频繁重启。检查电源线和插头确保电源线连接牢固,插头没有损坏。检查电源供应使用万用表检查电源输出是否正常。 使用BIOS/UEFI进行诊断进入BIOS/UEFI设置,检查硬件配置和状态。进入BIOS/UEFI在启动时按下特定键(通常是 F2、F10 或 Del),进入BIOS/UEFI设置。 检查硬件信息查看BIOS/UEFI中的硬件信息,确保所有硬件被正确识别。8. 使用硬件诊断工具使用硬件诊断工具可以帮助您全面检查系统硬件9. 替换故障部件如果确定某个部件故障,可以尝试更换该部件。更换内存条如果内存测试失败,更换内存条。更换硬盘如果硬盘检测到错误,更换硬盘。更换电源供应器如果电源供应器有问题,更换电源供应器。10. 联系技术支持联系硬件制造商的技术支持,获取专业的诊断和维修服务。送修将故障设备送至专业的维修中心进行检查和维修。

    46500编辑于 2025-02-03
  • 来自专栏帅云霓的技术小屋

    硬件融合技术内幕 进阶篇 (9) —— 中国人民的骄傲

    在前两期《软硬件融合技术内幕 进阶篇 (7) —— 恶魔导演的战争》和《软硬件融合技术内幕 进阶篇 (8) —— 永朽不垂的小丑》中,我们论证了,期望通过交换ASIC/NP和SoC来实现SmartNIC 的困难——对于数据平面一些大量重复的运算,使用固化电路实现的硬件加速单元进行卸载(offload),虽然能够取得很好的执行效率,但如果这些运算的算法需要迭代,那么,固化电路将难以胜任。 可编程逻辑器件是一种特殊的芯片,可以根据工程师们写的硬件描述语言(Hardware Description Language, HDL) 的编译结果,来实现不同的逻辑。 但SPDK,Hypervisor等来自开源社区的组件,基本都是使用C/C++等软件开发使用的编程语言编写的,与FPGA开发使用的硬件描述语言(HDL)相差非常大。 那么,有没有办法让SmartNIC既可以运行高级语言编写的程序,又能利用FPGA实现灵活可编程的硬件加速算法呢? 请看下期分解。

    47830编辑于 2022-12-13
领券