产业资讯
英伟达宣布新一代GH200 GraceHopper超级芯片
英伟达宣布推出新一代GH200 Grace Hopper超级芯片,新芯片将于2024年第二季投产。该产品依赖于高带宽存储器,即HBM3e,它能够以每秒5TB的速度访问信息。同时宣布基于GH200构建的新服务器设计。
微软的必应聊天将在第三方浏览器中推出
微软宣布必应聊天将很快在桌面和移动设备的第三方浏览器中提供。
Salesforce Einstein Studio允许你引入自己的模型,从Amazon SageMaker开始
Salesforce宣布推出Einstein Studio,这是一个管理控制台,允许客户将自己的模型导入到Data Cloud,无需进行数据提取、转换和加载。这个功能针对的是那些已经在其他平台(如SageMaker)上构建了模型的数据团队较为复杂的公司。
AI数据中心准备迎接快速增长
公司正在大量投资于专门用于AI的数据中心,以满足对AI应用的激增需求。预计到2029年,AI基础设施市场将增长到4225.5亿美元。值得注意的是,数据中心初创公司CoreWeave已获得23亿美元的资金,用于扩展其面向AI的数据中心建设。其他行业巨头,如Meta Platforms,正在重新考虑他们的AI数据中心项目。
AI研究员Geoffrey Hinton认为AI已经或将会有情感
AI研究员Geoffrey Hinton认为,AI系统将来将能够感受情感,比如愤怒和沮丧,因为它们可以叙述与情感相关的假设性行动。
工程研究
改进LLM评估以实现更公平的评估
研究人员提出了一种新的LLM评估方法,该方法使用深度网络来模拟学术论文审查流程。使用多层和代表不同角度的神经元可以得出更全面的评估结果。
用于AI人类视觉对齐的数据集
本文介绍了一个用于测试AI是否像人类一样“看”图像的数据集。该数据集分为三个主要组别 - 必须行动、必须弃权和不确定 - 旨在测试AI对清晰、不清晰或模糊图像的决策能力。
LanceDB - 开源、无服务器的向量数据库2.0
LanceDB是一个新的面向开发者友好的无服务器向量数据库,用于AI应用程序。它可以嵌入到应用程序中,无需管理服务器,并且在磁盘上进行扩展,而不是在内存中进行,延迟较低。LanceDB支持向量搜索、全文搜索和SQL,并且针对多模式数据进行了优化。
HF Transformers中的分类器免费指导
无分类器指导是一种引导模型生成的方法。它在图像生成中被广泛使用。它在文本方面也表现出色,现在在Hugging Face模型的.generate()方法中得到支持。
测试多模态LLM的新方法
MM-Vet是一个新工具,测试LLM在涉及图像和文字的任务中的表现,比如从照片中解决数学问题或解释图片中的笑话。
效率资源
WebGPU-Torch
WebGPU-Torch是一个TypeScript库,可以在浏览器中以与Linux工作站相当的速度运行神经网络。该库旨在匹配PyTorch的API,使用WebGPU实现,提供了优化的推理和自动微分能力。作者重新实现了WebGPU的基本操作,并利用代码生成器来优化内存布局和内核。
MiniChain
这个链式工具可能是第一个在原型和生产中都真正有用的工具。它巧妙而强大地使用函数装饰器和YAML模板来实现链式操作。示例表明,你只需要20行代码就可以编写一个聊天机器人、向量数据库等。
Artie
Artie是用于数据库到数据仓库的实时数据流解决方案。它利用变更数据捕获和流处理以更高效的方式执行数据传输,实现次分钟级的延迟,并降低数据仓库的网络成本。
TorchScale
TorchScale是一个PyTorch库,允许研究人员和开发者有效高效地扩展Transformers模型。
领取专属 10元无门槛券
私享最新 技术干货