前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >新火种AI|硬刚OpenAI与谷歌?微软偷偷自研出5000亿参数大模型!

新火种AI|硬刚OpenAI与谷歌?微软偷偷自研出5000亿参数大模型!

原创
作者头像
新火种
发布于 2024-05-11 03:42:57
发布于 2024-05-11 03:42:57
990
举报
文章被收录于专栏:新火种AI新火种AI

在AI领域,微软公司一直以其独到的创新性和前瞻性而闻名。也正因此,它抢先在AI赛道嗅到商机,并极具预判性的投资了OpenAI,使其成为自己在AI赛道上的最强助力。不过,微软的野心不止于此。

根据The Information 5月6日的报道,微软公司即将推出一款全新的AI模型产品,内部代号为MAI-1,其参数数量达到了惊人的5000亿。值得一提的是,这款大模型产品由微软独自研发推出。换句话说,微软正式开始了与一众行业巨头的竞争,这其中也包括OpenAI。

微软的独自AI之路,从MAI-1开始...

就在不到一个月前,微软刚推出了一款名为Phi-3的小型AI模型,其中Phi-3 mini被优化至可部署在手机上,拥有38亿参数,经过3.3万亿token的训练,微软称其性能与GPT-3.5等模型相当。

相比之下,MAI-1的规模要大得多,也需要更多的算力投入和训练数据

MAI-1的出现具有极其重要的意义,它标志着微软在AI领域迈进了一大步,并且开始执行与谷歌和OpenAI等公司竞争的战略举措。

MAI-1的开发由前谷歌AI领导人,Inflection前首席执行官Mustafa Suleyman领导。选择一个“外人”来领导项目,这表明微软正在努力扩大其AI能力,减少对外部合作伙伴,特别是对OpenAI的依赖。

MAI-1具备庞大的参数数量,拥有约5000亿个参数,远超微软此前训练的任何一个开源模型。这个参数规模意味着MAI-1能够处理极其复杂的任务,并且很有可能在性能上与谷歌的Gemini 1.5,Anthropic的Claude 3以及OpenAI的GPT-4等知名大模型相匹敌。为了支持MAI-1的开发,微软已经配置了大量包含英伟达GPU在内的服务器集群,并从各类来源收集训练数据。

不过,也有人对MAI-1的原创性产生了怀疑。就在今年3月,微软刚刚领投完Infection的最新一轮融资。在此之后,微软便从Infection挖走了包括Mustafa Suleyman在内的两位联合创始人以及部分员工。有知情人士透露,微软为此向Infection支付了超过6.5亿美元。所以,很多人合理怀疑,MAI-1与Inflection的技术高度相似。对此,有微软员工表示,尽管MAI-1可能借鉴了Inflection旗下模型的部分技术,但可以肯定的是,MAI-1是一款全新的大语言模型,远超微软此前训练的任何开源模型

先前推出的Phi系列模型和最近的MAI-1研发体现出微软要在AI领域采取双重策略的意图:一边为移动设备开发小型本地模型,一边开发由云端支持的更大规模的模型

亦敌亦友!微软与OpenAI之间的竞争将日益加深。

作为OpenAI背后的大金主,微软曾经为其提供过不遗余力的支持。不过,商场如战场,为了自身利益,今天的亲密伙伴很可能变成明天的对手。想要独立发展AI赛道,这几乎成为了微软的必经之路。

一方面,作为科技大厂,微软急需在AI领域获取技术方面的独立性,这就需要不断减少对外部合作伙伴,尤其是对OpenAI的依赖。也只有这样,才能在AI领域拥有更多的自主权和技术控制力。

另一方面,微软进驻AI赛道进行角力,势必是奔着头部的位置去的,也势必对AI行业的战略布局与市场主导地位抱有追求。自研出MAI-1,使得微软能够在大型语言模型领域获取优势,与其他包括谷歌,OpenAI在内的科技巨头形成了平起平坐的竞争关系。

更重要的是,微软早已开始进行投资与资源积累,如今的MAI-1正是水到渠成的结果。譬如早早进行规划,大量囤积AI芯片;未来几年将在GPU和数据中心上进行巨额投资等,都说明微软在AI领域的布局和努力是长线的,基于这些准备,微软做出MAI-1也就成了情理之中的事情。

那么,MAI的出现会成为微软与OpenAI分道扬镳,乃至撕破脸决裂的关键节点吗?倒也未必。

首先,二者的产品存在着明显的差异化。所以,微软想做的,很可能是通过MAI-1提供与OpenAI不同的功能或服务,以此来吸引更多的用户和市场。

此外,从某种程度上说,微软大力研发MAI的行为是对内部争议的回应。根据微软内部人士透露,公司中的一些领导对于原先的AI战略表示不满,认为其过于关注与OpenAI的合作关系,导致对AI原创研究的预算减少。MAI-1的开发可能是对这种内部不满的回应,并且成为了推动公司内部创新和研发的动力。

当前人工智能行业竞争日趋激烈,马上就要成为名副其实的红海。微软此时推出MAI-1,恰恰是对行业竞争态势进行响应,并展现出自己积极入局的决心。因为MAI-1并不是一个单纯的AI大模型,微软推出它,所追求的深层原因有很多,包括追求技术独立性,增强市场竞争力,长期投资与资源积累,产品差异,内部研发动力,战略转移等等。

如今,尽管MA-1的具体应用和性能还有待评估,但毫无疑问,它将成为AI领域的重要竞争者。也正是因为横空出世的MAI-1,我们可以清晰的感知到AI赛道的竞争之激烈,看到了科技巨头之间的激烈厮杀和战略操纵。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
OpenCV两种畸变校正模型源代码分析以及CUDA实现
图像算法中会经常用到摄像机的畸变校正,有必要总结分析OpenCV中畸变校正方法,其中包括普通针孔相机模型和鱼眼相机模型fisheye两种畸变校正方法。 普通相机模型畸变校正函数针对OpenCV中的cv::initUndistortRectifyMap(),鱼眼相机模型畸变校正函数对应OpenCV中的cv::fisheye::initUndistortRectifyMap()。两种方法算出映射Mapx和Mapy后,统一用cv::Remap()函数进行插值得到校正后的图像。 1. FishEye模型的畸变校正。
一棹烟波
2018/01/12
4.4K0
OpenCV两种畸变校正模型源代码分析以及CUDA实现
OpenCV中initUndistortRectifyMap函数存在bug原因探究
运行程序之后,生成的mapx和mapy,存在的较为明显的异常点位置bug如下图所示。
3D视觉工坊
2020/12/11
1.7K0
OpenCV中initUndistortRectifyMap函数存在bug原因探究
60行代码加速20倍 NEON实现深度学习OD任务后处理绘框
【前言】 本文版权属于GiantPandaCV,未经允许,请勿转载!最近在学neon汇编加速,由于此前OD任务发现在检测后处理部分使用OpenCV较为占用资源且耗时,遂尝试使用NEON做后处理绘框,以达到加速并降低CPU资源消耗的目的。
BBuf
2024/06/18
2240
60行代码加速20倍 NEON实现深度学习OD任务后处理绘框
NEON做色域变化_ 用单核性能无限逼近八核并行OpenCV
最近开始接触neon汇编,觉得这个东西在一些应用场景上好用,遂做些记录,分享下自己做的一些工作。
BBuf
2024/05/21
2220
NEON做色域变化_ 用单核性能无限逼近八核并行OpenCV
一份朴实无华的移动端盒子滤波算法优化笔记
这是我自己做的移动端算法优化笔记的第一篇文章。我入门移动端的时间其实很短,也是今年刚开始接触Neon优化并尝试用Neon来做一些算法加速工作,之前我做过系列的X86上的SSE/AVX算法加速文章分享。但那个系列已经比较久没有更新了,一是因为我日常做的都是和移动端相关的一些算法部署工作,二是因为我变懒了,所以希望新开这个专题重新找到一点分享算法优化文章的热情(笑)。关于盒子滤波这个算法的移动端优化,梁德澎作者已经有分享过一篇很优秀的文章了,即【AI移动端算法优化】二,移动端arm cpu优化学习笔记之一步步优化盒子滤波 ,所以你可能会在我的这篇文章看到很多的优化技巧已经被他讲过了,但这篇文章仍然有我自己大量的思考以及花了大量写出对应的优化代码,我接触了哪些资料或者说学习了哪些知识,我都有列举到,所以对移动端优化感兴趣的小白还是值得看看的。代码开源在https://github.com/BBuf/ArmNeonOptimization 。
BBuf
2020/08/10
1.6K0
移动端arm cpu优化学习笔记第4弹--内联汇编入门
本文主要内容是介绍ARMv7和v8内联汇编的一些基础知识,并且会结合两个具体例子去看下如何用内联汇编来改写原来的代码。
Ldpe2G
2020/05/31
3.1K0
Elasticsearch: 向量相似性计算 - 极速
任何向量数据库的核心都是决定两个向量接近程度的距离函数。这些距离函数在索引和搜索过程中被多次执行。当合并数据段或在图中寻找最近邻居时,大部分的执行时间都花在了比较向量的相似性上。对这些距离函数进行微优化是值得的,我们已经从以前类似的优化中获益,例如,参见 SIMD,FMA。
点火三周
2024/04/23
3980
Elasticsearch: 向量相似性计算 - 极速
aarch64下NEON的使用与思考
cortex-a系列有偏重能耗与偏重性能的两个方向,对于偏重能耗的芯片往往我们可以不使用,而偏重性能的芯片我们不能去掉FPU与NEON,所以一般做这样的划分:
bigmagic
2020/06/02
5.8K0
ARM Neon Intrinsics 学习指北:从入门、进阶到学个通透
【GiantPandaCV导语】Neon是手机普遍支持的计算加速指令集,是AI落地的工程利器。Neon Intrinsics 的出现,缓解了汇编语言难学难写的难题,值得工程师们开发利用。
BBuf
2021/04/16
4.9K0
OpenCV3.4两种立体匹配算法效果对比
 以OpenCV自带的Aloe图像对为例: 1.BM算法(Block Matching) 参数设置如下: int numberOfDisparities = ((imgSize.width /
一棹烟波
2018/03/19
4.9K1
OpenCV3.4两种立体匹配算法效果对比
道阻且长_再探矩阵乘法优化
【GiantPandaCV导语】本文记录了笔者最近的一些优化gemm的思路和实现,这些思路大多是公开的方案,例如来自how-to-optimize-gemm工程的一些优化手段,来自ncnn的一些优化手段等。最终,笔者目前实现的版本在armv7a上可以达到50%左右的硬件利用率(这个利用率的确还不高,笔者也是一步步学习和尝试,大佬轻喷),本文记录了这些思路以及核心实现方法。改好的行主序代码(x86+armv7a版本)可以直接访问https://github.com/BBuf/how-to-optimize-gemm获取。
BBuf
2020/12/08
6640
道阻且长_再探矩阵乘法优化
如何阅读一个前向推理框架?以NCNN为例。
CNN从15年的ResNet在ImageNet比赛中大放异彩,到今天各种层出不穷的网络结构被提出以解决生活中碰到的各种问题。然而,在CNN长期发展过程中,也伴随着很多的挑战,比如如何调整算法使得在特定场景或者说数据集上取得最好的精度,如何将学术界出色的算法落地到工业界,如何设计出在边缘端或者有限硬件条件下的定制化CNN等。前两天看到腾讯优图的文章:腾讯优图开源这三年 ,里面提到了NCNN背后的故事,十分感动和佩服,然后我也是白嫖了很多NCNN的算法实现以及一些调优技巧。所以为了让很多不太了解NCNN的人能更好的理解腾讯优图这个"从0到1"的深度学习框架,我将结合我自己擅长的东西来介绍我眼中的NCNN它是什么样的?
BBuf
2020/12/23
2K0
Opencv中goodFeaturesToTrack函数(Harris角点、Shi-Tomasi角点检测)算子速度的进一步优化(1920*1080测试图11ms处理完成)。
  搜索到某个效果很好的视频去燥的算法,感觉效果比较牛逼,就是速度比较慢,如果能做到实时,那还是很有实用价值的。于是盲目的选择了这个课题,遇到的第一个函数就是角点检测,大概六七年用过C#实现过Harris角点以及SUSAN角点。因此相关的理论还是有所了解的,不过那个时候重点在于实现,对于效率没有过多的考虑。
用户1138785
2023/11/02
6250
Opencv中goodFeaturesToTrack函数(Harris角点、Shi-Tomasi角点检测)算子速度的进一步优化(1920*1080测试图11ms处理完成)。
一段NEON代码
#include <iostream> #include <arm_neon.h> //需包含的头文件 using namespace std; float sum_array(float *arr, int len) { if (NULL == arr || len < 1) { cout << "input error\n"; return 0; } int dim4 = len >> 2; //
轻舞飞扬SR
2021/09/23
1.1K0
Android 逆向笔记 —— 说说 Dalvik 及其指令集
在进入正题之前,推荐阅读一下之前的两篇文章。第一篇是我的一篇译文 —— 译文找不到了,就放一下原文吧。
路遥TM
2021/08/31
1.4K0
安卓逆向系列教程(一)Dalvik 指令集
所有寄存器都是 32 位,无类型的。也就是说,虽然编译器会为每个局部变量分配一个寄存器,但是理论上一个寄存器中可以存放一个int,之后存放一个String(的引用),之后再存放一个别的东西。
ApacheCN_飞龙
2019/02/15
1K0
安卓逆向系列教程(一)Dalvik 指令集
用哪吒D1开发板体验riscv向量底层编程
RISCV V扩展即向量指令扩展(RVV),这部分作为研究AI加速计算领域有着非常关键的作用。既然的D1支持了rvv扩展(0.7.1,最新的版本已经0.10版本),那么就实际的从底层原理角度分析一下使用的流程。利用了多媒体加速指令集,可以让计算变得更加的高效,同时并行计算的特性使得同时多次计算一组数字成为可能,类似于arm的NEON等等,那么RISCV又该如何去开启和使用V扩展指令,让计算变得更加高效呢?
bigmagic
2021/07/01
1.7K0
Android逆向开发之smali语言的学习
算法:正数的符号位是0,负数的符号位是1。正数的反码、补码与原码一样。负数的反码是让符号位不变,数据位按位取反;补码是将反码加1。
乱码三千
2021/08/24
2.1K0
Android逆向开发之smali语言的学习
[强基固本-视频压缩]第十二章:向量指令 第一部分
向量计算是在执行单个处理器指令时,对多个数据块同时执行相同类型的多个操作。这一原理也被称为 SIMD(单指令多数据)。这个名字源于与向量代数的明显相似性:向量之间的操作具有单一符号表示,但涉及对向量各分量执行多个算术操作。
用户1324186
2024/03/20
2580
[强基固本-视频压缩]第十二章:向量指令 第一部分
代码编辑器
2,设置异常中断程序。程序内容就是当产生异常原因读写【禁止读写的内存】时,执行分配对应地址的内存,然后继续运行。分配内存应该考虑可能失败。
妄想扣篮的男人
2023/04/09
7.9K0
代码编辑器
推荐阅读
相关推荐
OpenCV两种畸变校正模型源代码分析以及CUDA实现
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档