00:02
啊,这个。我今天很高兴啊,就是来到咱们西安这边,因为我母校也是西安的啊,这个虽然平时在贝斯在北京,但是很高兴能过来跟大家一起交流啊,我今天主题的话,主要是AI行业的这个发展趋势漫谈,呃,那么的话就是其实呃,大家在做这个行业的时候,其实重点第一步首先是在行业的这个卡位,以及行业发展趋势,因为AI行业两天一变啊,一周一变,这个变来变去,可能昨天做的这种题到明天就。可能有一个更好的出来了啊,当年的DA文作为这个第一个AI全站的一个,呃,智能体,然后到今天的话,其实我们发现大家都签到这个cloud Co CD上去了,呃,以及cloud之类,OK, 呃,那么就是说呃呃不好意思啊。OK, 我这这是我自己介绍啊,因为刚才主的那个就是老师已经介绍过了,我这里就不复述了啊,然后主要是这个就是今天主要有三个部分的内容啊,就是我先从第一趴开始啊,就第一趴就是关于web coding的重新定义工作范式,呃,刚刚来的时候我还跟我同学就是赵总要跟他聊一个事情就是呃,我们认为就是说现在就是聊到一个话题,就是说level coding这个事情,现在很多公司内部。
01:15
到底啊渗透力怎么样呢?到底是不是真的产生作用了啊,这个就基于我自己最近也服务了很多客户,我不知道,大家知道有一家公司叫中创达啊,应该也是一个300多亿的一个上市公司,然后他们有1.5万做操作系统的啊,国内可能我们汽车上还有这个很多终端的LOT各方面操作系统他们做的,然后就是说我们在帮他去做整个的服务过程中发现一个现象。就是这个公司从一开始的时候,让公司所有人都用可拉,或者用这个各种web coding工具,但是的话,这个提效并没有提上去,也就提到个10%或20%提不上去了。那么这个问题出在哪里呢?问题出来就是说对于web coding它本身的一个在公司内部到底如何架构的组织层面是有一个很大的一个概括。
02:01
那么这个GAP到底是什么呢?我们都知道,呃,我记得以前我公司刚开始在让所有人在用这个微coding工具的时候,发生一个现象,你让他们用了,那么的话就是当然这个话给老板说,我说在场有没有老板啊,当然对于程新来说可能比较残酷一点,就是说大家用了这个工具,原先要干10个小时,现在只干5个小时,剩下的5个小时接个私活,对吧,这应该是很多公司的现状,那么就是说在公司组织层面的话,好像感觉这个好像就是没法解决问题,好像对于公司整个组织架构各方面没有也直接的提升,那么但是就是说我们现在其实引出了一个我们知道咱们编程从原先的这个测试驱动啊PDD,再到后来的行为驱动BDD,再到今天啊,变成了这种s Spark行为规范就规范的这种啊,驱动开发啊,就是SDD啊,就是s spake啊这个drive。Development, 那么就是这是今天的一个新,呃,新的一个模式,那么我这是一篇论文里面的,我们都知道contextt发展的经历了,现在经历这么几对几个阶段,那么最早的时候就是一个翻译的角色,很简单一个翻译角色啊,那么就是说再到后来的,呃,在二三年,二四年这两年重点是作为一个instruction的一个这么一个角色啊,相当于就更多是一个原生的一个智能体,那么再到今天,其实已经可以作为这个我们的一个镜像了,说白了就是说我们现在大家可能在用cloudexs,或者用cloud code的话,你布置一个任务,他自己干去了,相当于已经成为我们的合作伙伴,比较信任的一个合作伙伴,那么未来他就是master啊,当然master这个阶段还没还没到,但是我们目前是处于这个阶段啊,咱们正处于这个作为可以替代我们的这个阶段啊,那么就是说在就是成为这个我们导师的阶段,这个可能在明年或者后年啊,但其实这个也在发生的过程中啊,就可能我们大多数人未来都是以他为师啊,那么这个是现在一个现状啊,那么康太上下文的一个现状啊,那么基于这个上下文现。
03:52
的话,其实我们再去看VIVO coding, 我我估计这句话大家有个感受吧,就是我们还年轻啊,千万别碰这个就碰上了基本上就戒不掉了,所以说玩微VO coing, 其实我记得宝玉之前有个比喻,跟玩老虎机一样啊,就是说都是玩老虎机是放个硬币,玩这个的话是放一个是放个token,对吧,就玩那个是拉个杆,玩这个是输入计划,这个逻辑是一模一样啊,最终的话,至于老虎机最终能不给你给你想要的结果跟we coding能不能给你想要的结果是一样的啊,那么这个的话也是当前的一个现状,那么其实要用白话来说,就是把这个以前自己写代码变成跟AI写,呃,描述描述需求,让AI去写代码,说白了就是把我们解放出来啊,那么就是。
04:35
我们的角色要从原先的怎么编成要变成一个想要什么啊,就像这个以前在锄地的时候,我以前就是说像以前这个农,农民去锄地的时候,他是锄地,那么现在的话不用锄地了,现在就是说学会开开那个收割机就好了啊,开机器就好了,那么这是两个,呃,两个思维啊,所以这个思维啊有一个大的转变啊,Wevo codeding, 然后那么web coding可以干嘛呢?这个估计大家有感受了,就是说它其实就是普通人加上一个coding的一个收割机啊,比如产品原型啦,包括生成文档啦,生成外部应用啊这些,还有各种前后端纳测试审查啦,不用讲想不用,以前的话,比如说我们大家很多人可能做项目啊,就基本上都是说,诶我的话先,呃,这个给用PPT做个PPT啊,尤其做解决方案专家,你肯定是先做个PPT对吧,去给别人讲讲,讲了半天讲半天之后的话,然后哎,客户问你一堆问题,那现在直接其实大家我们拿我们公司来说,我们现在基本上都是快速用v recording做一个POC给客户去用,大概可能一般这个POC大概也就也最长也就两三天啊,正常情况下小的项目。
05:35
一般用两三个小时啊,其实这个现在已经很成熟了,比如说啊这个的话,当然我们腾讯也有工具啊,就是说比如说我们一般原型啊,可能会用那个4啊,然后这个用4做出原,做出原型之后的话,然后再用这个一些就如腾腾讯开发的工具,或者说外部的其他的工具,我们快速做一个前端,然后前端做出来之后再用CC cloud code的的话,再去完成后端,那么这个逻辑其实在这个闭环里面已经在很多已经在发生中啊,当然DEMO这个就不说了啊,那么这边是一个很简单的一个,呃呃呃,前面那块是一个很简单的一个,就是你让他去干活,呃简让评审嘛,做代码题,代码评审其实就是说,我估计这个话可能很多人会有疑问,说诶这个微博口里写的跟史山一样,写的跟屎一样的代码啊,那么我没法看,但是大家有没有想到个问题,如果你是公司CPU,我就问你,你知道你公司的代码是什么样的吗?
06:24
一样的就是就是我估计很多人会质疑这个事情,说哎,我这个佣人写的肯定要比他写的好,但是其实我们要问自己一个问题,我们是不是作为CTO,你是不是真的知道你公司代码是什么样的,呃,好多人我们一直在质疑说AI的话,写的代码我不知道什么样的,那我们人写的代码难道你就知道了,所以这个事情我们自己要问自己的啊,应该是有点耐心,对他来说OK,然后这是关于呃这个部分,然后再到其实方法论啊,这个行业的,其实现在VIVO coding几个方法论,从PID啊,PID这块就不说了,比如说你比相当于把产品需求文档要转化成提词需求文档,然后的核心目标是为了做意图表达。
07:03
然后需要做意图表达,那么这种这种这六个范式啊,这六个模式都是什么呢?都是cloud code的出现之后,带动了这个上下文工程的一个崛起,所以发生的这六种的现在方法论,那么就是说PID这种的话,我们知道以前有一个项目叫呃,就是contact engineer real, 然后也呃应该template吧,有这个get up上有开源项目,那么这个项目的话,当时其实里面就有两个的对应的,我们知道cloud是有命令command的,对吧,Command的话,它给的两个命令,一个是生成pip的命令,然后另外一个是执行pip excut的pip的一个命令,那么这两个命令就可以把这个东西就完成了,那么PID的话是更侧重的时候,用户的核心目标就是意图表达,其实这种方法呢,更批侧重这个意图表达,那么Spark这种方式,就是说这种方式其实现在是我们的思维的一个转变,要从原先的测试驱动,再到后来的行为驱动,再到今天的规范驱动啊,那么这种驱动方式其实Spark现在是比较流行的一种使用方法,我后面有个例子啊,就是说我可以先把这个例子说,比如。
08:03
跟我们传统方法是这个方法论啊,比如你写首先写PID两三个小时,然后创建设计文档两三个小时,然后再用手动去设置项目结构30分钟,然后编写技术规范三四个小时,等等等下来需要12个小时,但如果说用Spark这种方法论,那么因为Spark的话,我们相当于把这个,呃,就是他的规划啊,还有这个对应的这个实现规划,再到生成可执行任务,这三个部分已经内化为一个规范文档了,规范的一个上下文,那么的话,它只需要五分钟执行,已经快速完成,总共下来15分钟,其实这就是一个两个新方法和传统方法的一个区别啊,估计大家可能自己做外b coding应该是有感受的,然后再有第二个的话,第三个就是避慢的,呃,这种的话是属于典型的多智能体研发团队,就是按角色去分工,模拟真实环境的工作,SOP最早的就是那个me达GPT,大家可能也知道吴成林做那个,就是说me达GPT,他当年是最早提出把研发的软件工程的SOP内化的智能T里面在二三年七月份应该七八,呃,二三年的十月份左右吧,我记得那个时候发布的啊。那么这个东西当然现。
09:03
那市面上有很多这类的项目啊,像微软的凹凸帧的,包括咱们可腾讯也有,各家都有啊,每家可能都有自己的对应的这个这方面的一些智能体啊,就多个智能体,相当于把公司的不同角色做切割啊,然后完成不同的任务,那么再有pip这个方法论。GIP是那个国外的一个人在I4年提出了啊,I4年提出提出他其实核心理论就是说基于PID以及代码库和操作手册这三个东西,然后相当于内化到你的上下文里面,然后让模型去执行对应的一些个,呃,这个对应的,呃对应的这个就是任务啊,然后6A还有6A方法的这个就偏向于过程型了,就是说比如说首先从一图对齐,我们需要把它专模糊的这种需求,然后描述成专业的规范需求,规范描述这个东西的话,其实就是什么意思呢?比如说咱们一般我们要理解,比如说你跟老板沟通的时候,跟老板沟通的时候,老板肯定描述的是用模糊需求,对吧,我们是需要一个专业的人把这个模糊需求转化成一个,比如通过项目经理或者通过产品经理,然后把它转成一个专业的描述,从而让呃,这个写代码的,或者说做这个对应的下游的这个CPU能看得懂。
10:10
那么这一步其实就做一图对一齐,那么我们在做这个对应的上下文的这个体制词的时候,上下文的这个工程的时候,就应该把第一步先做好,然后第二步的话是做架构设计啊,比如说你基于上面的规范基础共识,我我这里是可以拆一下架构设计,这个非常重要,是目前AI在短期内替代不了的很多ctou,也是很多ctou非常关键的一个地方,比如说作为CTO,我觉得一个公司在构建自己的上上工程的时候,首先第一步应该由ctou首先写他自己的根部的,就贝斯的MD这个文件。啊,贝斯的马克down的这个文件,那么贝斯马克down文件,你比如说对整个公司的架构的描述,对于你的这个整个的规范代码规范规方描述应该放在这个里面,然后再有对应业务模块的技术leader,再去把它的这个马克down的文,马克down的上下文再写好,然后引用这个相当于就是包含了这个CPU的它的上下文,就是每一个角色应该这样拆下来,哎,我们现在大多数公司之所以说很多时候它的这个就停留在说是,哎,你们都用这个就是,呃,微博callingding工具吧,但是没有提效,没有提效原因就在这里,就是没有在组织架构层面去推动,自上而下的去推动,把微博callingding在整个公司里面贯彻下去,如果说你通过这种方式把每一步他的MD文件的话都写的非常详细的话,他到最后一环节的时候,到用到那个写代码coding那个人的那个环节的时候,他给的结果不可能说是非常不可控,这个可能性是不大的,那么就是说只是说是我们需要把这些规范下来啊,那么就是因为大多数对于大多数公。
11:40
司写代码的人来说,他不可能知道从架构师再到部门的业务模块的技术leader,再到最底下的抠的,他每一环节需要有什么规范,他不可能看到全貌的,所以他们用web coding写出的东西,很多时候是没办法一次性达到我们想要的那个结果的,那么如果说需要快速能达到一个可控的那个结果的话,你就需要把这个规范写好,那么就架构设计,就是把从基础共识再到架构设计,再到模块设计要做好,然后再到任务拆解架构设计,再到拆分任务,再到明确接口,然后子任务审批这块,从子任务到人工审查,这里就需要加入人工审查啊,然后再到迭代修正,然后再到最后执行啊执行以及编码测试,最后再评估啊,大概就是6A的啊,然后再有一个,最后一个就是上下工程管理,这个是现在用的比较多的啊,其实本质就是架构师加上上下文,再加上微b coding的一个协同啊,那么这种方法的话,其实呃现在是用的最多的啊,你比如说现在,呃,我们就是最近不是出现了很多的,比如说get HUB有一个叫SPAK,呃SPAK这个开源项目大家应该知道吧。
12:41
就是说都属于这这这类方法里边的啊,OK, 呃,我们这是几个方法论啊,就是如果说CTO的话,可能在执行web Co, 在整个公司要贯彻下去的时候,不能简单的粗暴说,诶你们就是大家每个人都用AI工具吧,哎,应该是站在一个更高层次的去规范整个公司的上下工程,这个整个的一个架构啊,呃,然后这是关于这几个方法论啊。
13:05
然后再到微博口Ding,再说一下风险啊,其实呃,我们其实经常会说的一个事情啊,就是说哎,这个东西能完成80%的工作量,但是有20%不可控,我可能要花120%的精力去解决代码的bug,那么这个可能是我们做为博coding中经常会质疑到,但是我们想象一个问题,就是结局的话,要么你放弃了,要么自己重写啊,但是就是说其实这个东西我们想象一下,如果说对于一个职场新人,你去招一个新人进来的时候,我们都有足够的耐心去调教他,但凡我们能拿出一半的精力去对AI有点耐心迭代一下你的上下工程,我估计它的可用度和调教难度是远远低于对于一个新人的调教调教难度的啊,所以这块的话,我们是要那个耐心,我们我们不要永远永远想着说是我给他一句话,他就应该给出我想要的。就是这个中间必然是有一个上下游工程的这么一套东西,这个也是作为现在新时代的这种AI类公司的,它算一个核心竞争力的地方,就是作为研发这个地方非常核心的竞争力,可能以前现在不是我们都知道,现在市场上有个说法。
14:09
以前的代码很值钱,到今天我问大家是不是很值钱,你的对话很值钱。对不对,现在的话就是说我每次看到别人用VIVO code做做1做出一个东西的时候,我需要的不是他的代码,我需要的是他的对话是什么样的。所以这个应该是未来公司在管理微博coding的时候,要重点去保留和保存的一个东西,就是说你比如说在完成这个项目,你用了这么多的上下文啊,上下文的管这个这个对话管理,那么你在下次再执行一个任务的时候,你是不是可以从这个对话的其中的比如说1/3开始,或者1/5开始。这个是我们未来要考虑的啊,那么核心原则的话就是我们需要放下对这个我认为对AI或者web coding的这种傲慢啊,然后就是跟他共创,然后就是说这里再说一个我们以前我们想象以前咱们在没有AI之前,我们是一个团队,对吧,团队里面的人和人之间是属于我们这个人之间的上下文共享,我们人和人之间团队协同的这种上下共享,但是现在我们要步入到我们在二三年,二四年是我们相当于是我们不用考虑人,我们就希望是AI,完全就是跟人完全是割裂的,我们希望把这个希把希望寄托在AI上,我希望AI靠自己的上下文理解能把所有东西干完,但是走到今天我们发现执行不了,那么今天更多是什么路径呢?是人的上下文,你的团队研发团队的上下文要和这个。
15:33
AI的就是VIVO coing这个上下文两个要共创,要形成一个上下文,这个是今天做研发团队,做研发的一个CT,这个整个团队里边要思考的一个问题啊,就是你如何让你的团队的上下文和AI的web coding的上下文的共享,共享在一个空间里面,大家相互能理解,那么这个是,呃,就是关于今天要说的这个核心原则啊,就是我们还是要放下傲慢,不要觉得我扔给他一个需求,他解决不了,我就把它放弃了。啊,这个是不对的,就是不要从AAA的这个极端走向另外一个极端,然后最后一个就是人才的话,其实现在在全球很多地方,大家都开始招聘具备web coding的这个招,呃,这个能力的这个人才啊,比如说我现在基本上在招一个人呢,我都会问,哦,你用we coding, 你用什么工具,然后你的话大概是平时工作的组合是什么样的,当然如果说咳死了,可能拿我自己来说,我现在就pass掉了。
16:22
啊,你如果单纯只一科S的话,这个其实已经是属于很早期的一个阶段,应该是这种很多上下文啊,各方面混起来用的啊,OK, 呃,然后这是这个地方,然后前面讲的微博的。一些个正在每个行业发生变化的。所以现在技术团队如果要转型。前面说的小会。未来的上下文这套方法论在改造整个技术团队,也就是说你从你团队的核心的一些东西的维护,包括核心的,我前面也说了,从代码要转变成对于上下文的,对于上下文和对于这个对话的这个。这个是要有转变的啊,然后下面来聊一聊这个AI行业的一个现状,这个可能就对创业的人创业的。
17:06
呃,然后这个都是我自己的观察,就是说。首先第一个结论啊,就是I5年是回类的AI应用的一个元年啊,然后会催生大量的行业腰部的公司的崛起啊,为什么说这个观点呢。我记得在二三年二四年的时候,我们公司的话,本身在一线啊,拿一样也在一线做训练啊,还有做这个政府落地,那么我们当年的话,在二三年二四年的时候,把自己包成外包,类似于外包公司。同意到今天我们之前给先是给那个北京那个火箭花园那块。旁边染有8个矿物。给他做了一个啊,母亲的一个一个小训练,然后再后来的话,又去搞了教育行业,然后再后来又去搞了这个能源啊,然后还搞了这个就是医疗,医疗我们跟协和也在训练一个。就是搞了很多行业,为什么搞成这个样子呢?是因为当年的话,在二三年,二四年对这个没出现。
18:02
哎,二五年二份ex sick出现之后,开始出现了一个变化,就是说我们从我们deep sick的出现让所有人看到的可能性,原来AI是可以这样。可能解决,可以解决这个问题,所以在过完年之后,明显感觉到整个市场从原先的就是说所有行业,所有的耽误明关系。干呀。这个战之后大家都东航过来要求,所以这种这样推出了你的大度。所以说今年是AFA的一个。然后再到二六年的话就是,呃,这是第一,这是这个点,然后第二个观点就是说二六年的话,有望成为C领域应用爆发和腰部公司领先的原因。
19:01
怎么说呢,我们现在都知道,整个行业里现在是被头部的几家偷吃。对不对,有TOC的,你只要做出一个东西。但是基本上都是这个现状,使得国内的呼吸的创业者基本上是。啊,意思就是说,我记得当年有一个患者给我吐槽,说他刚做了一个应用,然后流量刚有这个大概有2万多3万,就在在呃,在那个什么推特上啊,就是用英文的话,也我们也是基个基本还都好,其实当时在这上面就是大家签字时候刚出来一下,立马就被人说了。另外一边景变大。就是所以的话,这个的话。里面的一个现,但是如果出现一个变化,变化呢。因为我们所有人,因为对这个事件让所有人对AI成先嘛,那么成先之后,我们就会进行下一个阶段,开始对AI的交付结果开始有要求了,在对AI交付结果在长线的时候,我们是没有要求。
20:01
好玩,真好玩,能做出一个非常好玩的东西。但是现在我们发现,慢慢的大家对AI这个东西开始有要求了,你的结果你应该满足我的需求,一旦有要求,通用的、头部的这些AI工具就很难满足需求。所以他就会催生很多啊这个。缺乏腰部,这是当下的啊,包括大厂快速跟进,小团队,其实生存非常难,你这个东西给你超了我,我就说直白一点,比较扣子,你这个东西我跟你说内部绝对。东西出来了啊,所以的话就是这个东西很难的行业呈现,呈现这个头部集中在TOC领域的话,呃,除少数的产品外,几乎没有选择啊,用户选择范围很有限,然后再到这个AI的服务的供需正在呈现一个变化,就刚才前面也说了,就to b的话,大概就是说从原先的外包逐渐逐渐转化为这个行业解决方案,因为这个deep sick对市场的教育,使得每个细分的行业,比如医疗、法律、金融或者不同行业都有大量的机会,比如拿咱西安来说,咱安属于呃,这个叫短距之都是吧?啊,那么这个就大量机会啊,现在短距这么火啊,对吧,这个对西安本土市场来说是有非常大的机会的啊,那么就是说,所以说我们应该从这个外包心态转变成这种这个垂直细分行业解决方案的这种心态啊,然后再到这个培训市场就不说了,这太卷了。
21:38
卷卷到没边了啊,就是说这个行业天花板就是李一周没没得说啊,到现在为止都没有人超越李一周啊,OK, 呃,然后这是关于这盘啊,然后国产算力,关于算力这块我稍微也说一下,因为我们反正看到一个现状啊,目前其实在未来,在明年大概率啊,因为我自己本身也有,我们也有算力的板块啊,就是说呃,明年大概率就是说首先第一个预测啊,就我记得前段时间那个明星大会的时候,那个吴钊按他们好像预测是10倍。
22:08
然后我自己认为太保守了啊,应该至少100,当有人预测了1呃1万倍啊,还有一个我记得行业一个大佬预预预测了1万倍,但我个人认为比较合理是100倍,然后国产算力应该在这个整个的进程中会占有,在明年开始会占有一席之地。为什么这么说呢?其实现在国产算力大家知道最大的问题是什么呢?最大问题是因为国产算力,除了昆仑星和这个,呃,这个其他几个,还有还有几个,还有一个之外,然后其他的大多数。他的问题什么?他的问题是在包括华为在内,大多数的问题都是他无法就是。怎么说呢,集群,集群化运作都拼的都是单卡能力,我们看到参数都单卡能力,一旦进入集群里面,调卡率都是10%~40%不等,所以这个基本上是没法规模化应用的啊,所以说但是有一个好的现象,就是国产芯片明年会出现一个现象,因为910910B的话,已经出现三年了,将近三年了啊,三年后的话,那么会淘汰一批进入爱手市场,进入I手市场之后,那么这个整个的国产芯片,它的这个叫呃,应该说性价比会提升一大截啊,那么性价比提升一大截的话,这里面就有机会了,因为国产芯片现在最大场景在哪里?最大场景在MAS啊,在MAS场景。
23:17
但是其他场景都不行,为什么这么说呢?大家应该做很多应用案例,应该知道你在录一个case的时候,如果你用到一个不知名的em班Y的一个嵌入模型,是不是立马它就不适配了,对不对?所以的话就是说这是国产芯片比较尴尬的地方,但是对于主流的模型来说,包括比如说腾讯会员啊,或者什么其他几家这个主流来说都一样,都是支持的啊,就是说国产头部这些个基本上都支持啊,但是对于其他你不支持啊,所以的话,这里的话在明年可能会有一些性价比优势啊,呃,价格大概可能会是国际价格的70%~80%啊,就是说我就透露一个数字,比如今年年初的时候,我记得当时跟移动的,呃研通研,呃,移动那个研究院聊的时候,他们当时给我透露数据,他的,呃,910B的90%左右都在吃灰呢啊,就基本上我们用起来,但是今年的话这个有改观了啊,我还有一个数字就是说MAS,目前就是说我们国产芯片对场景的渗透率目前已经到15%了,在去年的时候其实还不足百分之,应该不足5%。
24:15
但今年已经到15%了,因为MAS已经基本上是我还记得我一个观点啊,MAS未来是国产芯片的天下啊,基本上呃,就是什么N卡啦这些他是拿不到这个市场的啊,然后这是一个现象啊,然后就是说这里当然提到很多啊,就是包括二手机器性价比高了,什么MAS接口啊等等的啊,就这就有这么几个点啊,OK, 呃,然后再到这个基础设施的成熟啊,其实就是说二五年就是AI基础设施其实逐步成熟,尤其是推理加速框架。推里加速框架,像我们都知道啊,就是在今年的上半年,这个东西还是很神秘的啊,就是说这个东西非常神秘啊,就是说我们觉得这个东西的就是学术的比例会非常高,但是到现在为止,我可以告诉大家,因为ST浪的出现,使得这个ST浪是开放的开源社区,包括前两天他们10月7号在上海那边办的ST浪社区的一个会,就是说整个这一块的话,其实已经走向工程化了,我会告诉大家,因为我们自己也做MAS的优化,那么对于MAS优化这块的话,我的所有的人员就是每天就干一件事情,第一是基于SG浪的这种框架的一个优化,怎么优化呢?就是不停的看论文,不停的搜最新跟SG浪相关的论文,看怎么去把它工众化,优化它。
25:24
路径其实很简单,这个其实对于在座各位来说,如果真的完全去研究这个方向的话,是没有问题的,是这个肯定是能研究出来的,而不像在今年上半年的时候,如果说你要去干这个事情难度太高了,这个难度太高了,今天其实慢慢这个难度在降低的啊,包括前两天我不知道大家知道那个清华有个清华赤兔,那个加特地加速框架,清华赤兔,那么它也是这个。类似于这个方向的,那么推力加速框架其实在逐步成熟,那么服务的成本的话其实会降低啊,然后国产芯片的适配达,包括易购这些其实都很多都已经解决了啊,好的好的我知道,呃,那么的话,这个的话是一个大的一个框架和这个就推力加速框架这一块想告诉大家,就是说我们其实走到今天,推力加速框架已经不是一个神秘的东西了,而且我们国产很多的这种适配已经做得很好了,SG浪和VRM最大的问题是什么呢?只适配库打。
26:14
对吧,它是在库大上面建立的,但是你要在国产上用就用不了啊,那么你自己就得做重新调节啊,那么你要在算子层面再到上面一步一步弄这个太麻烦了啊OK,呃,这是关于这个AI基基础设施这块,然后多模态这块,呃,多模态这块我就不太多说,因为时间比较有限啊,就是说大概的一个观点是什么呢?就是说多模态其实在现在的快速变革,因为这个sora I的出现的话,基本上大家的范式已经出现转移了啊,然后我告诉大家一个现象啊,就是说我最近跟国内像,不管是生呃,Video啊还是这个,就是哦哦,就是那个video a ocean, 就是那个陆晨的,还是说是这个,这几家我头部几家我都聊过啊,各家都面临一个很大的问题,就是版权问题。视觉模型在训练过程中最大的问题是版权问题,比如说你中间一个字体训练字体的话,被别人呃生成出来用到了,那么这个时候就会有很大一个问题,就是说会被别人告,前段时间不是海螺被人告了15亿的美金的一个罚款嘛,所以这个领域的话,其实最大就版权问题,做视觉这块就搞把版权问题搞定,但是的话,目前行业里面或许会出现一个现象,我们都知道现在在训练呃文本模型的时候都是用GPT,就呃去做这个蒸馏对吧?呃,那蒸馏就不存在版权问题,那是不是我们可以用SOA去做这种。
27:27
视觉数据的蒸馏再去训练,那是不是可以解决版权问题,这个是行业正在探讨的一个方向啊,OK, 呃,那么这里面想告诉大家还有一个事情,就是因为sora的出现,其实我们会发现在去年你要做一个AI生成短句的东西,你要花个几十万吧,对吧,但是到今天你可能要做一个A生成短句的东西,可能大概就就是如果VIVO coding, 用VIVO coding的话,可能就几十块钱或者甚至几块钱就搞定了啊,所以这个是今天发生一个变化啊,呃,那么再到这个。数据分类和垂类的一个,呃,垂类的一个模型啊,就是说我们在做垂类解决方案的时候,最后一定要内把你的能力要内化的一个垂直模型上,通用模型主要关注的是steam这几个方向啊,Steam就是steam这几个方,你看通用模型就是什么mass能力,世界知识能力,还有这coding能力,抗S等等等等啊,那么他有那么七八个能力,那么对于垂类模型来说,你一定要建立自己的核心能力,而且我告诉大家一个现象,就是说我最近跟质朴啊好多家都在聊,我发现一个现象,大多数训练公司都存在一个问题,就是不不具备模型定义能力,因为训练这批人他们每天关注是我如何把GPU的利用率提升上去,我如果如何把这个GPU的显存和计算和带宽之间的这种啊,做拍peline的这种啊,这种设计去干这个事情,他不考虑场景,但其实现在走到今天,AI更需要的是这种模型定义能力啊,OK, 呃,这是垂泪的,然后最后一个的话,就市场机遇和竞争格局啊,然后其实从二三年到I5年就是to b的大的一个爆发期,那么二六年开始进入一个to。
28:56
非的一个转变期,刚才前面也讲过了啊,那么就是说20年会迎来TOC的一个爆发,然后28年到30年,呃,智能体公司会有一个比较大的爆发,就是什么意思啊,就是明年可能很多模型公司,还有三菱公司会上市,那么到28年左右,30年之间会有一批智能体公司会上市,就今年是智能体很多公司的元年,那么他们要上市,可能三年后28年到30年之间啊,所以这里稍微提一个这个啊,然后智能体多这个交付的一个形态也比较清晰啊,就是说智能体将在市场发展过去就是承担比较作用,呃,比较大的作用啊,然后就是说,呃,这里有个非常重要的现象,我们在去年你会发现,在23223年,24年形成的智能体框架,在今天上下游工程出现之后,这个框架慢慢的被人在重构。
29:41
或者被解掉了,我们现在可能很多人关心的已经不是智能体框架的问题了,关心的是有没有好的这种智能体模板,OK, 呃,然后再到这个核心趋势啊,就是中美之间的一个变化啊,就是说其实这几个可能大家第一个大家肯定也知道,我们国内走开源路线,国外走必然路线,这个对我们在拖海外市场是非常有帮助的。然后第二个的话,就是中国团队在全球的分布市场具有特殊性,这里稍微提一个点,比如说呃,就是说我们原先在分析全全球市场的时候,比如说美国团队是不可能去做穆斯林市场。
30:13
但这对于我们国内的团队来说,就是一个可以打的市场,就是可以区别于美国团队的一个差异化竞争的一个市场,然后目前还有一个现象,就是日本政府的话,对日本的这个呃,就是算力企业啊,就是说比如你采购这种H7的芯片呢,还补贴一半,所以导致日本市场的芯目前的很多有很多算力价格非常低的啊,也对全球的算市场造成造成冲击啊,然后国内的视觉领域的话,商业化正在爆发,海外市场更广泛啊,这个东西其实我们都知道,像那个就是咱们现在,呃,就是西安这边很多这个短句公司在这方面应该是已经。赚到第一桶金呢,算是OK,然后最后一个就是国内更多是to大逼的生意,然后美国集中在呃这个top和呃这个。To to p啊,Profession c和这个to小B和TOC上啊,那么这里稍微提一点啊,就是说呃,美国市场的话,其实跟国内市场的一个比较大的就是我们不要去羡慕那些个出海的,其实国外国内的话是虽然说没有机会,但是的话还是要比国外要多的,我自己的看到的现象啊,就国外有很多公司,比如说你可能做到5000万的时候,你这个时候也面临跟国内一样的情况,也是一个竞争情况啊OK,呃,然后呃,这个应该,呃这个是未来产品的一个特性啊,比如说低摩擦成本啊,然后最大规模的收集数据,然后自我迭代,还有自我进化什么什么,前面这两项目前最典型的产品是哪个呢?PRO我不知道大家有没有用,贴在手机后面那个PRO的那个收集音频的那个,就是会议的用的那个东西啊,然后就是说当前阶段正处于初级阶段,两年后我能会进入一个中级阶段,这里稍微说一下,我再插一句啊,就是说我们在AI行业发展会经历三个阶段,第一个阶段就是尝鲜,就是我们正在尝鲜,然后进入第二个阶段的时候,我们慢慢的依赖AI。
31:58
然后当我们所有人依赖AI的时候,再过一段时间就会发生硬件的变革,我们所有人为了更好的依赖AI,你离不开AI了,所以你要改变你的硬件交互方式,哎,这个是第三个阶段,我们现在正处于第一个阶段和第二个阶段的过渡阶段,就是第一个阶段,就是说尝先到这个,就是我们慢慢的要依赖它这个阶段,我们正处于这个阶段,所以我们一定要卡好位啊,然后这是这一趴,然后再到这个角色升级啊,这是最后一页了,然后提十斯工程,我们就是角色升级,要从提十斯工程呃,升级成这个上下工程,其实现在都很少有人提这个提次工程了啊,更多是上下工程师了啊,智能体构建的角色分离在二三年,二四年,咱们去做一个智能体的时候,我相信啊,在座的如果干过的话,应该知道,你做出一个智能体之后,用智能体框架做出来之后,基本上第二个人是接受不了的。
32:45
因为没有人能看得懂你的这个既是工程研发代码,又有提示词,没有人能看懂的,只有你自己能看懂,那么今天的话,因为这个角色的分离,就上下工程,让这个工程研发和这个上下文两个拆开了,那么使得上下文这个部分就可以由专人去专门去做这个事情,然后对于这个写工程研发的专门去干那个事情,那么这个两边就可以同步进行了。然后再有技术的工程化,就是说大模型训练其实已经工程化了,一一部分人就是干算力中心的事,一部分人干数据的事,然后就就就是就这两错人,然后还有一部分是干什么模型能力定义,但是通用模型是没有这方面人的,然后呃,最后有个技术成成熟度也在形成啊,标准化流程度在形成啊,OK, 呃,然后我啊,这还有一个啊,就是创业者我们应该抓住这个国产化和这个垂类模型创新和出海的机遇啊,在迭代中的话,实现自我升级和迭代啊呃,那么呃,这是我自己的一个东西啊,有兴趣可以加一下,这个是方案,里面有大量方案啊呃,然后应该到这块了吧,后面没有。
33:46
错了,对,好好谢谢大家,那个看大家有什么问题吧,嗯。好,谢谢谢谢谢谢,不好意思,咱们多站了一分钟是吧。
我来说两句