大家好,我是IT老油条。最近有点小忙,一直没更新,抱歉。首先得感谢大家对老油条的支持,小伙伴们催更也是我创造的主要动力。发抖音聊话题,主要也是想抛砖引玉让大家发表各自意见,求同存异,把这个行业建设得更好。另外特地说明下,我们所讨论的SaaS企业是指那些1000人以下,年收入低于10亿人民币,ToB服务的企业。我们所有的结论都是以此为前提,差之毫厘谬以千里。
今天我们聊聊当下的热门话题”AI浪潮“。目前整个AI板块成为资本的主要投资对象,无论是软件还是硬件。而AI大模型基本每月都有新品发布,与此同时,AI应用也融入社会的各个领域,对SaaS行业冲击尤其突出。这期视频主要内容就是回答大家关心的AI7个问题:
问题一:AI的出现,对软件行业造成了什么样的影响?
问题二:从开发人员视角,该领域目前究竟是什么状态?
问题三:目前发展AI应用,具备哪些优势
问题四:目前发展AI应用,哪些是不利的因素?
问题五:AI浪潮最终会让哪些人受益?
问题五:AI浪潮最终会让哪些人失败?
问题七:SaaS企业面对AI浪潮应该怎么做?
为了搞清第一个话题,我这边有几组数据共大家参考:
<1>截至2024年9月27日,Hugging Face平台上公开可用的AI模型数量已突破100万个。
<2>而在2023年8月底,Hugging Face平台上的公开人工智能模型数量只有30万个.
所以,与去年同期数据相比,这意味着在12个月期间,该平台上的预训练模型数量增长了200%,数据集数量增长接近500%。
<3>2023年,GitHub平台上的生成式AI项目数量新增了65,000个,同比增长了248%。2024年,新增了超过7万多个与生成式AI相关的项目 。
从增长的数字就可以感受SaaS企业面临的心理压力,逼着SaaS管理者去时刻思考---自己的平台功能是否已经落后?我们的功能是否会被AI所代替?我们如何通过本次AI浪潮来赚钱?以至于很多人针对AI浪潮,出现了各种急病乱投医。
下面我们就从开发人员的视角来聊聊本次的AI浪潮,它对软件行业造成了什么样的影响。在阐述观点之前,我先介绍下本人接触AI项目的经历:
我第一次接触AI项目是在2023年3月份,那时候是由于chatgpt4刚刚发布,整个业界对它的表现非常震惊。纷纷开始学习AI大模型的相关技术,希望将这些亮点未来应用到自己的平台上。我也是从那时开始接触AI,大概到了4月份开始攒显卡搞技术预演。第一个项目全盘参考github上的开源代码,应用成果差强人意,后期一直在迭代研究其优化方案。同时也花了大量时间去研究目前市场的AI应用,各个大模型在业界的使用情况。后来陆陆续续一直也涉及其中,比如语音文字转换,向量数据存储,RAG知识问答等。过程中也大概理解了大模型的基本结构,所以现在可以回答第一个问题,对软件行业的影响:
影响1:受AI生态的影响,GitHub出现了前所未有的开源潮,目前大部分软件企业都在GitHub找到与客户需求相符的开源项目。
影响2:受资本的追捧,目前大模型迭代非常快,平均每个月就会出现新版模型,下游企业被逼跟进迭代。
影响3:受AI浪潮的热情,显卡变成了稀缺资源,目前的算力成本都很高,已经成为企业沉重的负担。
影响4:受视觉识别,语义理解技术限制目前所有的AI应用无法像人一样去处理问题。
影响5:受投资方压力,几乎每家软件都推出了自己的AI应用,而他们效果却天才和弱智现象共存。
回答了第一个问题,我们接着看
通过一年多AI项目接触,大概了解AI的基本结构和运行机制,同时可以对未来发展做初步预测。这些经验大部分得力于解决 数据采集,训练,向量编排,大模型交互等瓶颈的处理。其中与AI接触最多的是日常开发工作,记得23年3月,chatgpt能够SQL语句的简单优化,大部分主流开发代码的理解。当时AI只能做一个可有可无的开发助手,而同期其他开源大模型基本都没这个能力。当时预测未来8年内,大部分程序员工作可能会被AI所代替。而到了2024年底,chatgpt能够非常专业的进行SQL优化,代码编写,项目创建等工作,并且这些能力都融入到程序员开发环境中。从一年多的切身体验,调整预测:未来AI代替大部分程序的工作情况缩短至6年。 同时我们在试用过程中也发现,利用AI去写代码最大的瓶颈不是大模型的能力,而是整个信息链的缺失。比如:需求过程,需求工程师会通过聊天,手工绘图等各种形式与客户沟通原始需求,需求原型也同时可能分散在表格,图片,会议纪要等各种文档中。同理,设计过程,平台框架也是各种不同介质存储和方式。这些信息都是项目开发的基石,AI作为机器如果无法获取到这些信息,就无法完成代码开发工作。所以想让AI完全代替程序员,这条路任重道远。
另外在开发AI应用项目过程,对其风险管理时也发现了一些端倪,可以隐约感觉到未来决定项目是否成功的决定因素就是成本。项目能否成功,最大的决定因素是我们所选择的策略会产生多大的成本,具体如下:
<1>大模型无论是使用开源部署版本还是公有云服务,对GPU的消耗都是巨大的,这块费用将成为未来运营的巨大负担。故SaaS企业是否有能力降低GPU使用成本,这将决定了SaaS企业的生存能力。
<2>大模型的微调训练的成本非常的高,无论是材料的整理,还是微调过程的tokens消耗其成本都是巨大的。故确定使用某个大模型之前要认真调研该模型的训练材料,评分结果。这也告诉我们,未来中小企业如果涉及AI项目,切记禁止使用孤僻开发语言或者特立独行自建应用框架。如果违背规则,企业想利用好AI能力,微调成本将非常巨大。前面视频前面视频提到SaaS主要职能是创建行业生态,特立独行将使得AI能力与信息链构建出巨大沟壑,这对企业的发展非常不利。
<3>最后一个就是开源资源的利用,2024年GitHub上AI的开源项目增长超7万,业务场景也涉及了各个领域。针对目前国内中小SaaS企业来说,没有能力去做AI的底层研究。所以是否利用好开源资源,是目前SaaS企业AI研发的重要指标。当然这个过程需要企业实时关注行业开源动态,新的技术方案,保障项目螺旋式迭代更新。
所以第二个问题的答案是,该领域目前是风险和机遇并存,是个高速发展的状态。
了解完两个问题后,我们现来做个深入分析。我们都知道一家SaaS企业的成功主要因素有3个:”政策,市场和技术“。而目前国内的SaaS企业往往以中小企业为主,在政策上获取的资源有限。本期讨论也不做过多描述。
故我们的分析着重在技术和市场两个维度:技术上我们会分析下AI发展趋势,目前的有利条件和目前该领域的瓶颈。而市场维度,我们将参考19世纪加州淘金热事件,来确认市场的淘汰机制。
咋们接着分析,目前整个AI领域发展迅猛,几乎每周都能收到AI迭代进化的资讯。关注这些资讯,细细分析我们可以得到以下发展趋势:
<1>目前所有的开源大模型,其训练成本都是大几百万美金。他们花了这么多钱,而与过去市场行为迥异的是,这些模型的拥有者纷纷选择开源。深入分析你会意识到目前所有AI模型都是雏形阶段,属于临时形态,未来最终形态也许天差地别。面对激烈的市场竞争,用户生态比知识产权更重要。同时我们也应该清晰的认识到,AI大模型底层目前只能由全球个别大企业玩得起。对于中小SaaS企业只能在AI应用上做做文章,千万别去碰大模型底层。同时面对大模型的快速迭代,企业需要有与时俱进的意识,随时做好更换最新大模型的准备。
<2>AI技术的高速发展是从 2017年Transformer架构的出现开始的,解决了循环神经网络处理长序列的性能瓶颈。而引起大众广泛关注的是2023年3月chatgpt4出现。并且AI技术迭代让所有社会领域,高校,研究机构,商业公司,制造商全员参与其中。所以未来影响的绝非软件行业,未来最大的产值冲击也不在软件行业。举个例子,从2017年之后摄像头结合了AI能力可以识别各种行为和场景变化,可以在生产制造领域实现无人工厂。电动汽车利用AI视觉能力不但可以剔除激光雷达等高成本组件,而且低成本的实现了L3级自动驾驶。未来仿生机器人,仿生宠物更会成为巨大的市场。相反,市场上一直被鼓吹的AGI却由于信息链的不完整,并且训练材料的缺失,他的出现的时间点会继续向后推迟。
当然AI对Saas软件的影响,在单向领域还是巨大的。前面提到的AI的代码能力,未来将给SaaS企业解决定制化需求和平台拟人化提供新的思路。比如平台的运营过程,未来会通过AI能力可以实现实时诊断,并提出针对需性的解决方案。未来平台的交互过程也会实现语音,图形,动作等多模态的对接方式。但现阶段想通过AI完全代替某一个岗位角色,效果会很差,千万别听市场忽悠。
接下来我们就可以回答第三个问题了
国内SaaS企业如果开跑了AI应用这条路,目前来说存在公有云资源充分和开源项目这两大有利条件。开源资源上可以得到:
<1>Hugging Face上几乎囊括了所有各类场景的开源模型,包括了语音处理,图形处理,内容编排等。一方面可以快速找到合适的模型用来提升应用效果,另一方面巨大的模型库让SaaS企业可以直接跳过训练过程,找到符合行业场景的模型而无需微调。所以对企业来说,挖掘Hugging Face可以极大的降低产品的开发成本。
<2>GitHub平台上的AI开源项目,到了24年新增已经超过7万,目前依然在高速增长。对于国内AI开发者来说,利用好这些开源项目可以大大降低AI开发的门槛。让企业不必去研究AI底层高深的算法和逻辑,可以快速的去实现客户的需求。在AI这条道路上,全球的开发者呈现出前所未有的合作与开放精神。这种开源思想对我们的SaaS平台也会产生深远影响,它将推动SaaS企业代码开源的浪潮,让所有参与者去共建行业生态。
<3>目前所公布的开源模型,其训练材料非常广泛,成本基本都是几百万美金起步,领域涉及软件开发,应用科学,社会历史,人文文化等。正是庞大的训练材料才使得让机器理解我们的自然语言,让平台应用可以对接神经网络。当然受制于算力成本和AI的发展周期,目前的训练材料去支撑理想中的AGI还远远不够,造成AI在实际使用过程中出现天才与弱智并存的现象。
对于企业来说利用好已训练的材料库非常重要,这样可以低成本的利用到AI优势表现。切记使用AI缺乏训练的领域,更有甚者企业自创开发框架,自创生僻孤冷技术底层,那将使企业主动与AI脱钩,逃离行业生态。当然这样的企业也是没活路的。
回答完优势问题,我们来解答不利的因素:
与此同时,目前AI技术发展过程中也存在诸多瓶颈,这些瓶颈给功能实现产生了挑战。当然如果企业能够规避这些瓶颈并找到了解决方案,将成企业的加分项。不利因素主要有:
<1>目前数据采集的入口太窄,模型的训练材料基本来自开源项目,维基百科,电子书籍,学术论文,论坛,在线课程等等。而对应与人类的习惯,性格,习性的理解远远不够,而目前AI训练所采集的数据广泛存在这样的信息。举个例子:我们在记录文档时,如果字体加粗就表示这段信息非常重要,处理时优先级要高于其他内容。如果文章中另外启一行,这表示这段文字已经脱离了前面描述的场景。而现阶段AI对这些人类习性的理解还差强人意,这也是AGI会延迟出现的主要原因。
所以对SaaS企业来说,如果想获取加分项,现阶段只能依托大模型的擅长领域进行功能开发,切勿好高骛远。
<2>数据链缺失,目前AI应用的大爆发才经历短短一年多。无论是企业资料还是互联网上的信息,当时都没考虑将这些数据喂给AI进行训练。所以目前市面上的大多数材料,让AI去理解都存在一定的障碍。同时我们存储业务系统中的结构化数据,不是按行业标准去组织的。举个软件场景的例子:与客户的需求沟通过程信息存储在IM的数据库中,客户需求对应的原始资料可能存在产品经理电脑磁盘中,绘制的流程图可能使用的是钉钉文档,绘制的原型是使用的axure软件。这只是需求过程,而整个项目阶段包含了需求,设计,开发,测试,部署,运营。所以要让AI来胜任代码开发工作,所有信息链都是割裂的,即使大模型拥有更强大的能力,这项工作它也无法完成。
所以对SaaS企业来说,如果想获取加分项,可以在信息链路上大做文章。这块业务存在着巨大商机,如果把AI整个业务比作一台发动机的话,数据链的业务就好比汽油。SaaS企业如果实现了让AI快速理解业务资料输出问题,就好比发明了如何生产汽油的技术。
<3>算力成本,大家都知道AI最终玩的是算力,GPU成本将来是企业沉重的负担,如何降低算力成本也是重要的加分项。而SaaS企业可以在以下几处下功夫:
1.商务上SaaS利用庞大的用户群从公有云那边拿到便宜tokens单价。
2.针对模型微调和日常训练场景可以充分利用抢占式GPU实例。
3.选择合适的大模型来实现AI应用功能,尽量减少模型微调,未来更换大模型将会是高频事件而每次更换大模型都需要重新微调。
4.对生成式AI的成果需要充分利用,尽量减少重复无效的AI计算。
目前各个企业都在开发自己的AI应用,如何让自己的应用脱颖而出,这些瓶颈就是你们的发展方向。
以上通过技术维度分析,我们回答了2个问题,接着我们从技术视角做个总结。
在本次AI浪潮中相关信息是爆炸式流传,很多都是为了商业宣传,如何去伪存真这对企业很重要。通过技术维度分析,我们可以知道以下概念:
第一个概念,AGI通用人工智能的出现会比预想的时间点要更久,目前市场上的所有的AI大模型都是迭代中的临时版本。
第二个概念,AI行业现状是一个对立的矛盾体,一方面涌入大量的开发资源,资本和人才催生出大量的开源大模型,同时也出现大量的开源项目资源,发展势头凶猛。但另一方面由于触发本次AI井喷的Transformer架构时间并不长,所以照成目前训练材料,算力,信息链方面迭代时间不够,严重抑制了AI的发展。
第三个概念,国内SaaS企业的规模决定了我们的AI发展之路需要严重依赖AI模型的自身能力,并没有太多能力去做AI的底层开发,并且需要做到随时更换最新大模型。
以上是从技术视角给出的行业总结,接着我们从商业视角来分析下当前状况。
由于本人一直从事技术相关工作,过去的商务经历并不多,所以商业分析我们将采用另外一种模式。我找到了一个非常类似的市场案例---旧金山淘金热。一场耗时7年左右的商业浪潮影响了很多人,同时创造了美国的一个州。通过还原这个浪潮中发展趋势,分析各个角色的得失来对照目前的AI浪潮,我们可以得到很多结论。我们先看下整个加州淘金过程:
<1>1848年,1月24日:詹姆斯·马歇尔在加州的萨克拉门托河附近发现了金粒,这一消息迅速传开,引发了人们对黄金的狂热追求。
<2>1849年,随着消息的传播,成千上万的淘金者从美国各地甚至世界各地涌入加州,旧金山迅速发展成为一个繁荣的城市。
<3>1850年,年末:淘金热开始降温,黄金资源逐渐枯竭,淘金者的数量开始减少。
<4>1851年,年中:政府开始采取措施限制淘金活动,以保护环境和维护社会秩序
<5>1852年,淘金热基本结束,尽管仍有少数淘金者在继续寻找黄金,但大多数人已经放弃
<6>1855年,淘金热的影响逐渐减弱,但加利福尼亚已经从一个边远地区发展成为一个繁荣的州。
整个淘金热席卷了当地土著,普通民众,国外移民,企业,财团,政府等各种角色。有人从此暴富,有人破产,有人丢命,结果迥异。通过分析各个角色的得失,我们来预测本次AI浪潮最终结果。
通过分析我们可以发现整个淘金浪潮,主要让这几类人群暴富:
<1>早期淘金者:最早到达金矿地区的淘金者往往能够找到较多的金子,因为没有其他人与他们竞争。这些早期淘金者中,有些人确实赚到了大笔财富。对应于AI浪潮,对标的是2020年之前一直从事AI相关技术研发企业。现如今这些企业在AI浪潮中,成为了国际资本重点收购的对象,水涨船高。
<2>淘金工具和装备供应商:随着淘金热的兴起,对淘金工具和装备的需求大增。那些能够提供高效、耐用的淘金工具和装备的供应商,也从中获得了丰厚的利润。对应于AI浪潮,很明显这里指的就是GPU生产商,皮衣哥黄教主目前是赚的盆满钵满。
<3>服务提供者:随着淘金者的大量涌入,旧金山地区的商业和服务业也得到了迅速发展。提供食物、住宿、运输等服务的商人,以及开设商店、酒馆等场所的业主,都从中赚到了钱。对应于AI浪潮,就是提供AI解决方方案的企业。对于他们来说,何利用好客户对AI的狂热,提供相关AI相关的周边服务,可以获取到巨大的成功。
<4>房地产开发商,随着旧金山地区的人口增长,对住房、商业地产的需求也在不断增加。那些能够及时开发房地产的开发商,也从中获得了可观的收益。对应于AI浪潮,对标的的是目前公有云服务商,比如阿里,腾讯,百度等,他们提供开源模型的快速部署能力,GPU服务器的租赁,向量库的租赁。目前翻翻这些公有云的官网就能看到,他们在全力推荐的AI相关资源就能知道这块利润有多大。
<5>金融家:淘金热期间,金融业也得到了发展。那些能够为淘金者提供资金支持的金融家,以及从事黄金交易和金融投资的投资者,也从中赚到了钱。对应于AI浪潮,这里对标的是AI大模型的底层开发者,头部玩家。比如openai,微软,Google,Mate,国内有 阿里,智普,华为,当然目前由于模型还处于临时迭代版本阶段,最终谁存活下来花落谁家还未尝可知。但可以断定未来谁最终存活下来的,必将盆满钵满。
那那些人最终失败呢?
同样我们通过分析也能发现这场浪潮的失败者,我们可以对照参考:
<1>普通淘金者:随着淘金热的加剧,越来越多的人涌入金矿地区,导致黄金的分布越来越稀疏。许多普通淘金者最终一无所获,甚至负债累累。对应于AI浪潮,我们大部分的AI浪潮的企业都将是受害者。一方面感受到AI浪潮的压力,另一方面又没有突出的AI技术基石。结果,人云亦云为了贴AI标签而AI,成本激增反而会丧失自己的优势业务能力,变的虚弱不堪。
<3>被骗者:在淘金热期间,许多淘金者被骗,购买了劣质的工具或被引入虚假的金矿。这些人不仅没有赚到钱,反而损失了大量财产。对应于AI浪潮,对标那些听取夸大的商业宣传,重仓投入AI行业的受骗企业。他们的决策者其实根本不了解大模型,新鲜事物也没市场参考,麻木全仓投入的企业。
<4>土著居民:淘金热对当地的土著居民造成了巨大的影响。他们的土地被掠夺,文化被破坏,许多人被迫离开家园。对应AI浪潮中,对标那些面对AI浪潮丝毫不去改变的企业,温水煮青蛙,慢慢被市场所淘汰,
<5>环境受害者,大规模的采矿活动对环境造成了严重的破坏,包括水土流失、河流污染和生态系统破坏。这些破坏对当地居民和后代产生了长期的影响。对应AI浪潮,对标于未来被AI代替岗位的企业受害者,毕竟AI的发展将慢慢改变整个社会。
回答了商业维度的两个问题之后,大概可以看出虽然整体上对社会产生巨大的推动。但同样产生了少部分受益者和大部分失败者。通过分析加州淘金热,我们可以得到以下结论:
第一个结论,在任何一个浪潮中获取巨大收益的人都是利用了别人对浪潮的热情,而不是浪潮业务本身的参与者。换句话说,淘金热最终收益人员并不是参与淘金的人。
第二个结论,AI浪潮的早期淘金者是指2020之前的AI技术创业企业,这是极少数分布。未来AI模型领域的最大收益者也是极少部分的头部大玩家,对于我们SaaS企业需要尽量避开这个赛道。
第三个结论,浪潮中的信息很多都是不真实的,大部分随波逐流投入AI赛道的企业未来都将是受害者,我们需要在AI浪潮中执行差异化策略。
以上无论从技术视角还是商业视角各种分析,其实都是为了回答最后一个问题:
通过AI浪潮的技术分析和商务分析,最终总结出目前国内SaaS企业,其发展原则:
对于未来可改变社会的AI技术,目前阶段还属于成熟前期,对于SaaS企业而言最赚钱的业务不是开发AI本身而是利用其他人的AI热情去做相关服务。同时正由于技术的不成熟,弥补这些技术瓶颈或将引来巨大商机。
所以我们实践AI项目时,将按优先级去调控我们的业务,这样保障发展原则得到贯彻。
第一优先级,优先发展AI服务业务,AI服务比应用功能更重要,首先,SaaS平台为了满足入住企业的AI需求应优先创建企业AI解决方案,协助客户去建设AI能力。(注意;这里说的是帮客户去建AI能力而不是SaaS自己建)内容包括提供给客户可供选择的本地模型方案或者公有云模型方案,从训练材料采集,训练过程,向量数据存储,企业信息链打通,AI能力共享等一整套解决方案。其次,企业可以提供算力资源共享服务,虽然公有云也提供类似服务,但他们是基础服务商在业务处理上没有SaaS企业专业。我们可以充分利用企业数量优势,利用商务手段,或者利用技术能力 获取到极低的算力成本共享给入驻客户。最后由于目前AI模型是个过渡产品,未来更换的频率将非常的高,方案迭代频率也会非常频繁。SaaS企业对AI技术能力的积累,也可以包装成业务咨询服务,这将来也将成为大买卖。
第二优先级,AI的发展对SaaS模式瓶颈问题将产生结构化影响,需要优先解决瓶颈问题---主要有两块,非标需求和安全因素。所以对SaaS企业来说,第二重要的代办项就是处理非标需求和数据安全问题。非标类需求大体上可以分为集成类和功能定制类。集成类由于需求比较单一,利用AI可以更容易处理。SaaS企业只要规范好标准的对外开发平台,针对自己的对接规范做简单微调就可以实现目前市场上大部分的非标对接需求。所以转换思路让AI去主动承接非标集成对接,可以大大降低企业的交付成本。非标功能定制类,目前来说需要SaaS在数据层,事件通讯,业务接口,界面开放上做符合传统框架的标准化,以及各类代码开源。这块相对比较复杂,下期我们将详谈。
而SaaS的安全因素,未来随着企业的广泛使用AI会逐步突出SaaS模式的安全问题,这将是一个矛盾的起爆点。大家都知道长远的未来,企业服务将全部转型AIagent模式,资料的安全性将更加突出。所以目前的SaaS模式下对数据本地化的要求会越来越高,如何解决数据本地和应用SaaS化的矛盾将显得尤为突出。解决思路就是混合式部署,这样可以让客户选择数据存储区域,以解决客户的后顾之忧。当然配套的SaaS企业需要要提供混合模式的AI解决方案,这样才能满足客户的合理需求。
第三优先级,才是产品本身的AI功能实现。产品AI功能设计思路上也需要务实可行,实时考虑成本因数。所使用的推理大模型尽量减少微调过程,无论技术框架还是UI规范尽量与市场通用技术保持一致,高度行业化。
另外需要我们的产品经理思路打开,AI应用不是要求单独开发出针对AI能力的单独应用,它是指将拟人化的智能处理嵌入到所有的传统功能之中--避免闭门造车。另外未来应用的使用对象不只是用户,未来可能是客户企业的AI。
通过业务优先级去调配资源,才能让SaaS更好的直面这一波AI浪潮,让企业业务乘风破浪。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。