Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >AI大神如何用区块链解决模型训练痛点, AI+区块链的正确玩法原来是这样…… | 人物志

AI大神如何用区块链解决模型训练痛点, AI+区块链的正确玩法原来是这样…… | 人物志

作者头像
区块链大本营
发布于 2019-09-17 07:02:04
发布于 2019-09-17 07:02:04
1.1K0
举报
文章被收录于专栏:区块链大本营区块链大本营

记者 | Aholiab

出品 | 区块链大本营(blockchain_camp)

现如今,数据成为了企业发展的核心因素,据世界经济论坛的一份数据表明,到明年,我们的世界中将产生超过44个ZB的数据,这个数据量比宇宙中可见恒星的数量都多出40倍!在未来的世界中,每个人每秒钟都会产生1.7MB的数据。

只要得到数据,就能得到价值。因此这些数据经常被大公司垄断。想要得到这些数据成本非常之高。在此基础上,有人提出了数据交换平台的概念,比如DEX、BDEX等,希望通过平台把数据提供方和数据需求方进行对接。

然而数据交换平台是由第三方来运营的,这其中也会有很多问题。那么,如何解决这些问题呢?去中心化数据公司OceanProtocol给出了答案

OceanProtocol项目来源于BigChainDB团队,初衷是通过提供一套去中心化数据交换的协议,为AI模型训练等需要大量数据的业务提供服务。OceanProtocol允许数据提供者通过去中心化的数据市场与数据消费者进行交互,同时保证所有参与者的控制,可审计性,透明度和合规性

然而,要实现这样一个数据平台,却并不是件简单的事情,其中包括很多技术挑战。

为了深入了解这一项目的背后,营长近期采访了OceanProtocol联合创始人&DEX首席技术官Mike Anderson

图片来源 | AsiaBlockchain Review

Mike Anderson可谓是西方世界开源领域中非常活跃的一位开发者,主攻大数据和AI。之前曾开发过多个开源库和开源工具,比如数值计算库core.matrix等。他还曾担任麦肯锡的软件开发专家,并且创办过一些公司。如今OceanProtocol也已经被用在保险、医疗、移动等多个领域。

接下来我们就来看看OceanProtocol的前世今生,以及开源大神Mike Anderson关于去中心化数据交换协议技术上的一些思考吧!

“我看到了用区块链释放分布式数据和AI的价值”

营长:能谈谈你如何看待区块链吗?

Mike:对于我来说,区块链技术最令人兴奋的地方在于它能够将加密技术和经济机制结合在一起,创建有效的分布式系统,这个系统不需要集中控制机制。

随着区块链技术的发展,我们可以期待在未来看到智能合约被用于实现全自动业务流程,甚至实现更为完善的业务模型。

营长:你之前在数据科学及AI方向颇有建树,是什么让你决定加入一个区块链公司?分布式的数据协议,难点在哪?

Mike:我之所以作为Ocean Protocol的创始成员加入项目,是因为我看到了应用区块链技术来释放分布式数据和人工智能的价值的巨大机遇。Ocean Protocol正致力于解决将数据和人工智能技术结合起来这一关键问题。

这个问题并不简单,要面临很多挑战,例如:

  • 数据由无数个不同的组织持有,需要从一个地方流向另一个地方。这可能发生在组织内部,也可能发生在跨组织之间。
  • 数据有不同的形式和格式,而且数据资产通常不以其解决问题的最终形式存在。此外,还有许多不同的数据平台和技术,它们都有自己的接口和API
  • 在涉及高价值或者由技术驱动的活动中经常出现经济专业化。各个组织往往会扮演最适合它们的角色。因此,为了从数据中提取价值,就会涉及多个利益相关者。
  • 不同组织和地区有不同的的法规和信任问题。

考虑到数据的分散性,集中化方法不太可能会取得大规模成功。我们需要一种分散的方法来解决我们在数据共享方面面临的挑战,并且开始创造真正的价值。

因此,要我们的主要工作是发展一套开放的数据交换标准,使分散式数据供应线得以运作。我们将其称为DEPs(Data Ecosystem Proposals,数据生态系统方案)。

*DEPs地址: https://github.com/DEX-Company/DEPs

营长:能举个例子谈谈,这种分布式的数据交换有哪些应用场景吗?

Mike:我就拿我们现在合作的几个案例来讲讲吧。

  • 在保险领域,Aviva和ConnectedLife把数据分析和人工智能应用在智能家居数据上,以加强对老年人口的保护和照顾,并支持其独立生活;
  • 在医疗领域,Roche Diagnostics正在探索如何更好地为接受血液稀释疗法(血夜透析)的患者提供护理;
  • 在零售领域,Next Billion 正在试验一种新的数据共享模式,该模式将奖励为销售数据做出贡献的农村店主;
  • 在移动领域,sgCarMart刚刚建立了一个二手车数据市场,帮助买家作出更加明智、安全的决策。

去中心化数据交换如何赋能AI模型训练?

营长:在一般的AI模型训练中,数据采集的痛点是什么?

Mike:通常来讲,数据采集和数据准备是人工智能项目中最难的部分,可能会占项目总成本的80%。如果没有充足的高质量数据,那么无论你的算法有多好都没太大意义。

而去中心化数据交易的做法是,通过消除当前数据共享的摩擦来解锁数据,并将问题所有者与问题解决者、数据持有者以及没有数据的人链接起来。

营长:这一做法的原理是什么?

Mike:我们可以从下面两张图中,看看中心化的数据服务和去中心化的数据服务的流程有哪些不同。

中心化数据供给模式

去中心化数据供给模式

在中心化的服务中,数据是由计算和存储机构来主导的;而在去中心化的模式中,数据的计算、存储等孤岛被打破。

在实现原理上,我们通过API将数据的存储、计算和算法能力开放给开发者。在这一过程中,DEPs作为中间协议对数据进行标准化。最终,将这些标准化、来自于不同节点的数据提供给开发者。

营长:既然是数据的来源来自于分布式节点,那么你们如何保证数据的质量和可用性?

Mike:在人工智能领域,数据的质量是非常主观的——这取决于你要解决的问题。满足这一个问题需求的数据不一定适合另一个问题。

为了保证数据质量,我们主要通过以下方式:

  • 通过加密技术追踪数据的来源和完整性,因此你可以确定数据没有被篡改过并且了解数据的来源;
  • 提供利用第三方组织进行数据清理和处理服务的功能,以便自动提高数据质量;
  • 为人工智能项目提供可以根据用例需求来定义自定义数据格式和工作流;
  • 通过将计算带入数据的方式(而非将数据带入计算)为分散式机器学习提供了一个用于培训和推理的基础设施。这为隐私提供了进一步的保障,因为数据不会离开其前提,从而开放了对来自多个站点的数据的访问权限;
  • 允许数据所有者保留对其数据资产访问权限的控制权。

营长:刚才你提到了DEPs,这也是链接数据提供者和消费者的核心吗?

Mike:是的,DEPs就像是在物流行业中的集装箱标准——因为每个人都是用相同大小和设计的集装箱,你就可以构建可扩展度很高的的基础设施,比如可以使用相同标准的集装箱船、港口、集装箱起重机。同样,DEPs为数据和人工智能供应线提供了一个通用的标准。

这个模型非常简单:我们定义了名为Data Assets(数据资产)的实体,它们代表有价值的数据集。如果使用者有足够的访问权限,那么就可以把“数据资产”的副本从提供者转移到消费者。

此外,我们还有名为Operations(操作)的实体,代表计算服务。“操作”可以接受“数据资产”和输入,并生成其他“数据资产”作为输出。服务提供者可以自由创建他们喜欢的任何“操作”:数据清理、训练AI 模型、格式转换等等都是可能的有用操作。

通过在有向无环图中组合“数据资产”和“操作”,你可以设计跨越多个参与者的任意数据供应线。这是DEP标准所支持的关键创新点。

营长:你认为随着这种去中心化的数据交换机制的成熟,是否会带出新的应用场景?

Mike:在我看来,分布式数据交换是人工智能和分析学的未来。通过标准的、可互操作的协议,我们可以期待一个充满活力的项目生态系统蓬勃发展。

此外,我们同样还可以期待服务提供商专注于数据经济中适合其能力的特定角色。例如,分散式存储服务提供商,或者提供强大模型训练算法的人工智能公司。

这些数据生态系统可以与加密货币以及代币共存。事实上,我们期待在未来的数据经济中,加密代币可以成为消费者购买资产和服务的主要方式。

区块链+AI,前路何方?

营长:你是如何看待「区块链+人工智能」的?我们目前正处于什么阶段?

Mike:我认为,尽管区块链技术还处于初期阶段,但它在创建分散式系统和服务方面具有惊人的潜力。相比之下,人工智能技术现在在许多用例中已非常前沿,特别是在预测建模、图像识别等方面。人工智能项目通常存在的问题是在获取高质量数据进行训练和推理方面。

此外,区块链具的可追踪性。可以找到数据共享和交易记录,并且可以创建数据来源轨迹。通过在模型训练期间追踪所有交易(从数据采集、预处理到模型训练和测试)我们可以重现来源追踪,帮助我们了解模型训练过程中使用了哪些数据,谁在模型中工作或对数据价值链做出了贡献。这条来源追踪线可以与食物链相媲美,并且可以创造出「负责任的人工智能」。

营长:作为一家初创公司,你们但不担心亚马逊这样的巨头也切入到这个领域?这会对你们造成哪些影响?

Mike:如果大公司能够基于DEPs标准创建他们自己的解决方案,我会非常高兴,因为这将帮助我们构建一个真正可互操作的分散式数据生态系统。从另一方面来说,如果这些公司只是简单地创建了一个有围墙的花,比如某种形式的集中服务,那么我认为他们不会有可行的解决方案。

市场需求是一种分散式模型,它可以识别在不同参与者控制数据或处理的不同子集时需要创建的不同数据供应线的复杂性。永远不会出现适合所有人「一刀切」的集中式解决方案。

营长:你如何看待区块链在中国的发展?

Mike:中国是区块链发展的一股主要力量。我发现有一个很有趣的现象:和世界其他国家相比,中国是申请区块链相关专利最多的国家。各国在鼓励区块链发展方面似乎存在一些差异,中国显然有成为区块链领域主导者的愿景,区块链技术的发展已被列入国家五年计划。与世界其他国家相比,中国为这项技术的进步和发展制定了一条更加结构化的道路。相比之下,美国政府在区块链方面的策略则不那么集中。

我平常base在新加坡,新加坡凭正在打造「智慧国家」,对创新持有极其开放的态度,并且设立了很多项目来资助和推动新技术的发展。新加坡专门为初创公司和企业、公共和私营部门的合作创造了沙盘环境。这些沙盘极大地促进了包括区块链在内的新技术和解决方案的发展,使该国成为了十分利于开发新技术、测试概念验证和大规模部署的地方。

营长:对于那些想尝试OceanProtocol的开发者,有什么建议?

Mike:我们鼓励人们参与到这个令人兴奋的领域中来,为开源发展做贡献并把这项技术应用到你自己的项目中去。

如果你想参与进来,你可以这样做:

  • 对DEPs标准做出贡献/提供反馈;
  • 参与编写Starfish代码;
  • 开始使用该技术构建PoCs。

如何少走弯路,利用不同区块链的数据结构实现项目上链?

数据架构是区块链的重要组成部分,了解数据架构,可以让我们对于自身业务是否适合上链做出明智的判断。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-09-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 区块链大本营 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
虎口夺食! 打破Facebook谷歌垄断, MIT大神和他的区块链数据库传奇! |人物志
Bruce Pon,坐标德国柏林。BigchainDB联合创始人、CEO,区块链早期创业者之一。
区块链大本营
2019/03/19
5980
虎口夺食! 打破Facebook谷歌垄断, MIT大神和他的区块链数据库传奇! |人物志
区块链技术与AI:IT领域的未来合作伙伴
在信息技术领域,区块链技术和人工智能(AI)都是备受瞩目的创新。它们各自有着独特的特点和应用领域,但在某些情况下,它们可以相互协作,共同推动IT领域的发展。本文将深入探讨区块链技术与AI的结合,讨论它们如何成为未来的合作伙伴,并为读者提供一些示例和应用案例。
IT_陈寒
2023/12/13
3850
区块链技术与AI:IT领域的未来合作伙伴
《捕鱼达人》幕后的开发引擎玩起区块链, 区块链游戏的春天已近?| 人物志
“现在的区块链游戏处于蛮荒时代,和十年前的手游市场类似……也就是说,今天整个区块链行业,还处于一个 GPRS 的时代。而在这个时代,却想要运行完善体验的游戏,会受到诸多的制约。”
区块链大本营
2019/04/28
1.2K0
《捕鱼达人》幕后的开发引擎玩起区块链, 区块链游戏的春天已近?| 人物志
区块链对人工智能的变革:去中心化将带来数据新范式
编译:机器之心   近年,从围棋到人类水平的语音识别,人工智能(AI)研究者终于在他们几十年一直努力探索的领域取得了突破。取得突破进展的关键一点是研究者们可以收集巨量的数据并“学习”这些数据,从而将错误率降低到可接受范围以内。   简而言之,大数据大为改观了人工智能的发展,将其推到一个几乎难以置信的高度。   区块链技术同样能够变革人工智能——当然以它自己的特定方式进行。部分将区块链用于人工智能方式目前还很单一,比如在人工智能模型上进行审计跟踪(audit trail)。有些应用几乎是难以置信的,比如
腾讯研究院
2018/01/31
1.2K0
区块链对人工智能的变革:去中心化将带来数据新范式
区块链的4个实际应用
到现在为止,你可能已经听过至少一个关于区块链的描述,而这个描述可能与金钱有关。区块链因其“分布式账本”技术受到了广泛关注,该技术是通过私人市场买卖加密货币(如比特币)和其他资产的基础。 但是区块链技术的应用超过了加密货币。将来,它可能成为许多日常b2b事务的一部分,包括那些由企业应用程序驱动的事务。 iStockphoto 考虑一下在企业应用程序中使用区块链的四种场景,以提供更灵活、更安全、更精简的业务流程——甚至启用新的业务模型。 1。赋能分布式的、独立的市场 。区块链允许资产所有者跟踪和交易价值(如
架构师研究会
2018/04/24
1.1K0
区块链的4个实际应用
《筑牢元宇宙根基:AI与区块链的安全信任密码》
在科技浪潮汹涌澎湃的当下,元宇宙已不再是科幻作品中的遥远构想,而是逐渐步入现实,成为人们热议与探索的前沿领域。从沉浸式的虚拟社交,到创新的数字经济模式,元宇宙的发展前景广阔,潜力无限。但要让元宇宙从概念真正落地,成为一个可持续、可信赖的虚拟世界,安全与信任是必须攻克的关键难题。而人工智能(AI)与区块链技术,正如同两把“金钥匙”,为元宇宙构建起坚实的安全与信任基础。
程序员阿伟
2025/02/22
1260
区块链加快进入AI生态,成为人工智能的五大基础设施
精彩回顾 2018 新智元产业跃迁 AI 技术峰会圆满结束,点击链接回顾大会盛况: 爱奇艺 http://www.iqiyi.com/l_19rr3aqz3z.html 腾讯新闻 http://v.qq.com/live/p/topic/49737/preview.html 新浪科技 http://video.sina.com.cn/l/p/1722511.html 云栖社区 https://yq.aliyun.com/webinar/play/419 斗鱼直播 https://www.do
新智元
2018/04/17
7680
区块链加快进入AI生态,成为人工智能的五大基础设施
区块链技术如何改变人工智能
区块链作为一项新兴技术,被人们认为有可能会打破各个行业的现有模式。区块链技术的分散系统与当今使用的固有集中式操作系统是对立的。通过采用分散式数据库体系结构的形式,某些操作的记录和身份验证取决于多个当事方的协议,而不是一个单一的权威机构。
liuxuewen
2018/09/19
9960
区块链技术如何改变人工智能
区块链+“中国制造”:一文看懂区块链如何提升供应链金融活力与效能!
在进入今天的话题之前,先给大家介绍一个专业性术语:LPI(全球供应链绩效指数)。
区块链大本营
2019/11/23
5K0
区块链+“中国制造”:一文看懂区块链如何提升供应链金融活力与效能!
中科院教授白硕:AI+区块链,两大神器如何助力商业新生态
在金庸先生的小说《倚天屠龙记》当中,谁也不曾想到倚天剑与屠龙刀这两把玄铁铸就的绝世神器在全力相撞后竟然会双双碎裂,并露出其中隐藏的武功秘籍,帮助故事主角铸就了新一代的武林神话。而在今天,AI和区块链成为了近几年备受社会关注的技术,他们的碰撞又会产生哪些火花?创造什么价值呢?
大数据文摘
2019/05/07
4340
中科院教授白硕:AI+区块链,两大神器如何助力商业新生态
惊喜! 44个“区块链+AI”应用场景分析, 你觉得还能更全吗?
作者讨论了包括金融、交通、医疗、物联网以及政务等在内的热门人工智能应用领域,并对区块链结合人工智能方面的专利数量进行了统计。
区块链大本营
2019/05/17
1.3K0
区块链之链上链下协同的实现与挑战
区块链技术具有数据不可篡改的特性,确保了数据的完整性和可靠性。这在金融、供应链等领域具有重要价值,可以降低欺诈风险和提高数据安全性。
天地一小儒
2023/05/06
9410
区块链之链上链下协同的实现与挑战
《解锁元宇宙构建:AI与云原生区块链的协同奥秘》
在科技飞速发展的今天,元宇宙已从最初的概念设想逐渐步入人们的视野,成为全球瞩目的焦点。元宇宙,这个融合了虚拟与现实、跨越时空界限的数字世界,正以其独特的魅力和无限的潜力,引领着新一轮的科技革命和产业变革。而在这场变革的背后,AI与云原生区块链技术宛如两颗璀璨的明星,交相辉映,为元宇宙的构建提供了不可或缺的关键支撑。
程序员阿伟
2025/03/19
910
《解锁元宇宙构建:AI与云原生区块链的协同奥秘》
深脑链:人工智能+区块链的未来物语
文︱须佐 人工智能、区块链,在过去一年中,犹如辽阔的北欧维京战场上,两大浴血奋战的英雄,给予科技世界进行强势的赋能,令过去、现在、和未来的世界,充满期待。可想而知,这种由人类智慧所创造出来的前沿技术,让创造者、受益者,均表露出溢于言表之惊喜,而在这种强大的科技活力之下,世界公民,已然行走在永远与未来的边缘。所到之处,尽是一片美丽的惊鸿,与一片点燃未来的涟漪。 当然,善于将科技技术进行魔方式的进行组合,相互交织与彼此渗透,所诞生出来的奇幻世界,就更为令人感动,与百感交集。 这就是科技进化的力量。 众所周知
企鹅号小编
2018/01/11
1K0
深脑链:人工智能+区块链的未来物语
趣谈区块链系列一:区块链的出现是必然还是偶然?
当高潮褪去,海滩上都会剩下大量死鱼,这便是不理智的弄潮儿的必然结局。当年的互联网泡沫如此,现今的区块链热亦如。对未来的把握须建立在廓清事实的基础上,对区块链这一事物急需冷静思考。 区块链的出现是必然还
用户1310347
2018/03/02
8840
趣谈区块链系列一:区块链的出现是必然还是偶然?
2020之5G、AI、区块链、IFM
当下,伴随着物联网、人工智能、5G等新概念大火的同时,随之而来的边缘计算强势崛起。那么问题来了,那究竟什么是边缘计算呢?从技术上来讲,边缘计算是一种分散式运算的架构,在这种架构下,将应用程序、数据资料与服务的运算,由网络中心节点,移至网络逻辑上的边缘节点来处理。通俗来讲,边缘计算将原本完全由中心节点处理的大型服务通过分解切割,化成更小更容易管理的部分,同时分散到边缘节点去处理。这样的话,缩小边缘节点用户终端装置的距离,从而可以加快资料的传送速度和处理速度,进而大大降低延迟。
2020
2020/04/23
8660
AI与区块链的融合会给人类带来什么?
图片来源:Zapp2Photo/Shutterstock 翻译 | CSDN研发技术 参与 | Vincent 译者注:本文介绍了人工智能和区块链这两大热门技术整合的可能性,以及这两者整合以后的标准定义是什么,会遇到哪些挑战,会带来什么好处。以下为译文。 不可否认,人工智能和区块链促进了创新,在不同行业里面也都引起了根本性的变化。这两种技术的技术复杂程度不一样,商业意义也不一样,但是如果能将两者整合在一起,那么整个技术(和人类)范式可能将会重新定义。 ▌I.揭开序幕 图片来源:4zevar/Sh
Spark学习技巧
2018/04/17
6910
AI与区块链的融合会给人类带来什么?
区块链到底能做什么?还问这个问题你就out了
在近期区块链大本营(blockchain_camp)举办的以“区块链技术与行业应用落地”为主题的CSDN区块链技术沙龙上,云象区块链创始人黄步添博士分享当前区块链技术及应用趋势。
区块链大本营
2018/09/21
6570
区块链到底能做什么?还问这个问题你就out了
区块链分享医疗数据:AI学者提出新型匿名数据收集方式
编译 机器之心 本文转自机器之心,转载需授权 除比特币之外,区块链匿名与安全的特性还可以帮助医疗领域的研究者们收集用于训练 AI 算法的数据,其方法不会透露数据提供者的隐私信息。Nature 近日
CDA数据分析师
2018/03/26
8110
区块链分享医疗数据:AI学者提出新型匿名数据收集方式
朱江:区块链游戏绝不是撸猫那么简单。
导语: 在撸猫游戏的带动下,区块链游戏火了。不过,在朱江看来,这只是区块链游戏的1.0阶段,挂在公链上,简单,偏休闲,主要是币圈的人在玩。到了2.0阶段,更多的游戏厂商和游戏玩家就开始入场了。而在3.
区块链大本营
2018/05/10
8960
推荐阅读
相关推荐
虎口夺食! 打破Facebook谷歌垄断, MIT大神和他的区块链数据库传奇! |人物志
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档