首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >无代码平台助力科学家进行复杂数据分析

无代码平台助力科学家进行复杂数据分析

原创
作者头像
用户11764306
发布2026-01-23 17:36:22
发布2026-01-23 17:36:22
1070
举报

随着近年来诊断和测序技术的成本急剧下降,研究人员收集了关于疾病和生物学的空前大量的数据。不幸的是,希望从数据走向新疗法的科学家通常需要具备软件工程经验人员的帮助。

如今,Watershed Bio 正在帮助科学家和生物信息学家运行实验并获得见解。该平台允许用户分析复杂的数据集,无论其计算技能如何。这个基于云的平台提供工作流模板和可自定义的界面,帮助用户探索和共享各种类型的数据,包括全基因组测序、转录组学、蛋白质组学、代谢组学、高内涵成像、蛋白质折叠等。

“科学家们希望了解该领域的软件和数据科学部分,但他们不想为了理解自己的数据而成为编写代码的软件工程师,”联合创始人兼首席执行官 Jonathan Wang '13, SM '15 说。“有了 Watershed,他们就不必了。”

Watershed 正被工业界和学术界的各种规模的研究团队使用,以推动发现和决策。当科学期刊描述新的先进分析技术时,可以立即将其作为模板添加到 Watershed 的平台中,使前沿工具对所有背景的研究人员来说都更容易获取和协作。

“生物学数据呈指数级增长,而生成这些数据的测序技术只会变得更好、更便宜,” Wang 说。“来自某机构,这个问题正好是我的专长:这是一个棘手的技术问题。这也是一个有意义的问题,因为这些人正在努力治疗疾病。他们知道所有这些数据都有价值,但他们难以使用它。我们希望帮助他们更快地解锁更多见解。”

无代码发现

Wang 原本预计在某个机构主修生物学,但他很快就对用计算机科学构建可扩展至数百万人的解决方案的可能性感到兴奋。他最终获得了电气工程与计算机科学系的学士和硕士学位。Wang 还在某个机构的生物学实验室实习过,他对那里实验的缓慢和劳动密集程度感到惊讶。

“我看到了生物学和计算机科学之间的差异,在计算机科学中,你拥有这些动态环境,可以让你立即获得反馈,” Wang 说。“即使是一个人编写代码,你也有大量的东西可以随时使用。”

在某个机构从事机器学习和高性能计算的同时,Wang 还与一些同学共同创立了一家高频交易公司。他的团队聘请了拥有数学和物理等领域博士学位背景的研究人员来开发新的交易策略,但他们很快发现了流程中的瓶颈。

“事情进展缓慢,因为研究人员习惯于构建原型,” Wang 说。“这些是他们可以在本地机器上运行的小规模模型近似。为了将这些方法投入生产,他们需要工程师使其在计算集群上以高吞吐量的方式工作。但工程师并不理解研究的本质,因此需要大量来回沟通。这意味着你认为一天就能实现的想法需要数周时间。”

为了解决这个问题,Wang 的团队开发了一个软件层,使构建生产就绪模型变得像在笔记本电脑上构建原型一样简单。后来,在从某个机构毕业几年后,Wang 注意到像 DNA 测序这样的技术已经变得廉价且无处不在。

“瓶颈不再是测序了,所以人们说,‘让我们对所有东西进行测序,’” Wang 回忆道。“限制因素变成了计算。人们不知道该如何处理生成的所有数据。生物学家正在等待数据科学家和生物信息学家帮助他们,但这些人并不总是足够深入地理解生物学。”

这种情况对 Wang 来说似曾相识。

“这就像我们在金融领域看到的情况一样,研究人员试图与工程师合作,但工程师从未完全理解,结果人们都在等待工程师,效率非常低下,” Wang 说。“与此同时,我了解到生物学家渴望运行这些实验,但存在如此大的差距,以至于他们觉得要么必须成为软件工程师,要么只专注于科学。”

Wang 于 2019 年正式与医生 Mark Kalinich '13 共同创立了 Watershed,后者是他在某个机构的前同学,现已不再参与公司的日常运营。

此后,Wang 从生物技术和制药公司的高管那里听到了关于生物学研究复杂性日益增加的信息。解锁新见解越来越涉及分析来自整个基因组、群体研究、RNA 测序、质谱分析等的数据。开发个性化治疗或为临床研究选择患者群体也可能需要庞大的数据集,而且科学期刊一直在发布分析数据的新方法。

如今,公司可以在 Watershed 上运行大规模分析,而无需设置自己的服务器或云计算账户。研究人员可以使用预制模板,这些模板适用于所有最常见的数据类型,以加速他们的工作。像 AlphaFold 和 Geneformer 这样流行的人工智能工具也可用,而且 Watershed 的平台使得共享工作流程和深入研究结果变得容易。

“该平台在易用性和可定制性方面达到了一个平衡点,适合所有背景的人,” Wang 说。“没有哪项科学是真正完全相同的。我避免使用‘产品’这个词,因为它意味着你部署了某个东西,然后就可以永远大规模地运行它。研究不是这样的。研究是关于提出一个想法,测试它,然后利用结果提出另一个想法。你设计、实施和执行实验的速度越快,你就能越快地进入下一个实验。”

加速生物学

Wang 相信 Watershed 正在帮助生物学家跟上生物学的最新进展,并在此过程中加速科学发现。

“如果你能帮助科学家解锁见解不是快一点,而是快 10 或 20 倍,那真的可以带来改变,” Wang 说。

Watershed 正被学术界和各种规模公司的研究人员使用。生物技术和制药公司的高管也使用 Watershed 来就新实验和候选药物做出决策。

“我们在所有这些领域都取得了成功,共同点是人们理解研究,但不是计算机科学或软件工程方面的专家,” Wang 说。“看到这个行业发展令人兴奋。对我来说,从某个机构毕业,现在回到 Watershed 所在的 Kendall Square 地区,这很棒。这里正是许多前沿进展发生的地方。我们正努力尽自己的一份力,赋能生物学的未来。”

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档