首页
学习
活动
专区
圈层
工具
发布

好用免费!Label studio 助你构建大模型训练数据集一臂之力

在人工智能领域,数据标注是让机器理解人类世界的关键,它将语音、图片等未经处理的数据加工成机器可识别信息,是多数人工智能算法有效运行的重要环节。

当前主流的有监督深度学习方式高度依赖标注数据,原始的非结构化数据需标注成结构化数据才能被算法模型训练使用。

数据标注类型多样,常见的有以下几种:

(常见数据标注类型)

在数据标注之前需要找到一款好用的工具,今天带你了解数据标注神器——label studio,不仅功能丰富,关键还免费。

label studio 能做什么

Label Studio 是一款由 Human Signal(原 Heartex)推出的开源数据标注工具,在机器学习和数据科学领域应用广泛,可用于构建高质量训练数据,供 AI 模型训练。其具备的特点有:

(Label Studio功能特性)

是不是感觉不错?接下来看看怎么使用。

如何使用Label Studio

Label Studio 首先需要安装,安装方式如下:

| 安装与启动

Label Studio 提供多种安装方式,可根据实际需求选择。如果选择本地安装方法很简单,只需两行终端命令即可:

pip install label-studio # 使用pip安装label-studio start # 启动服务,访问 http://localhost:8080

接下来以图像标注的场景为例,介绍Label Studio的使用方法。

| 以图像标注为例的使用流程

(图像标注使用流程示意图)

创建新项目:首次登录 Label Studio 后,可在界面中看到 “Create Project” 按钮,点击按钮,在弹出的窗口中,输入项目名称,如 “图像标注示例”,还可添加项目描述,方便后续了解项目内容和目的。

(Label Studio登录)

(创建标注项目入口)

导入数据:点击界面上方的 “Data Import”按钮, 进入数据导入界面。

可支持从本地文件上传图片,点击 “Upload Files”,选中需要标注的图片文件。也支持从 URL、云存储等方式导入数据。

(导入标注数据)

设置标注模板:点击 “Labeling Setup” 设置标注模板。Label Studio 提供多种预置模板,由于这个例子是图像标注,所以在计算机视觉中寻找模板。如目标检测可选择 “Object Detection with Bounding Boxes” 模板,语义分割选择 “Semantic Segmentation” 模板。

(设置标注模板)

若预置模板不符合需求,还可通过 “Code” 方式自定义模板(Custom template)。比如对于简单的图像分类标注,可编写如下自定义模板参考示例:

<Image name="image" value="$image"/><Choices name="class" toName="image">   <Choice value="猫"/>   <Choice value="狗"/>   <Choice value="其他"/></Choices>

上述代码示例中,<Image>标签用于显示图片,name为变量名,value="$image"绑定数据字段;<Choices>标签定义分类选项,toName = "image"关联到图片区域。

模板设置好以后,点击界面上方的“Save”按钮。

进行数据标注:上述设置完成,点击 “Label All Tasks” 开始标注。标注界面左侧显示待标注图像,右侧显示标注工具和已标注信息,中间是标注工作区域。

以目标检测标注为例,点击标注工具栏的矩形框工具,在图像中框选目标物体,然后选择对应的类别标签。

(目标检测标注示例)

导出标注结果:全部标注完成后,点击右上角的 “Export” 导出标注数据。Label Studio 支持多种导出格式,如 JSON、CSV、COCO 等。

若后续用于深度学习模型训练,选择 COCO 格式,其包含边界框和类别信息,方便模型读取和使用。

(导出标注数据)

以上通过一个场景介绍了数据标注神器 label studio的使用方法,如果对该工具感兴趣,了解更多丰富的用法请见:

文档:https://labelstud.io/guide/

官网:https://labelstud.io/

以上就是全文内容

小伙伴有什么想说的,欢迎评论区见

1

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OnrK3VBqdZWT0SKskDxYpSNA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券