tfds.split.train.subsplit - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

使用Python实现深度学习模型：图像语义分割与对象检测

Text classification with TensorFlow Hub: Movie reviews

This notebook classifies movie reviews as positive or negative using the text of the review. This is an example of binary—or two-class—classification, an important and widely applicable kind of machine learning problem.

一次GAN项目背景下的tensorflow_datasets的mnist数据集的下载笔记

https://blog.csdn.net/ccbrid/article/details/103491467

使用 MNIST 集入门 Tensoflow(1)

在入门之前，我们需要开发工具，本文使用 JupyterLab，可以用 conda 或者 pip 方式安装。

掌声送给TensorFlow 2.0！用Keras搭建一个CNN | 入门教程

2019 年 3 月 6 日，谷歌在 TensorFlow 开发者年度峰会上发布了最新版的 TensorFlow 框架 TensorFlow2.0 。新版本对 TensorFlow 的使用方式进行了重大改进，使其更加灵活和更具人性化。具体的改变和新增内容可以从 TensorFlow 的官网找到，本文将介绍如何使用 TensorFlow2.0 构建和部署端到端的图像分类器，以及新版本中的新增内容，包括：

使用Python实现深度学习模型：Transformer模型

Transformer模型自提出以来，已经成为深度学习领域，尤其是自然语言处理（NLP）中的一种革命性模型。与传统的循环神经网络（RNN）和长短期记忆网络（LSTM）不同，Transformer完全依赖于注意力机制来捕捉序列中的依赖关系。这使得它能够更高效地处理长序列数据。在本文中，我们将详细介绍Transformer模型的基本原理，并使用Python和TensorFlow/Keras实现一个简单的Transformer模型。

Building deep retrieval models

In the featurization tutorial we incorporated multiple features into our models, but the models consist of only an embedding layer. We can add more dense layers to our models to increase their expressive power. In general, deeper models are capable of learning more complex patterns than shallower models. For example, our user model incorporates user ids and timestamps to model user preferences at a point in time. A shallow model (say, a single embedding layer) may only be able to learn the simplest relationships between those features and movies: a given movie is most popular around the time of its release, and a given user generally prefers horror movies to comedies. To capture more complex relationships, such as user preferences evolving over time, we may need a deeper model with multiple stacked dense layers.

Load and preprocess images

This tutorial shows how to load and preprocess an image dataset in three ways. First, you will use high-level Keras preprocessing utilities and layers to read a directory of images on disk. Next, you will write your own input pipeline from scratch using tf.data. Finally, you will download a dataset from the large catalog available in TensorFlow Datasets.

Recommending movies: retrieval

Real-world recommender systems are often composed of two stages:

text classification with RNN

本次用到的数据集是 IMDB，一共有 50000 条电影评论，其中 25000 条是训练集，另外 25000 条是测试集

TensorBoard的最全使用教程：看这篇就够了

机器学习通常涉及在训练期间可视化和度量模型的性能。有许多工具可用于此任务。在本文中，我们将重点介绍 TensorFlow 的开源工具套件，称为 TensorBoard，虽然他是TensorFlow 的一部分，但是可以独立安装，并且服务于Pytorch等其他的框架。

TensorFlow2.0 教程（2）

强烈安利 Google的Colab，即使你没有一台很好的电脑，也能在这个平台上学习TensorFlow

TensorFlow 2.0 - CNN / 预训练 / RNN

文章目录 1. CNN 卷积神经网络 2. 预训练模型 3. RNN 循环神经网络学习于：简单粗暴 TensorFlow 2 1. CNN 卷积神经网络卷积神经网络，卷积后尺寸计算 tf.keras.layers.Conv2D， tf.keras.layers.MaxPool2D # CNN 模型 class myCNN(tf.keras.Model): def __init__(self): super().__init__() self.conv1 = tf

TensorFlow从1到2（五）图片内容识别和自然语言语义识别

上一节我们讲过了完整的保存模型及其训练完成的参数。 Keras中使用这种方式，预置了多个著名的成熟神经网络模型。当然，这实际是Keras的功劳，并不适合算在TensorFlow 2.0头上。当前TensorFlow 2.0-alpha版本捆绑的Keras中包含：

【完结】TensorFlow2.0 快速上手手册

import tensorflow as tf a = tf.constant([1,2,3]) b = tf.constant([4,5,6]) print(a+b)

《机器学习实战：基于Scikit-Learn、Keras和TensorFlow》第13章使用TensorFlow加载和预处理数据

Data API还可以从现成的文件（比如CSV文件）、固定大小的二进制文件、使用TensorFlow的TFRecord格式的文件（支持大小可变的记录）读取数据。TFRecord是一个灵活高效的二进制格式，基于Protocol Buffers（一个开源二进制格式）。Data API还支持从SQL数据库读取数据。另外，许多开源插件也可以用来从各种数据源读取数据，包括谷歌的BigQuery。

官方资源帖！手把手教你在TensorFlow 2.0中实现CycleGAN，推特上百赞

CycleGAN，一个可以将一张图像的特征迁移到另一张图像的酷算法，此前可以完成马变斑马、冬天变夏天、苹果变桔子等一颗赛艇的效果。

官方资源帖！手把手教你在TensorFlow 2.0中实现CycleGAN，推特上百赞

CycleGAN，一个可以将一张图像的特征迁移到另一张图像的酷算法，此前可以完成马变斑马、冬天变夏天、苹果变桔子等一颗赛艇的效果。

谷歌发布 RLDS，在强化学习生成、共享和使用数据集

大多数强化学习和序列决策算法都需要智能体与环境的大量交互生成训练数据，以获得最佳性能。这种方法效率很低，尤其是在很难做到这种交互的情况下，比如用真实的机器人来收集数据，或者和人类专家进行交互。要缓解这个问题，可以重用外部的知识源，比如 RL Unplugged Atari 数据集，其中包括玩 Atari 游戏的合成智能体的数据。

Tensorflow Lite Model Maker --- 图像分类篇+源码

The TensorFlow Lite Model Maker library simplifies the process of adapting and converting a TensorFlow neural-network model to particular input data when deploying this model for on-device ML applications. 解读: 此处我们想要得到的是 .tflite 格式的模型，用于在移动端或者嵌入式设备上进行部署

Using side features: feature preprocessing

One of the great advantages of using a deep learning framework to build recommender models is the freedom to build rich, flexible feature representations.

TensorFlow (2) CIFAR-10 简单图像识别

本文主要学习获取 CIFAR-10 数据集，通过简单的模型对数据集进行训练和识别。

在TensorFlow 2中实现完全卷积网络（FCN）

卷积神经网络（CNN）非常适合计算机视觉任务。使用对大型图像集（如ImageNet，COCO等）进行训练的预训练模型，可以快速使这些体系结构专业化，以适合独特数据集。此过程称为迁移学习。但是有一个陷阱！用于图像分类和对象检测任务的预训练模型通常在固定的输入图像尺寸上训练。这些通常从224x224x3到某个范围变化，512x512x3并且大多数具有1的长宽比，即图像的宽度和高度相等。如果它们不相等，则将图像调整为相等的高度和宽度。

《机器学习实战：基于Scikit-Learn、Keras和TensorFlow》第14章使用卷积神经网络实现深度计算机视觉

卷积神经网络（CNN）起源于人们对大脑视神经的研究，自从1980年代，CNN就被用于图像识别了。最近几年，得益于算力提高、训练数据大增，以及第11章中介绍过的训练深度网络的技巧，CNN在一些非常复杂的视觉任务上取得了超出人类表现的进步。CNN支撑了图片搜索、无人驾驶汽车、自动视频分类，等等。另外，CNN也不再限于视觉，比如：语音识别和自然语言处理，但这一章只介绍视觉应用。

使用 scikit-learn 的 train_test_split() 拆分数据集

监督机器学习的关键方面之一是模型评估和验证。当您评估模型的预测性能时，过程必须保持公正。使用train_test_split()数据科学库scikit-learn，您可以将数据集拆分为子集，从而最大限度地减少评估和验证过程中出现偏差的可能性。

【Python常用函数】一文让你彻底掌握Python中的scorecardpy.split_df函数

在scorecardpy库中，split_df函数用于将数据集（通常是包含特征和目标变量的DataFrame）分割成训练集和测试集。

Machine Learning Notes-Decision Trees-Udacity

什么是 Decision Tree？ Decision Tree 可以把 Input 映射到离散的 Labels。对每个节点上的 Attribute 提问，取不同的 Value 走向不同的 Chi

特征提取之 DictVectorizer

特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息，决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集，这些子集往往属于孤立的点、连续的曲线或者连续的区域。用 Python 进行特征提取的方法有很多，这里我使用 sklearn.feature_extraction.DictVectorizer 这个类来进行特征提取，毕竟新版本的 scikit-learn 在使用这个类的时候会遇到一些问题，在讲怎么用它进行特征提取的同时顺便把这些问题解决了。

还在纠结垃圾分类问题？带你用Python感受ImageNet冠军模型SENet的强大

本月1日起，上海正式开始了“史上最严“垃圾分类的规定，扔错垃圾最高可罚200元。全国其它46个城市也要陆续步入垃圾分类新时代。各种被垃圾分类逼疯的段子在社交媒体上层出不穷。

交叉验证

概述Holdout 交叉验证K-Fold 交叉验证Leave-P-Out 交叉验证总结

[012] 不同数据集划分与验证方法的实现与比较

Model evaluation is a set of procedures allowing you to pick the best possible stable model. It is an essential part of the model development process. It reveals the model’s behavior and its predictive power — indicates the balance between bias and variance on unseen data. As a starting point, split the given dataset into a train and test set. The model will learn to predict using the train set; in comparison, we will utilize the test set to assess the model’s performance.

Python深耕之minGPT的使用

GPT（Generative Pre-Training）是OpenAI在2018年发表的一篇论文《Improving Language Understanding by Generative Pre-Training》中提出的框架，本框架通过两个阶段进行任务的实现：第一个阶段是利用语言模型进行预训练（无监督形式），第二阶段通过 Fine-tuning 的模式解决下游任务（监督模式下）。第一个阶段中其实和 Embeddings from Language Models（ELMO）模型是类似的，区别在于GPT用的特征提取器是Transformer，ELMO用的是RNN;；ELMO使用上下文对单词进行预测，而 GPT 则只采用 Context-before 这个单词的上文来进行预测。第二阶段的下游任务在文献原文中进行了描述如下图：

sklearn linear regression_auto sklearn

K折交叉验证：sklearn.model_selection.KFold(n_splits=3, shuffle=False, random_state=None)

GBDT实战

The accuracy of prediction is: 0.9666666666666667 Feature importances: [0.002148238569679191, 0.0046703830672789074, 0.33366676380518245, 0.6595146145578594]

【Python】已解决：ModuleNotFoundError: No module named ‘sklearn.cross_validation

在机器学习的实践中，数据分割是一个重要步骤，它通常用于将数据集分为训练集和测试集，以便评估模型的性能。然而，有时在尝试导入sklearn.cross_validation模块进行数据分割时，会遇到“ModuleNotFoundError: No module named ‘sklearn.cross_validation’”的错误。这个错误通常发生在尝试使用旧版本的scikit-learn API时。

requests库进行爬虫ip请求时遇到的错误解决方法

在使用requests库进行HTTP请求时，用户遇到了一个AuthenticationRequired（身份验证必须）的错误。然而，当使用urllib.request.urlopen执行相同的操作时，却能够成功。同时，用户提供了自己的系统信息，包括Python版本、操作系统等。

机器学习算法之回归树

假设我们现在要预测某个连续变量的大小，那么最常见的方法就是用平均值来。假设现在我们要预测班级中某个学生的成绩，而班级中除了我们要预测的学生以外其他学生的平均成绩为 60 分，那么我们用 60 分来预测这个学生肯定是比 0 或者 100 显得合理一点。下面来尝试证明一下：

机器学习笔记——数据集分割

在模型训练之前，要首先划分训练集与测试集，如何对原始数据集进行训练集与测试集的划分？训练集与测试集的比例各占多少？如何保证各自内部标签分布平衡都会影响模型训练的最终效果。

我发现了用 Python 编写简洁代码的秘诀！

作为数据科学家，我们常常使用 Jupyter Notebooks 进行数据探索和模型开发。在这个阶段，我们关注的重点是快速验证想法和证明概念。然而，一旦模型准备就绪，就需要将其部署到生产环境中，这时代码质量就显得尤为重要。

【目标检测】小脚本：数据集划分

之前写了一篇【目标检测】YOLOv5跑通VOC2007数据集里面写了个脚本是将xml标注格式转换称Yolo格式，同时读取数据集划分。在训练自己的数据时，我发现没有现成的数据集划分文件，于是就写了这个小脚本来读取文件名，并划分成train/val/test三个文件。

数据集的分割

查看y的时候发现，发现lable是按照从小到大进行排序的，所以取训练集不能直接取前n个为训练集，后n个为测试集，这样得到的模型肯定是不准确的。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐