TensorFlow提供提供了42个图像处理相关的函数,主要涉及解码编码,简单的图像几何变换等等。比较有特点的一个方面是有很多随机性的操作,主要增加模型的泛化能力。
原地址:Module: tf.image
定义在:tensorflow/python/ops/image_ops.py
图像处理和解码操作。
查看TensorFlow Images指南。
类:
class ResizeMethod
功能:
adjust_brightness(...)
: 调整RGB图像或灰度图的亮度。
adjust_contrast(...)
: 调整RGB图像或灰度图的对比度。
adjust_gamma(...)
: 在输入图像上执行伽玛校正。
adjust_hue(...)
: 调整RGB图像的色调。
adjust_saturation(...)
: 调整RGB图像的饱和度。
central_crop(...)
: 从图像的中央区域裁剪图像。
convert_image_dtype(...)
: 将图像转换为dtype,如果需要,缩放其值。
crop_and_resize(...)
: 对输入图像做剪裁并通过插值方法调整尺寸。
crop_to_bounding_box(...)
: 指定边界的裁剪图像。
decode_gif(...)
: 将GIF编码图像的第一帧解码为 uint8 tensor。
decode_image(...)
: 图像解码操作,包含了 decode_gif, decode_jpeg,和 decode_png。
decode_jpeg(...)
: 将jpeg编码图像解码为 uint8 tensor。
decode_png(...)
: 将png编码图像解码为 uint16 tensor。
draw_bounding_boxes(...)
: 在一个batch的图像上绘制边框。
encode_jpeg(...)
: JPEG图像编码。
encode_png(...)
: PNG图像编码。
extract_glimpse(...)
: 从指定的位置提取指定尺寸的区域,如果超过了原图像的尺寸,将随机填充。
flip_left_right(...)
: 水平翻转图像 。
flip_up_down(...)
: 上下翻转图像。
grayscale_to_rgb(...)
: 单个或多个图像灰度转RGB。
hsv_to_rgb(...)
: 单个或多个图像HSV转RGB。
non_max_suppression(...)
: 根据分数降序选择边界框,分数是一个输入,函数别没有计算分数的规则,其实只是提供了一种降序选择操作。
pad_to_bounding_box(...)
: 补零,将图像填充到指定的宽高。
per_image_standardization(...)
: 图像标准化(不是归一化)。
random_brightness(...)
: 通过随机因子调整图像的亮度。
random_contrast(...)
: 通过随机因子调整图像的对比度。
random_flip_left_right(...)
: 随机水平翻转图像。
random_flip_up_down(...)
: 随机上下翻转图像。
random_hue(...)
: 通过随机因子调整RGB图像的色调。
random_saturation(...)
:通过随机因子调整RGB图像的饱和度。
resize_area(...)
: 应用区域插值调整图像尺寸。
resize_bicubic(...)
: 应用双三次插值调整图像尺寸。
resize_bilinear(...)
: 应用双线性内插值调整图像尺寸。
resize_nearest_neighbor(...)
: 应用最邻近插值调整图像尺寸。
resize_images(...)
: 使用指定的方法调整图像尺寸(其实包含的是上面四种插值方法)。
resize_image_with_crop_or_pad(...)
: 根据目标图像的宽高(自动)裁剪或填充图像。
rgb_to_grayscale(...)
: 单个或多个图像RGB转灰度图。
rgb_to_hsv(...)
: 单个或多个图像RGB转HSV。
rot90(...)
: 将图像逆时针旋转90度。
sample_distorted_bounding_box(...)
: 为图像生成单个随机变形的边界框。
total_variation(...)
: 计算一个图像或多个图像的总体变动(输入图像中相邻像素值的绝对差异)
transpose_image(...)
: 交换图像的第一维和第二维(输入要求是3D,没有batch,也就是宽和高的变换)