求公式:与目标值(上年同期值)对比:与目标值比较提升0. 5PP,得权重20分

PP-YOLO评估指标比现有最先进的对象检测模型YOLOv4表现出更好的性能。然而,百度的作者写道:

本文不打算介绍一种新型的目标检测器。它更像是一个食谱,告诉你如何逐步建立一个更好的探测器。

YOLO最初是由Joseph Redmon编写的,用于检测目标。目标检测是一种计算机视觉技术,它通过在目标周围画一个边界框来定位和标记对象,并确定一个给定的框所属的类标签。和大型NLP transformers不同,YOLO设计得很小,可为设备上的部署提供实时推理速度。

YOLO-9000是Joseph Redmon出版的第二个“YOLOv2”目标探测器,它改进了探测器,并强调了该检测器能够推广到世界上任何物体的能力。

YOLOv3对检测网络做了进一步的改进,并开始将目标检测过程纳入主流。我们开始发布关于如何在PyTorch中训练YOLOv3、如何在Keras中训练YOLOv3的教程,并将YOLOv3的性能与EfficientDet(另一种最先进的检测器)进行比较。

然后约瑟夫·雷德曼出于伦理考虑退出了目标探测游戏。

当然,开源社区接过了指挥棒,继续推动YOLO技术的发展。

YOLOv4最近由Alexey AB在他的YOLO Darknet存储库中发表。YOLOv4主要是其他已知的计算机视觉技术的集合,通过研究过程进行了组合和验证。请看这里深入了解YOLOv4。

YOLOv4论文的读数与PP-YOLO论文相似,如下所示。我们提供了一些关于如何在Darknet中训练YOLOv4的很好的训练教程。

然后,就在几个月前,YOLOv5被发布了。YOLOv5采用了Darknet(基于C)的训练环境,并将网络转换为Pytorch。改进的训练技术进一步提高了模型的性能,并创建了一个非常好用的开箱即用的对象检测模型。从那以后,我们一直鼓励使用Roboflow的开发人员通过这个YOLOv5训练教程将他们的注意力转向YOLOv5,以形成他们的自定义对象检测器。

PP是百度编写的深度学习框架PaddlePaddle的缩写。

如果你不熟悉Paddle,那我们就在同一条船上了。paddle最初是用Python编写的,它看起来类似于PyTorch和TensorFlow。深入研究paddle框架很有趣,但超出了本文的范围。

PP-YOLO的论文读起来很像YOLOv4论文,因为它是计算机视觉中已知的技术的汇总。新颖的贡献是证明这些技术的集成可提高性能,并提供消融研究,以研究每一步对模型的帮助程度。

在我们深入研究PP-YOLO的贡献之前,先回顾一下YOLO检测器的体系结构。

YOLO检测器分为三个主要部分。

YOLO Backbone:YOLO Backbone(骨干)是一个卷积神经网络,它将图像像素合并在一起以形成不同粒度的特征。骨干通常在分类数据集(通常为ImageNet)上进行预训练。

YOLO Neck:YOLO Neck(上面选择了FPN)在传递到预测头之前对ConvNet图层表示进行组合和混合。

YOLO Head:这是网络中进行边界框和类预测的部分。它由关于类,框和对象的三个YOLO损失函数指导。

现在,让我们深入了解PP YOLO做出的贡献。

第一种PP YOLO技术是用Resnet50-vd-dcn ConvNet骨干替换YOLOv3 Darknet53骨干。Resnet是一个更流行的骨干,它的执行优化了更多的框架,并且其参数少于Darknet53。通过交换此骨干可以看到mAP的改进,这对PP YOLO来说是一个巨大的胜利。

PP-YOLO跟踪网络参数的指数移动平均,以保持模型权重的阴影预测时间。这已经被证明可以提高推理的准确性。

PP-YOLO将批量大小从64增加到192。当然,如果有GPU内存限制,这很难实现。

PP-YOLO在FPN颈部实现DropBlock正则化(在过去,这通常发生在骨干)。在网络的给定步骤中,DropBlock会随机删除一部分训练特征,以指示模型不依赖于关键特征进行检测。

YOLO损失函数不能很好地转换为mAP指标,该指标在计算中大量使用了Union上的Intersection。因此,在考虑到最终预测的情况下编辑训练损失函数是很有用的。这个编辑也出现在YOLOv4中。

PP-YOLO网络添加了一个预测分支,以预测给定对象的模型估计的IOU。在决定是否预测对象时包含此IoU Aware可提高性能。

旧的YOLO模型不能很好地在锚框区域的边界附近进行预测。为了避免这个问题,可以稍微不同地定义框坐标。YOLOv4中也有这种技术。

非最大抑制是一种删除候选对象的提议以进行分类的技术。矩阵非最大抑制是一种并行排序这些候选预测的技术,它加快了计算速度。

CoordConv受ConvNets一个问题的激励,即ConvNets仅将(x,y)坐标映射到一个热像素空间。CoordConv解决方案使卷积网络可以访问其自己的输入坐标。CoordConv干预措施上方标有黄色菱形。有关更多详细信息,请参见CordConv文件。

空间金字塔池化是骨干层之后的一个额外块,用于混合和合并空间特征。还在YOLOv4和YOLOv5中实现。

PP YOLO的作者提炼出更大的ResNet模型作为骨干。更好的预训练模型显示也可以改善下游转移学习。

公平地说,作者指出这可能是一个错误的问题。作者的意图似乎不只是“引入一种新颖的新型检测器”,而是表明仔细调整对象检测器以最大化性能的过程。在此处引用本文的介绍:

本文的重点是如何堆叠一些几乎不影响效率的有效技巧以获得更好的性能……本文无意介绍一种新颖的目标检测器。它更像一个食谱,它告诉你如何逐步构建更好的检测器。我们发现了一些对YOLOv3检测器有效的技巧,可以节省开发人员的反复试验时间。最终的PP-YOLO模型以比YOLOv4更快的速度将COCO的mAP从43.5%提高到45.2%

在以YOLOv5为基准对PP-YOLO进行基准测试时,YOLOv5似乎仍在V100上具有最快的推理精度(AP与FPS)。但是,YOLOv5论文仍然有待发布。此外,研究表明,在YOLOv5 Ultralytics存储库上训练YOLOv4体系结构的性能要优于YOLOv5,并且,以可移植的方式,使用YOLOv5贡献进行训练的YOLOv4的性能将胜过此处发布的PP-YOLO结果。这些结果仍有待正式发布,但可以追溯到GitHub上的讨论。

值得注意的是,在YOLOv4中使用的许多技术(如架构搜索和数据扩充)并没有在ppyolo中使用。这意味着,随着更多这些技术的结合和集成,目标检测的最新技术仍有发展的空间。

毋庸置疑,这是实施计算机视觉技术的激动人心的时刻。

PP-YOLO模型显示了最先进的目标检测的前景,但与其他对象检测器相比,改进是渐进的,它是在一个新的框架中编写的。在这个阶段,最好的做法是通过在自己的数据集上训练PP-YOLO来发展自己的经验结果。

同时,我建议你查看以下YOLO教程,让你的对象探测器成为现实:

欢迎关注磐创AI博客站:

sklearn机器学习中文官方文档:

欢迎关注磐创博客资源汇总站:

nms之类的特殊算子,以使其能轻松地部署在多种多样的硬件上。

    深度学习 图像二值化 内容精选 换一换

  • API获取图像搜索结果,帮助用户在图像库中进行相同或相似图像搜索。 产品优势 搜索精高 基于深度学习算法和图像识别技术,搜索精高。 海量图像搜索 大规模搜索引擎支持亿级别图像搜索,秒级响应。 可定制 提供定制的场景搜索服务,使得搜索结果更准确。 简单高效 标准接口封装,

  • 超分图像重建 功能介绍 图像在成像过程中存在像素过少导致的视觉信息不够或者由于压缩导致的图像信息丢失的情况。针对此类场景,超分图像重建基于深度学习算法,对图像中缺失的视觉信息进行补充,使得图像视觉效果更好。使用时用户发送待处理片,返回经过超分图像重建后的结果片。

  • 深度学习 图像二值化 相关内容

  • 深度学习模型预测 深度学习已经广泛应用于图像分类、图像识别和语音识别等不同领域,DLI服务中提供了若干函数实现加载深度学习模型并进行预测的能力。

  • 深度学习模型预测 深度学习已经广泛应用于图像分类、图像识别和语音识别等不同领域,DLI服务中提供了若干函数实现加载深度学习模型并进行预测的能力。

  • 深度学习 图像二值化 更多内容

  • Pre-Processor)算子库:提供高性能的视频编解码、片编解码、图像裁剪缩放等预处理能力。 AIPP(AI Pre-Processing)算子库:主要实现改变图像尺寸、色域转换(转换图像格式)、减均/乘系数(图像归一),并与模型推理过程融合,以满足推理输入要求。 HCCL(Huawei

  • Pre-Processor)算子库:提供高性能的视频编解码、片编解码、图像裁剪缩放等预处理能力。 AIPP(AI Pre-Processing)算子库:主要实现改变图像尺寸、色域转换(转换图像格式)、减均/乘系数(图像归一),并与模型推理过程融合,以满足推理输入要求。 HCCL(Huawei

  • Pre-Processor)算子库:提供高性能的视频编解码、片编解码、图像裁剪缩放等预处理能力。 AIPP(AI Pre-Processing)算子库:主要实现改变图像尺寸、色域转换(转换图像格式)、减均/乘系数(图像归一),并与模型推理过程融合,以满足推理输入要求。 HCCL(Huawei

  • Pre-Processing)算子库:提供高性能的视频编解码、片编解码、图像裁剪缩放等预处理能力。 AIPP(AI Pre-Processing)算子库:主要实现改变图像尺寸、色域转换(转换图像格式)、减均/乘系数(图像归一),并与模型推理过程融合,以满足推理输入要求。 HCCL(Huawei

  • 。 初始方法 模型参数的初始方法。 normal:正态分布 平均:默认0 标准差:0.001 uniform :均匀分布 最小:默认-0.001,均匀分布的最小,必须小于最大。 最大:默认0.001,均匀分布的最大,必须大于最小。 xavier: 初始初始值为

  • 内置属性:图像尺寸(图像的宽、高深度),类型为List。列表中的第一个数字为宽(像素),第个数字为高(像素),第三个数字为深度(深度可以没有,默认为3),如[100,200,3]和[100,200]均合法。

  • 请参见1。 1 自动学习操作流程 项目类型介绍 图像分类 图像分类项目,是对图像进行分类。添加片并对图像进行分类标注。完成片标注后开始模型训练,即可快速生成图像分类模型。可应用于商品的自动分类、运输车辆种类识别和残次品的自动分类。例如质量检查的场景,则可以上传产品片,将

  • 。 初始方法 模型参数的初始方法。 normal:正态分布 平均:默认0 标准差:0.001 uniform :均匀分布 最小:默认-0.001,均匀分布的最小,必须小于最大。 最大:默认0.001,均匀分布的最大,必须大于最小。 xavier: 初始初始值为

  • 提供的硬件图像预处理模块,包括色域转换,图像归一(减均/乘系数)和抠(指定抠起始点,抠出神经网络需要大小的片)等功能。DVPP模块输出的片多为对齐后的YUV420SP类型,不支持输出RGB片。因此,业务流需要使用AIPP模块转换对齐后YUV420SP类型片的格式,并抠出模型需要的输入图片。

  • 提供的硬件图像预处理模块,包括色域转换,图像归一(减均/乘系数)和抠(指定抠起始点,抠出神经网络需要大小的片)等功能。DVPP模块输出的片多为对齐后的YUV420SP类型,不支持输出RGB片。因此,业务流需要使用AIPP模块转换对齐后YUV420SP类型片的格式,并抠出模型需要的输入图片。

  • 提供的硬件图像预处理模块,包括色域转换,图像归一(减均/乘系数)和抠(指定抠起始点,抠出神经网络需要大小的片)等功能。DVPP模块输出的片多为对齐后的YUV420SP类型,不支持输出RGB片。因此,业务流需要使用AIPP模块转换对齐后YUV420SP类型片的格式,并抠出模型需要的输入图片。

  • 提供的硬件图像预处理模块,包括色域转换,图像归一(减均/乘系数)和抠(指定抠起始点,抠出神经网络需要大小的片)等功能。DVPP模块输出的片多为对齐后的YUV420SP类型,不支持输出RGB片。因此,业务流需要使用AIPP模块转换对齐后YUV420SP类型片的格式,并抠出模型需要的输入图片。

  • 提供的硬件图像预处理模块,包括色域转换,图像归一(减均/乘系数)和抠(指定抠起始点,抠出神经网络需要大小的片)等功能。DVPP模块输出的片多为对齐后的YUV420SP类型,不支持输出RGB片。因此,业务流需要使用AIPP模块转换对齐后YUV420SP类型片的格式,并抠出模型需要的输入图片。

  • 提供的硬件图像预处理模块,包括色域转换,图像归一(减均/乘系数)和抠(指定抠起始点,抠出神经网络需要大小的片)等功能。DVPP模块输出的片多为对齐后的YUV420SP类型,不支持输出RGB片。因此,业务流需要使用AIPP模块转换对齐后YUV420SP类型片的格式,并抠出模型需要的输入图片。

  • 提供的硬件图像预处理模块,包括色域转换,图像归一(减均/乘系数)和抠(指定抠起始点,抠出神经网络需要大小的片)等功能。DVPP模块输出的片多为对齐后的YUV420SP类型,不支持输出RGB片。因此,业务流需要使用AIPP模块转换对齐后YUV420SP类型片的格式,并抠出模型需要的输入图片。

  • 提供的硬件图像预处理模块,包括色域转换,图像归一(减均/乘系数)和抠(指定抠起始点,抠出神经网络需要大小的片)等功能。DVPP模块输出的片多为对齐后的YUV420SP类型,不支持输出RGB片。因此,业务流需要使用AIPP模块转换对齐后YUV420SP类型片的格式,并抠出模型需要的输入图片。

  • 内置属性:图像尺寸(图像的宽、高深度),类型为List。列表中的第一个数字为宽(像素),第个数字为高(像素),第三个数字为深度(深度可以没有,默认为3),如[100,200,3]和[100,200]均合法。

  • 云容器引擎-成长地 | 华为云 图像识别 图像识别(Image Recognition),基于深度学习技术,可准确识别图像中的视觉内容,提供多种物体、场景和概念标签,具备目标检测和属性识别等能力,帮助客户准确识别和理解图像内容。 免费体验 1元包年 立即使用 立即使用 成长地 由浅入深,带您玩转Image

  • Square 计算元素平方根。

  • 内置属性:图像尺寸(图像的宽、高深度),类型为List。列表中的第一个数字为宽(像素),第个数字为高(像素),第三个数字为深度(深度可以没有,默认为3),如[100,200,3]和[100,200]均合法。

  • ,一般称这种方法为深度学习(Deep Learning,DL),深度学习经过一系列的发展之后,展现出巨大的应用价,不断受到工业界、术界的密切关注。深度学习图像、语音、自然语言处理、大数据特征提取和广告点击率预估方面取得明显进展。随之出现了多种适合深度学习的基础架构,如Caf

  • H:Height,特征图高度,即垂直高方向的像素个数。 W:Width,特征,即水平宽方向的像素个数。 C:Channels,特征通道,例如彩色RGB图像的Channels为3。 由于数据只能线性存储,因此这四个维有对应的顺序。不同深度学习框架会按照不同的顺序存储特征数据,比如Caffe,排列顺序为[Batch

  • H:Height,特征图高度,即垂直高方向的像素个数。 W:Width,特征,即水平宽方向的像素个数。 C:Channels,特征通道,例如彩色RGB图像的Channels为3。 由于数据只能线性存储,因此这四个维有对应的顺序。不同深度学习框架会按照不同的顺序存储特征数据,比如Caffe,排列顺序为[Batch

  • ,一般称这种方法为深度学习(Deep Learning,DL),深度学习经过一系列的发展之后,展现出巨大的应用价,不断受到工业界、术界的密切关注。深度学习图像、语音、自然语言处理、大数据特征提取和广告点击率预估方面取得明显进展。随之出现了多种适合深度学习的基础架构,如Caf

  • ,一般称这种方法为深度学习(Deep Learning,DL),深度学习经过一系列的发展之后,展现出巨大的应用价,不断受到工业界、术界的密切关注。深度学习图像、语音、自然语言处理、大数据特征提取和广告点击率预估方面取得明显进展。随之出现了多种适合深度学习的基础架构,如Caf

  • ,一般称这种方法为深度学习(Deep Learning,DL),深度学习经过一系列的发展之后,展现出巨大的应用价,不断受到工业界、术界的密切关注。深度学习图像、语音、自然语言处理、大数据特征提取和广告点击率预估方面取得明显进展。随之出现了多种适合深度学习的基础架构,如Caf

  • ,一般称这种方法为深度学习(Deep Learning,DL),深度学习经过一系列的发展之后,展现出巨大的应用价,不断受到工业界、术界的密切关注。深度学习图像、语音、自然语言处理、大数据特征提取和广告点击率预估方面取得明显进展。随之出现了多种适合深度学习的基础架构,如Caf

  • ,一般称这种方法为深度学习(Deep Learning,DL),深度学习经过一系列的发展之后,展现出巨大的应用价,不断受到工业界、术界的密切关注。深度学习图像、语音、自然语言处理、大数据特征提取和广告点击率预估方面取得明显进展。随之出现了多种适合深度学习的基础架构,如Caf

  • ,一般称这种方法为深度学习(Deep Learning,DL),深度学习经过一系列的发展之后,展现出巨大的应用价,不断受到工业界、术界的密切关注。深度学习图像、语音、自然语言处理、大数据特征提取和广告点击率预估方面取得明显进展。随之出现了多种适合深度学习的基础架构,如Caf

  • ,一般称这种方法为深度学习(Deep Learning,DL),深度学习经过一系列的发展之后,展现出巨大的应用价,不断受到工业界、术界的密切关注。深度学习图像、语音、自然语言处理、大数据特征提取和广告点击率预估方面取得明显进展。随之出现了多种适合深度学习的基础架构,如Caf

  • ,一般称这种方法为深度学习(Deep Learning,DL),深度学习经过一系列的发展之后,展现出巨大的应用价,不断受到工业界、术界的密切关注。深度学习图像、语音、自然语言处理、大数据特征提取和广告点击率预估方面取得明显进展。随之出现了多种适合深度学习的基础架构,如Caf

  • ,一般称这种方法为深度学习(Deep Learning,DL),深度学习经过一系列的发展之后,展现出巨大的应用价,不断受到工业界、术界的密切关注。深度学习图像、语音、自然语言处理、大数据特征提取和广告点击率预估方面取得明显进展。随之出现了多种适合深度学习的基础架构,如Caf

提交成功!非常感谢您的反馈,我们会继续努力做到更好 反馈提交失败!请稍后重试!

我要回帖

更多关于 权重和目标值之间的关系 的文章

 

随机推荐