是一个深度卷积

Explore innovative ideas for Australia Database development.
Post Reply
subornaakter24
Posts: 417
Joined: Thu Jan 02, 2025 7:20 am

是一个深度卷积

Post by subornaakter24 »

YOLO,即你只看一次。该神经网络在微软COCO数据集上被公认为解决实时物体检测/识别问题最准确的网络。

YOLO 神经网络

神经网络,其运行原理如下:首先,将输入图像分成一组形成网格的单元(cell)。随后对原始图像进行压缩,直到得到一个 13×13 的方阵,每个单元格包含图像相应部分中物体的存在情况及其类别的信息。因此,YOLO 只需要查看图像一次,而不需要像类似的神经网络那样查看两次。这种方法显著提高了处理速度,并且所需的计算能力显著减少。

YOLOv5是改进的第五个版本,在PyTorch框架上实现。 YOLOv5 是同名 Python3 模块的一部分,可以从 pypi 安装。该模型的优点之一是,YOLO 可以利用多种在线数据标记服务进 比利时手机号 行学习。因此,只需 2-3 小时,就可以训练神经网络来搜索某一类别的物体。

公平交通运输
FairMOT 或公平多目标跟踪。这种高性能方法的显著特点是,利用机器学习技术,能够跟踪视频中的多个对象,而不是一个。此项开发由微软专家和华中科技大学的科学家共同完成。

FairMOT 神经网络

该方法采用基于可变形卷积神经网络(DCNv2,Deformable Convolutional Network)的单阶段实现,可以显著提高物体跟踪的速度。为了训练模型,FairMOT 使用了 6 个用于人体检测和检索的公共数据集,分别是 ETH、CityPerson、CalTech、MOT17、CUHK-SYSU。根据测试结果,FairMOT 在以每秒 30 帧的视频流上运行时比竞争模型 TrackRCNN 和 JDE 更快。

媒体管道
绝大多数神经网络只能检测和识别二维物体,即使是视频片段也是如此。也就是说,所揭示内容周围所绘制的框架也将是二维的。但时间要求我们需要一种更精确的空间方法来检测和追踪物体。

为了解决这个问题,Google AI 开发了 MediaPipe Objectron 移动管道,可以对日常物体进行实时 3D 检测。它还可以在二维图像中检测出它正在寻找的东西。 MediaPipe 的 Objectron 使用单阶段模型进行姿势预测。如果我们考虑它的结构,它首先是一个基于MobileNetV2的编解码器。
Post Reply