安装
YOLOv8 有两种安装方式,一种是直接用 pip 命令安装:
shell
复制代码
pip install ultralytics
另外一种是通过源码安装:
shell
复制代码
git clone https://github.com/ultralytics/ultralytics
cd ultralytics
pip install -e '.[dev]'
安装完成后就可以通过 yolo 命令在命令行进行使用了。
目标检测
使用 YOLOv8 进行目标检测,可以使用下面的命令:
shell
复制代码
yolo task=detect mode=predict model=yolov8n.pt source=ultralytics/assets/bus.jpg imgsz=640 show=True save=True
如果模型权重不存在,程序会自动从GitHub中*载下**。如果对命令行的参数不了解,可以参考官方文档的说明,也可以直接看 ultralytics 代码仓库中的 ultralytics/yolo/cfg/default.yaml 文件,里面有所有参数的说明和默认值。
上面的命令运行成功后,带检测结果的图片被保存到 runs/detect/predict 目录下,如下图所示:

跑视频的效果可以看下面这个视频:
用TensorRT部署的YOLOv8模型,来看看效果怎么样
目标跟踪
YOLOv8 目前支持 BoT-SORT 和 ByteTrack 两种多目标跟踪算法,默认的目标跟踪算法为 BoT-SORT ,使用方式如下:
shell
复制代码
yolo track model=yolov8n.pt source=test.avi show=True save=True
如果要使用 ByteTrack 跟踪算法,可以添加命令行参数 tracker=bytetrack.yaml 。
下面的视频是使用 BoT-SORT 算法的跟踪效果,效果还是不错的。
YOLOv8目标检测+BoT-SORT目标跟踪
模型部署
如果要用 TensorRT 部署 YOLOv8 ,需要先使用下面的命令将模型导出为 onnx 格式:
shell
复制代码
yolo export model=yolov8n.pt format=onnx opset=12
YOLOv8 的 3 个检测头一共有 80x80+40x40+20x20=8400 个输出单元格,每个单元格包含 x,y,w,h 这 4 项再加 80 个类别的置信度总共 84 项内容,所以通过上面命令导出的 onnx 模型的输出维度为 1x84x8400 。

这样的通道排列顺序有个问题,那就是后处理的时候会造成内存访问不连续。为了解决这个问题,我们可以修改一下代码,具体做法是把 ultralytics/nn/modules.py 文件中的 421 行做如下修改,交换一下张量 y 的通道顺序:

修改代码后需要执行前面的安装命令 pip install -e '.[dev]' 使代码生效。这样修改后再执行上面的模型导出命令,模型的输出维度变为 1x8400x84 。

导出 onnx 模型后,就可以用 TensorRT 进行部署了。如何使用 TensorRT 的 C++ 接口部署 ONNX 模型可以参考我之前给【自动驾驶之心】公众号写的这篇文章:手把手教学!TensorRT部署实战:YOLOv5的ONNX模型部署。
与 YOLOv5 相比,部署 YOLOv8 的不同之处就是做后处理解析模型输出结果的时候不需要去解析 objectness 这项内容了,其他都类似。
使用 TensorRT 框架在我的 GeForce GTX 1650 Ti 显卡上部署 YOLOv8 的结果如下:
|
模型 |
输入尺寸 |
模型精度 |
耗时(ms) |
|
yolov8n.onnx |
640x640 |
FP32 |
7 |
|
yolov8s.onnx |
640x640 |
FP32 |
12 |
|
yolov8m.onnx |
640x640 |
FP32 |
29 |
|
yolov8l.onnx |
640x640 |
FP32 |
52 |
|
yolov8x.onnx |
640x640 |
FP32 |
83 |
|
yolov8n.onnx |
640x640 |
FP16 |
4 |
|
yolov8s.onnx |
640x640 |
FP16 |
7 |
|
yolov8m.onnx |
640x640 |
FP16 |
14 |
|
yolov8l.onnx |
640x640 |
FP16 |
25 |
|
yolov8x.onnx |
640x640 |
FP16 |
40 |
YOLOv5 测试结果:
|
模型 |
输入尺寸 |
模型精度 |
耗时(ms) |
|
yolov5n.onnx |
640x640 |
FP32 |
7 |
|
yolov5s.onnx |
640x640 |
FP32 |
10 |
|
yolov5m.onnx |
640x640 |
FP32 |
21 |
|
yolov5l.onnx |
640x640 |
FP32 |
41 |
|
yolov5x.onnx |
640x640 |
FP32 |
76 |
|
yolov5n.onnx |
640x640 |
FP16 |
5 |
|
yolov5s.onnx |
640x640 |
FP16 |
6 |
|
yolov5m.onnx |
640x640 |
FP16 |
11 |
|
yolov5l.onnx |
640x640 |
FP16 |
21 |
|
yolov5x.onnx |
640x640 |
FP16 |
38 |
从上面的测试结果来看, YOLOv8 比 YOLOv5 稍微慢一点点。