视觉识别:ffmpeg-python、ultralytics.YOLO、OpenCV-Python、标准RTSP地址格式
-
- ffmpeg-python
-
- 核心概念
- 常用过滤器(Filters)
- 高级操作
- 视频截帧转换图片示例
- 参考
- ultralytics.YOLO(You Only Look Once)
-
- 1. 模型加载
- 2. 训练模型 (`train()`)
-
- 标准YAML格式示例
- 3. 预测 (`predict()`)
- 4. 验证模型 (`val()`)
-
- metrics
-
- 核心指标 (metrics.box)
- 其他重要属性
- 完整指标获取示例
- results_dict 中的完整键值
- 注意事项
- 5. 模型导出 (`export()`)
- 常用参数说明表
-
- 训练验证输出中各参数的详细解释
- train/val/predict关键区别总结
- mAP 详解
-
- 1. 核心概念
- 2. 计算流程
- 3. 常见变体
- mAP 在目标检测中的意义
- mAP 解读指南
- 提升mAP的策略
- runs/detect日志讲解
- 参考
- OpenCV-Python(cv2)
-
- 1. 图像读取与保存
-
- `cv2.imread(filename, flags)`
- `cv2.imwrite(filename, img, params)`
- `cv2.imshow()`
- 2. 图像处理
-
- `cv2.cvtColor(src, code)`
- `cv2.resize(src, dsize, fx, fy, interpolation)`
-
- 为什么需要插值?
- `cv2.GaussianBlur(src, ksize, sigmaX)`
- 3. 阈值与二值化
-
- `cv2.threshold(src, thresh, maxval, type)`
- 4. 特征检测
-
- `cv2.Canny(image, threshold1, threshold2, apertureSize, L2gradient)`
- `cv2.HoughLinesP(image, rho, theta, threshold, minLineLength, maxLineGap)`
- 5. 视频处理
-
- `cv2.VideoCapture(index)`
- `cv2.VideoWriter(filename, fourcc, fps, frameSize)`
- 6. 绘图函数
-
- `cv2.rectangle(img, pt1, pt2, color, thickness)`
- `cv2.putText(img, text, org, fontFace, fontScale, color, thickness)`
- 7. 形态学操作
-
- `cv2.erode(src, kernel, iterations)`
- `cv2.dilate(src, kernel, iterations)`
- `cv2.morphologyEx(src, op, kernel)`
- 8. 窗口管理
- 标准RTSP地址格式
-
- 参数说明
- 调试工具建议
- 参考
ffmpeg-python
ffmpeg-python
是一个用于操作 FFmpeg 的 Python 库,它通过 Python 对象和链式调用封装了 FFmpeg 的命令行参数。
核心概念
-
input()
:创建输入流input_stream = ffmpeg.input('input.mp4', ss=10, t=5)