caffe train sssd

by · 2019年11月02日 · 1441 Words · ~3min reading time | Improve on

MobileNet-SSD网络解析
 MobileNetv2-SSDlite训练自己的数据集（二）——训练MSSD - qq_43150911的博客 - CSDN博客

MobileNetv2-SSDLite 实现以及训练自己的数据集

实战 Mobilenet-SSD的Caffe系列实现 - 小萌宝的博客 - CSDN博客

1. 环境

git clone https://github.com/chuanqi305/MobileNetv2-SSDLite

cd ssdlite

wget http://download.tensorflow.org/models/object_detection/ssdlite_mobilenet_v2_coco_2018_05_09.tar.gz

tar -zvxf ssdlite_mobilenet_v2_coco_2018_05_09.tar.gz

python dump_tensorflow_weights.py

python load_caffe_weights.py

Caffe 实现 MobileNetv2-SSDLite 目标检测，预训练文件从 tensorflow 来的，要将 tensorflow 模型转换到 caffe.

先废话，我的环境，如果安装了 cuda, cudnn, 而且 caffe，tensorflow 都通过了，请忽略下面的，只是要注意 caffe 的版本：

Ubuntu 16.04
查看 CUDA 版本：(CUDA 8.0.61)

alpha@zero:~/$ nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61

查看 cudnn 版本：(cudnn 6.0.21)

alpha@zero:~/$ cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
#define CUDNN_MAJOR      6
#define CUDNN_MINOR      0
#define CUDNN_PATCHLEVEL 21

重要：

caffe 版本，并非官方版本，因为官方版本的有很多网络的某些 layer 或者其他方面的不支持：
1. caffe 版本：weiliu89/caffe，如果用的这个版本，需要自己手动添加 ReLU6
2. chuanqi305 fork weiliu89 的版本，他添加了 ReLU6，（推荐这个版本）
tensorflow 版本，因为我的 CUDA，cuDNN 版本的原因，我装了一个官方老版本 (tensorflow 1.3.0)。

alpha@zero:~/$ pip list | grep tensorflow
tensorflow-gpu (1.3.0)
tensorflow-tensorboard (0.1.8)

2. 具体实现

git clone MobileNetv2-SSDLite respository.

git clone https://github.com/chuanqi305/MobileNetv2-SSDLite

从 tensorflow 下载 MobileNetv2-SSDLite 的 tensorflow 模型到 ssdlite/ 路径，并解压。

cd MobileNetv2-SSDLite/ssdlite/
wget http://download.tensorflow.org/models/object_detection/ssdlite_mobilenet_v2_coco_2018_05_09.tar.gz
tar -zvxf ssdlite_mobilenet_v2_coco_2018_05_09.tar.gz

转换 tensorflow 模型到 caffe，执行下面两个脚本后，在当前目录下会生成 deploy.caffemodel caffe 模型

python dump_tensorflow_weights.py
# 修改 load_caffe_weight.py 中 caffe_root 为自己的路径
python load_caffe_weight.py

默认生成的是 coco 数据集的 caffemodel 90 个类别(coco 数据集是80个类别，不清楚这里为什么有 90 个)，可以转换成 voc 模型，20 个类别，当然也可一改成自己数据集的 caffemodel，需要改 coco2voc.py 脚本，并执行：

# 修改 coco2voc.py 中 caffe_root 为自己的路径
python coco2voc.py

上面所有步骤成功了后，就可以 test 一下模型
cd 到 MobileNetv2-SSDLite/ 目录下，同样的修改脚本中 caffe_root 为自己的路径后，执行下面命令：

python demo_caffe_voc.py

测试结果如下图片，

3. 训练自己的数据集

制作自己的数据集
这两步请参考， https://blog.csdn.net/Chris_zhangrx/article/details/80458515
MobileNet-SSD, MobileNetv2-SSDLite，训练时数据集需要做的准备一样。
修改 label 文件，在 MobileNetv2-SSDLite/ssdlite/voc/ 目录下 **labelmap_voc.prototxt，修改成自己的类别，例如有两类 car, person。注意要加 background

item {
  name: "none_of_the_above"
  label: 0
  display_name: "background"
}
item {
  name: "car"
  label: 1
  display_name: "car"
}
item {
  name: "person"
  label: 2
  display_name: "person"
}

在 MobileNetv2-SSDLite/ssdlite/ 目录下的 gen_model.py 生成 caffe 训练测试时用的 prototxt 文件，注意 CLASS_NUM = 类别数 + 1，因为把背景也算进去，例如是上面描述的 car, person 两类，则 CLASS_NUM = 3，–tfpad，是为了消除识别时可能出现 bounding box 的偏差，–relu6，是为了将 ReLU 替换成 ReLU6，同样的修改 caffe_root 为自己的路径，另外，此外如果这 gen_model.py 生成的 train.prototxt 训练时出现问题，请参考 gen_model.py fix

python gen_model.py -s train -c CLASS_NUM --tfpad --relu6 >train.prototxt
python gen_model.py -s test -c CLASS_NUM --tfpad --relu6 >test.prototxt
python gen_model.py -s deploy -c CLASS_NUM --tfpad --relu6 >deploy.prototxt

然后修改 train.prototxt 中的三处，

第一处，

source: "trainval_lmdb"

改成你自己的 trainval_lmdb 路径，例如

source: "/home/alpha/MobileNetv2-SSDLite/lmdb/trainval_lmdb"

第二处，

label_map_file: "labelmap.prototxt"

改成自己的 labelmap 路径，例如

label_map_file: "/home/alpha/MobileNetv2-SSDLite/ssdlite/voc/labelmap_voc.prototxt"

第三处，如果 GPU 很渣，训练时候超出显存，把 batch_size 改小一点

batch_size: 64

开始训练
修改 MobileNetv2-SSDLite/ssdlite/voc/solver_train.prototxt ，或者复制到你自己的 project 目录下，其中

net: "train.prototxt"

需修改成自己的 train.prototxt 路径，如下，或者复制到当前目录下

net: "/home/alpha/MobileNetv2-SSDLite/ssdlite/train.prototxt"

当然其他的参数都可以根据自己的训练修改，例如最大迭代次数，以及每隔多少次保存一次模型，等等

修改并运行 MobileNetv2-SSDLite/ssdlite/voc/train.sh，例如

#!/bin/sh
mkdir -p snapshot
/home/alpha/ssd/build/tools/caffe train \
-solver="/home/alpha/MobileNetv2-SSDLite/ssdlite/voc/solver_train.prototxt" \
-weights="/home/alpha/MobileNetv2-SSDLite/ssdlite/deploy_voc.caffemodel" \
-gpu 0

如果顺利的话，god bless you! 就可以开始训练。
output:

......
I1214 15:04:49.776378  7844 net.cpp:761] Ignoring source layer conv_13/project_conv_13/project_0_split
I1214 15:04:49.778203  7844 caffe.cpp:251] Starting Optimization
I1214 15:04:49.778215  7844 solver.cpp:294] Solving MobileNetv2-SSDLite
I1214 15:04:49.778218  7844 solver.cpp:295] Learning Rate Policy: multistep
I1214 15:04:49.784867  7844 blocking_queue.cpp:50] Data layer prefetch queue empty
I1214 15:04:55.167454  7844 solver.cpp:243] Iteration 0, loss = 15.0445
I1214 15:04:55.167486  7844 solver.cpp:259]     Train net output #0: mbox_loss = 15.0445 (* 1 = 15.0445 loss)
I1214 15:04:55.167507  7844 sgd_solver.cpp:138] Iteration 0, lr = 1e-05
I1214 15:05:29.629565  7844 solver.cpp:243] Iteration 10, loss = 14.7857
I1214 15:05:29.629652  7844 solver.cpp:259]     Train net output #0: mbox_loss = 14.2803 (* 1 = 14.2803 loss)
......
......

others

Github：https://youngxiao.github.io
Email： yxiao2048@gmail.com