darknet源码剖析(四)do_nms_sort详解
原文链接: darknet源码剖析(四)do_nms_sort详解
darknet源码剖析(四)do_nms_sort详解
//将图片数据进行缩放
image resize_data = resize_image(original_data, g_global_set.object_detect_net_set.this_net.w, g_global_set.object_detect_net_set.this_net.h);
//获取开始时间
double this_time = get_time_point();
//开始预测
network_predict(g_global_set.object_detect_net_set.this_net, resize_data.data);
//计算预测需要的时间
detect_info.detect_time = ((double)get_time_point() - this_time) / 1000;
//获取方框数量
int box_number;
detection* detection_data = get_network_boxes(&g_global_set.object_detect_net_set.this_net,
original_data.w, original_data.h, detect_info.thresh, detect_info.hier_thresh, 0, 1, &box_number, 0);
//非极大值抑制
do_nms_sort(detection_data, box_number, g_global_set.object_detect_net_set.classes, detect_info.nms);
//获取有效的方框数量
int useble_box = 0;
detection_with_class* detector_data = get_actual_detections(detection_data,
box_number, detect_info.thresh, &useble_box, g_global_set.object_detect_net_set.classes_name);
//对每一个对象
for (int i = 0; i < useble_box; i++)
{
//获取类型
int index = detector_data[i].best_class;
//获取置信度
int confid = detector_data[i].det.prob[detector_data[i].best_class] * 100;
//信息
char format[1024];
sprintf(format, "%s %d", g_global_set.object_detect_net_set.classes_name[index], confid);
//如果是车牌 且 车牌识别网络有加载
if (is_object_car_id(index) && g_global_set.car_id_identify_net.initizlie)
{
//分析车牌
int car_id[7];
detect_info.identify_time = analyse_car_id(rgb_data, detector_data[i].det.bbox, car_id);
char temp[default_char_size];
sprintf(temp, " %d%d-%d%d%d%d%d", car_id[0], car_id[1], car_id[2], car_id[3], car_id[4], car_id[5], car_id[6]);
strcat(format, temp);
}
//绘制
draw_boxs_and_classes(opencv_data, detector_data[i].det.bbox, format);
}
//释放内存
free_detections(detection_data, box_number);
free_image(original_data);
free_image(resize_data);
free(detector_data);
在yolo模型inference执行完成后,会产生很多的冗余结果,此时就需要调用nms对冗余结果进行去重。
nms函数在darknet框架中是do_nms_sort函数,位于box.c文件中,现对do_nms_sort过程做详细分析:
// 将没有物体的的结果后移
for(i = 0; i <= k; ++i){
if(dets[i].objectness == 0){
detection swap = dets[i];
dets[i] = dets[k];
dets[k] = swap;
--k;
--i; // --i后再++i表示i的位置没有改变,之所以采用这一做法的原因是,交换后的检测结果可能同样objectness为0
}
}
上述循环过程的功能是将没有物体的检测结果由后向前交换,--k表示最后一个位置向前移动一个位置,
--i后再++i表示i的位置没有改变,之所以采用这一做法的原因是,交换后的检测结果可能同样objectness为0,因此先保持在原位置不变,当检测结果的objectness不为0时,才移动到下一个物体。
经过上述过程,所有检测结果中不包含物体的全部被移动到了最后,包含物体的检测结果全部被移动到了数组前方。
for(k = 0; k < classes; ++k){
for(i = 0; i < total; ++i){
dets[i].sort_class = k;
}
qsort(dets, total, sizeof(detection), nms_comparator);
然后按照类别对检测结果进行排序,排序的依据是某个检测结果属于某一类的概率,调用nms_comparator函数。
for(i = 0; i < total; ++i){
if(dets[i].prob[k] == 0) continue;
box a = dets[i].bbox;
for(j = i+1; j < total; ++j){
box b = dets[j].bbox;
if (box_iou(a, b) > thresh){
dets[j].prob[k] = 0;
}
}
}
}
for(i = 0; i < total; ++i){
if(dets[i].prob[k] == 0) continue;
box a = dets[i].bbox;
for(j = i+1; j < total; ++j){
box b = dets[j].bbox;
if (box_iou(a, b) > thresh){
dets[j].prob[k] = 0;
}
}
}
最后一个二重循环的作用是,计算两个检测结果之间的iou,若二者之间的iou大于thresh,则将后者直接置0,认为上述两个框是同一个框。此处代码中给出的thresh是0.45。但上述做法实际上产生了一个问题,若两个物体重叠部分大于thresh,则会造成其中一个物体的丢失,进而造成准确率的下降。解决上述问题已有一些方法,但不是本文的重点,此处先暂且不表。
至此do_nms_sort的过程就分析完成了,总结起来就是三个过程:
1)去除没有物体的检测结果。
2)按照检测结果类别排序。
3)计算检测结果之间的iou,若大于thresh,则舍去。