nnie ncnn


原文链接: nnie ncnn

image caption 的移动端实现过程(ncnn, nnie)_人工智能_qq_34898504的博客-CSDN博客

ncnn的encoder、decoder(image caption)实现
基本思路:动态构建ncnn计算流。ncnn对imagecaption中的层支持不太完善,有很多错误冲突,需要改进,特别是不支持像广播这样的操作,另外尽量减少重复计算。

节省计算:python版中的计算存在较多冗余,主要是 inference 时候为了提高精度的 而使用的beam size技巧, 它的大小决定了 inference 的时候输出的序列数(最终选择score最高的序列作为 inference 的结果),由此导致不必要的重复计算。如attention 对 encoder 的输出的编码只需计算一次;decoder step 1 时只用计算一个输出,无论beam size多大。
编写缺失的op:如lstmcell,adaptive pool, 某个维度的操作等。
ncnn缺失层的编写
lstmcell层
描述词数不定,网络输出由lstmcell输出的是否是决定,这就需要编写单个lstmcell层执行单个细胞计算,并循环执行,根据输出决定停止时刻。
————————————————
版权声明:本文为CSDN博主「kxc_1102」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_34898504/article/details/93241093

`