计算机视觉-图像检索随记

栏目: 编程工具 · 发布时间: 7年前

内容简介：海量数据的情况用KNN是不行的。现在项目上一般使用的是一整套的ANN直观的理解就是用超平面对空间做一个划分，画完后落在同一区域的一些点他们得到的01串应该是一样的，而临近的点他们之间可能有一个维度的值不同。超平面的优化方式这么木有讲！！超平面的划分不一定合理，所以这个算法是牺牲一部分准确度来提高速度。

电商上的应用：找相似，找同款。CNPR，用卷积神经网络学习出来一个分桶的编号。预先把图像做一些分桶或者说把他先丢到空间不同的区域，然后检索时只是找其中某个区域的图片。找同款可以使用这种，不需要使用复杂的神经网络以未知点为圆心画圆，他所属的类别取决于圆内类别最多的点。你得先计算他们之间的相近度，每个图片抽取出来的feature和其他图片feature的相近度。假设Alexnet FC的结果是4096*1 double型向量，那么那他去比对计算量会非常大，所以会将它映射到一个的数例如：128/64bit维的10101数字串。

海量数据的情况用KNN是不行的。现在项目上一般使用的是一整套的ANN

直观的理解就是用超平面对空间做一个划分，画完后落在同一区域的一些点他们得到的01串应该是一样的，而临近的点他们之间可能有一个维度的值不同。

超平面的优化方式这么木有讲！！超平面的划分不一定合理，所以这个算法是牺牲一部分准确度来提高速度。

怎么样去权衡准确度和速度？增加超平面可以提高准确度，但是会造成在Nbit的范围内落下来的点非常的少。另一种方式是随机的使用另外一组超平面做划分(不同的hash)。

N值是通过经验和上下调整的方式得到的。

使用3个哈希得到各自相似的结果，将他们组合起来。具体和谁最相似，可以采用其他算法比如：距离算法求得。

聚类的方式分桶很慢！！

k-Means Tree:先聚类大范围，在聚类小范围。查找时也是先找落在那个大范围内，再往细的找。FLANN实际中使用效果会好。

训练的时候使用的Alexnet 全连接层是4096维

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

App研发录：架构设计、Crash分析和竞品技术分析

包建强 / 机械工业出版社 / 2015-10-21 / CNY 59.00

本书是作者多年App开发的经验总结，从App架构的角度，重点总结了Android应用开发中常见的实用技巧和疑难问题解决方法，为打造高质量App提供有价值的实践指导，迅速提升应用开发能力和解决疑难问题的能力。本书涉及的问题有：Android基础建设、网络底层框架设计、缓存、网络流量优化、制定编程规范、模块化拆分、Crash异常的捕获与分析、持续集成、代码混淆、App竞品技术分析、项目管理和团队建设等......一起来看看《App研发录：架构设计、Crash分析和竞品技术分析》这本书的介绍吧!

码农工具

计算机视觉-图像检索随记

聚类的方式分桶很慢！！

App研发录：架构设计、Crash分析和竞品技术分析

HTML 压缩/解压工具

CSS 压缩/解压工具

HEX HSV 转换工具