Fork me on GitHub

mmdetection中的retinanet

发表于 2019-03-29 | 分类于 CV

字数统计: 5,792 | 阅读时长 ≈ 24

一、大体流程1. 训练逻辑 mmdetection的训练逻辑是借助了mmcv中的Runner类，做了一层封装。按照正常的逻辑思考，如果我们要训练一个网络，至少要知道输入数据、模型、优化器、loss等信息，这些信息在tools/train.py以及mmdet/apis/trai ...

阅读全文 »

物体检测中的anchor

发表于 2019-03-26 | 分类于 CV

字数统计: 1,039 | 阅读时长 ≈ 5

anchor自从在faster rcnn中提出后，被广泛应用于物体检测中，流程可概括如下（one stage）通过backbone和neck（fpn等）网络得到feature map并根据feature map用head网络生成各个尺度的cls score和reg score 生成anchor ...

阅读全文 »

SSD源码阅读及原理详解

发表于 2018-10-21 | 分类于 CV

字数统计: 6,797 | 阅读时长 ≈ 32

本文阅读的版本是tensorflow对SSD的实现，相对而言阅读难度要远低于caffe版本的实现，源代码可见balancap/SSD-Tensorflow。一、思路 SSD的网络结构在论文中清晰可见，如图所示。具体是使用了VGG的基础结构，保留了前五层 ...

阅读全文 »

word2vec理解

发表于 2018-06-08 | 分类于 NLP

字数统计: 2,036 | 阅读时长 ≈ 8

本文需要对n-gram模型在评估语句上的应用有一定了解（n-gram还有一些其他应用，如模糊匹配、特征工程等），可以看作对word2vec 中的数学原理详解这篇博文的一些思考。首先一定要建立起word2vec的基本认识，在NLP的一些任务中，我们需要 ...

阅读全文 »

中文分词

发表于 2018-05-17 | 分类于 NLP

字数统计: 1,749 | 阅读时长 ≈ 7

基本思路中文分词其实有很多种思路，大多都是建立在HMM模型的基础上。先简要介绍一下HMM模型，HMM模型中有三个要素：A是状态转移概率分布矩阵，简单说就是在任一时刻从一个隐含状态到另一个隐含状态的转移概率构成的矩阵；B是观测概率分布矩阵，其实就是在任一时刻给定隐含状态s生成观 ...

阅读全文 »