2018-05-23论文阅读笔记31 minutes read (About 4639 words)

Lattice LSTM 中文NER

ACL 2018，基于LSTM+CRF，用word2vec对字符进行表示，然后用大规模自动分词的预料，将词进行表示，扔进LSTM获得细胞状态，与基于字符的LSTM的细胞状态相结合，得到序列的隐藏状态，然后套一个CRF。原文链接：Chinese NER Using Lattice LSTM

2018-05-23论文阅读笔记19 minutes read (About 2900 words)

门控卷积网络语言建模

ICML 2017，大体思路：卷积+一个线性门控单元，替代了传统的RNN进行language modeling，后来的Facebook将这个用于机器翻译，提出了卷积版的seq2seq模型。原文链接：Language Modeling with Gated Convolutional Networks

2018-05-22论文阅读笔记34 minutes read (About 5047 words)

Convolutional Sequence to Sequence Learning

ICML 2017. Facebook 2017年的卷积版seq2seq。卷积加注意力机制，外加GLU，训练速度很快，因为RNN训练时依靠上一个元素的隐藏状态，CNN可以并行训练。原文链接：Convolutional Sequence to Sequence Learning

2018-05-10论文阅读笔记43 minutes read (About 6443 words)

Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic

IJCAI 2018，大体思路：使用Kipf & Welling 2017的近似谱图卷积得到的图卷积作为空间上的卷积操作，时间上使用一维卷积对所有顶点进行卷积，两者交替进行，组成了时空卷积块，在加州PeMS和北京市的两个数据集上做了验证。但是图的构建方法并不是基于实际路网，而是通过数学方法构建了一个基于距离关系的网络。原文链接：Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forecasting

2018-04-18论文阅读笔记34 minutes read (About 5043 words)

Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

AAAI 2018，以人体关节为图的顶点，构建空间上的图，然后通过时间上的关系，连接连续帧上相同的关节，构成一个三维的时空图。针对每个顶点，对其邻居进行子集划分，每个子集乘以对应的权重向量，得到时空图上的卷积定义。实现时使用Kipf & Welling 2017的方法实现。原文链接：Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

2018-03-08论文阅读笔记19 minutes read (About 2911 words)

Identity Mappings in Deep Residual Networks

ECCV 2016, ResNet v2, 原文链接：Identity Mappings in Deep Residual Networks

2018-03-04论文阅读笔记9 minutes read (About 1403 words)

Deep Residual Learning for Image Recognition

CVPR 2015，ResNet，原文链接：Deep Residual Learning for Image Recognition

2018-03-02论文阅读笔记8 minutes read (About 1273 words)

Image Super-Resolution Using Deep Convolutional Networks

PAMI 2016，大体思路：把训练集中的所有样本模糊化，扔到三层的卷积神经网络中，把输出和原始图片做一个loss，训练模型即可。原文链接：Image Super-Resolution Using Deep Convolutional Networks

2018-03-01论文阅读笔记16 minutes read (About 2356 words)

Perceptual Losses for Real-Time Style Transfer and Super-Resolution

ECCV 2016，实时风格迁移与超分辨率化的感知损失，这篇论文是在cs231n里面看到的，正好最近在研究风格迁移。一作是Justin Johnson，2017春的cs231n的主讲之一。这篇论文的主要内容是对Gatys等人的风格迁移在优化过程中进行了优化，大幅提升了性能。
主要原理就是，之前Gatys等人的论文是利用已经训练好的VGG19，求loss并利用VGG的结构反向求导更新图片。由于VGG结构复杂，这样反向更新速度很慢，改进方法是再另外设计一个神经网络，将内容图片作为输入，输出扔到VGG中做两个loss，然后反向传播更新当前这个神经网络的参数，这样训练出来的神经网络就可能将任意的内容图片扔进去，输出为风格迁移后的图片，这也就解决了速度的问题。这也就是将Feed-forward image transformation与style transfer结合在一起。原文链接：Perceptual Losses for Real-Time Style Transfer and Super-Resolution

2018-02-24论文阅读笔记44 minutes read (About 6648 words)

Image Style Transfer Using Convolutional Neural Networks

CVPR 2016，大体原理：选择两张图片，一张作为风格图片，一张作为内容图片，任务是将风格图片中的风格，迁移到内容图片上。方法也比较简单，利用在ImageNet上训练好的VGG19，因为这种深层次的卷积神经网络的卷积核可以有效的捕捉一些特征，越靠近输入的卷积层捕捉到的信息层次越低，而越靠近输出的卷积层捕捉到的信息层次越高，因此可以用高层次的卷积层捕捉到的信息作为对风格图片风格的捕捉。而低层次的卷积层用来捕捉内容图片中的内容。所以实际的操作就是，将内容图片扔到训练好的VGG19中，取出低层次的卷积层的输出，保存起来，然后再把风格图片放到VGG19中，取出高层次的卷积层的输出，保存起来。然后随机生成一张图片，扔到VGG19中，将刚才保存下来的卷积层的输出的那些卷积层的结果拿出来，和那些保存的结果做个loss，然后对输入的随机生成的图片进行优化即可。原文链接：Image Style Transfer Using Convolutional Neural Networks