Graph Convolutional Neural Networks for Web-Scale Recommender Systems
KDD 2018。使用图卷积对顶点进行表示,学习顶点的 embedding ,通过卷积将该顶点的邻居信息融入到向量中。原文链接:Graph Convolutional Neural Networks for Web-Scale Recommender Systems。
KDD 2018。使用图卷积对顶点进行表示,学习顶点的 embedding ,通过卷积将该顶点的邻居信息融入到向量中。原文链接:Graph Convolutional Neural Networks for Web-Scale Recommender Systems。
ACL 2018,基于LSTM+CRF,用word2vec对字符进行表示,然后用大规模自动分词的预料,将词进行表示,扔进LSTM获得细胞状态,与基于字符的LSTM的细胞状态相结合,得到序列的隐藏状态,然后套一个CRF。原文链接:Chinese NER Using Lattice LSTM
ICML 2017,大体思路:卷积+一个线性门控单元,替代了传统的RNN进行language modeling,后来的Facebook将这个用于机器翻译,提出了卷积版的seq2seq模型。原文链接:Language Modeling with Gated Convolutional Networks
ICML 2017. Facebook 2017年的卷积版seq2seq。卷积加注意力机制,外加GLU,训练速度很快,因为RNN训练时依靠上一个元素的隐藏状态,CNN可以并行训练。原文链接:Convolutional Sequence to Sequence Learning
IJCAI 2018,大体思路:使用Kipf & Welling 2017的近似谱图卷积得到的图卷积作为空间上的卷积操作,时间上使用一维卷积对所有顶点进行卷积,两者交替进行,组成了时空卷积块,在加州PeMS和北京市的两个数据集上做了验证。但是图的构建方法并不是基于实际路网,而是通过数学方法构建了一个基于距离关系的网络。原文链接:Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forecasting
AAAI 2018,以人体关节为图的顶点,构建空间上的图,然后通过时间上的关系,连接连续帧上相同的关节,构成一个三维的时空图。针对每个顶点,对其邻居进行子集划分,每个子集乘以对应的权重向量,得到时空图上的卷积定义。实现时使用Kipf & Welling 2017的方法实现。原文链接:Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition
ECCV 2016, ResNet v2, 原文链接:Identity Mappings in Deep Residual Networks
CVPR 2015,ResNet,原文链接:Deep Residual Learning for Image Recognition
PAMI 2016,大体思路:把训练集中的所有样本模糊化,扔到三层的卷积神经网络中,把输出和原始图片做一个loss,训练模型即可。原文链接:Image Super-Resolution Using Deep Convolutional Networks
ECCV 2016,实时风格迁移与超分辨率化的感知损失,这篇论文是在cs231n里面看到的,正好最近在研究风格迁移。一作是Justin Johnson,2017春的cs231n的主讲之一。这篇论文的主要内容是对Gatys等人的风格迁移在优化过程中进行了优化,大幅提升了性能。
主要原理就是,之前Gatys等人的论文是利用已经训练好的VGG19,求loss并利用VGG的结构反向求导更新图片。由于VGG结构复杂,这样反向更新速度很慢,改进方法是再另外设计一个神经网络,将内容图片作为输入,输出扔到VGG中做两个loss,然后反向传播更新当前这个神经网络的参数,这样训练出来的神经网络就可能将任意的内容图片扔进去,输出为风格迁移后的图片,这也就解决了速度的问题。这也就是将Feed-forward image transformation与style transfer结合在一起。原文链接:Perceptual Losses for Real-Time Style Transfer and Super-Resolution