由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 数据量大了之后,上deep learning是必然的
相关主题
有没有做sentiment analysis的,求思路FORTRAN数组越界问题
Think Python一个问题,关于数据存储的选择
word2vec 中skip gram 问题请教Workflow design请教
问一个NN训练模型输入问题有没有什么轮子可以管理大堆的binary文件啊?
encode high cardinality categorical features大数据在工业界流行的黑暗真相
并行可以降低计算复杂度??请教一个实际工作中performance和scalability的问题
[求助] 哪位有Excel Macro VBA 教程一类的电子书啊大牛们,请教大数据系统如何架构
请教一个跟search中用到的auto suggestion问题一个关于big data 系统架构的设计问题
相关话题的讨论汇总
话题: 标签话题: deep话题: learning话题: 数据量话题: semantic
进入Programming版参与讨论
1 (共1页)
l****r
发帖数: 119
1
最近做了一个项目,感觉用上了一点机器学习算法:
公司的推荐系统,有几千万篇文章,文章会打上一个或几个“兴趣点”标签,可能是人
工打的也可能是机器打的,标签库基本上是一个近似封闭的集合,1万多个标签。把文
章的标签矩阵(one-hot矩阵)做了一个SVD分解(Latent semantic analysis),就“学”
出来了标签的“词向量”,果然相似的标签具有最大的内积。突然就明白word2vec,
GloVe等把做词向量的原理了。
还有Deep Semantic Similarity Model. DSSM。类似于让全网用户对页面打标签(
search query)。那肯定能fit出来一个deep learning model啊
1 (共1页)
进入Programming版参与讨论
相关主题
数据可视化有什么好的创业机会么encode high cardinality categorical features
用CNN,怎么计算需要的数据量?并行可以降低计算复杂度??
[bssd]wdong,lightroom....来猜个东西[求助] 哪位有Excel Macro VBA 教程一类的电子书啊
GCC 居然允许变量长度的向量请教一个跟search中用到的auto suggestion问题
有没有做sentiment analysis的,求思路FORTRAN数组越界问题
Think Python一个问题,关于数据存储的选择
word2vec 中skip gram 问题请教Workflow design请教
问一个NN训练模型输入问题有没有什么轮子可以管理大堆的binary文件啊?
相关话题的讨论汇总
话题: 标签话题: deep话题: learning话题: 数据量话题: semantic