php - 淘宝用户评价标签如何实现
本文介绍了php - 淘宝用户评价标签如何实现的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
问 题
像淘宝这种自动从评论里面获取变成标签的功能是如何实现的 有大神知道吗
解决方案
楼主这个问题就比较深了,牵涉到数据挖掘和自然语言处理等方面了。不是在sf几个demo代码就能给你解决的,不过可以提供一个思路给你。你自己搜搜相关资料仿一个就好了。
你可以看一下google的开源项目word2vec,这个可以用来做评论的挖掘然后做聚类分析。
那么,实现类似淘宝的这种聚类分析的效果怎么做呢?
收集所有评论,也就是获取你们自己的所有评论。
训练评论词向量,这里可以用斯坦福大学开源的CoreNLP来做中文分词,然后用google的word2vec来训练出词向量。
制定抽取规则,根据上面分析出的结果,制定出抽取的规则。
聚类去重,利用算法对抽取的候选标签去重
计算聚类中心,获得聚类最中心的标签作为显示的关键词。
另,在知乎有人对这个进行过讨论,你可以去参考一下。附上几个链接:
自然语言处理之Word2Vec
知乎关于评论标签聚类的讨论
用户评论挖掘
这篇关于php - 淘宝用户评价标签如何实现的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文