php - 淘宝用户评价标签如何实现

查看:247
本文介绍了php - 淘宝用户评价标签如何实现的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

问 题

像淘宝这种自动从评论里面获取变成标签的功能是如何实现的 有大神知道吗

解决方案

楼主这个问题就比较深了,牵涉到数据挖掘和自然语言处理等方面了。不是在sf几个demo代码就能给你解决的,不过可以提供一个思路给你。你自己搜搜相关资料仿一个就好了。
你可以看一下google的开源项目word2vec,这个可以用来做评论的挖掘然后做聚类分析。
那么,实现类似淘宝的这种聚类分析的效果怎么做呢?

  1. 收集所有评论,也就是获取你们自己的所有评论。

  2. 训练评论词向量,这里可以用斯坦福大学开源的CoreNLP来做中文分词,然后用google的word2vec来训练出词向量。

  3. 制定抽取规则,根据上面分析出的结果,制定出抽取的规则。

  4. 聚类去重,利用算法对抽取的候选标签去重

  5. 计算聚类中心,获得聚类最中心的标签作为显示的关键词。

另,在知乎有人对这个进行过讨论,你可以去参考一下。附上几个链接:
自然语言处理之Word2Vec
知乎关于评论标签聚类的讨论
用户评论挖掘

这篇关于php - 淘宝用户评价标签如何实现的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆