使用model.predict测试Keras情感分类 [英] Testing the Keras sentiment classification with model.predict

查看:168
本文介绍了使用model.predict测试Keras情感分类的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我已经在PC上训练了imdb_lstm.py. 现在,我想通过输入自己的一些文本来测试经过训练的网络.我该怎么做? 谢谢!

I have trained the imdb_lstm.py on my PC. Now I want to test the trained network by inputting some text of my own. How do I do it? Thank you!

推荐答案

所以您基本上需要做的是:

So what you basically need to do is as follows:

  1. 标记序列:将字符串转换为单词(功能):例如:你好,我的名字叫乔治",改成[你好",我",名字",是",乔治"].
  2. 接下来,您要删除停用词(检查Google停用词是什么).
  3. 此阶段是可选的,可能会导致错误的结果,但我认为值得尝试.阻止您的字词(功能),这样可以减少功能数量,从而加快运行速度.同样,这是可选的,并且可能导致某些故障,例如:如果您阻止停车"一词,则会得到停车",其含义是不同的.
  4. 接下来要做的是创建字典(请检查Google).每个单词都有一个唯一的编号,从这一点来看,我们将仅使用该编号.
  5. 计算机只能理解数字,因此我们需要用他们的语言进行交谈.我们将从第4阶段开始使用字典,然后将语料库中的每个单词替换为其匹配的数字.
  6. 现在,我们需要将数据集分为两组:训练集和测试集.第一个(训练)将训练我们的NN模型,第二个(测试)将帮助我们弄清楚我们的NN有多好.您可以使用Keras的交叉验证功能.
  7. 接下来的事情是定义我们的NN可以作为输入获得的最大特征数量. Keras将此参数称为"maxlen".但是您实际上并不需要手动执行此操作,Keras可以通过搜索语料库中最长的句子来自动执行此操作.
  8. 接下来,假设Keras发现语料库中最长的句子有20个单词(功能),而其中一个句子就是第一阶段的示例,其长度为5(如果我们要删除停用词,它会更短),在这种情况下,我们需要添加零,实际上需要添加15个零.这就是所谓的填充序列,我们这样做是为了使每个输入序列都具有相同的长度.

这篇关于使用model.predict测试Keras情感分类的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
相关文章
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆