python 中文分词

栏目: 编程工具 · 发布时间: 7年前

内容简介:最近写的那个机器人,我想让他更加智能些,比如根据用户回复的内容来进行判断该如何进行回复。但是要判断用户输入的内容是否符合预期其实还是比较费劲的。我这里使用

最近写的那个机器人,我想让他更加智能些,比如根据用户回复的内容来进行判断该如何进行回复。

但是要判断用户输入的内容是否符合预期其实还是比较费劲的。

我这里使用 jieba 这个 python 库。

安装库

pip3 install  jieba

官网的例子可以看下

import jieba

content = "好的,谢谢,我的问题已经解决了"
seg_list = jieba.cut(content, cut_all=False)

key = []
for i in seg_list:
    key.append(i)


print(key)



listcontent = ["好","好的","谢谢","可以了","明白","感谢","好评"]


count = int(len(list(set(listcontent).intersection(set(key)))))

print(count)

输出

['好', '的', ',', '谢谢', ',', '我', '的', '问题', '已经', '解决', '了']

我判断下 A 和 B 2个 list 是否有交集大概可以判断用户的问题是什么?但其实并不特别准。

另外关于 python list 比较我这里也收集了些资料

#求交集的两种方式
   retA = [i for i in listA if i in listB]
   retB = list(set(listA).intersection(set(listB)))

   print "retA is: ",retA
   print "retB is: ",retB

   #求并集
   retC = list(set(listA).union(set(listB)))
   print "retC1 is: ",retC

   #求差集,在B中但不在A中
   retD = list(set(listB).difference(set(listA)))
   print "retD is: ",retD

   retE = [i for i in listB if i not in listA]
   print "retE is: ",retE

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

UML基础、案例与应用

UML基础、案例与应用

施穆勒 / 李虎、赵龙刚 / 人民邮电出版社 / 2004-7-1 / 42.00元

本书教读者循序渐进地、系统地学习UML基础知识和应用技术。和前一版相比,本书内容根据UML 2.0进行了补充和更新,随书光盘包含了建模工具Poseidon的试用版。 全书分为三部分24章。第一部分“基础知识”包括第1章到第15章,主要是介绍UML语言的基础知识以及面向对象的概念和思想,还简单介绍了UML在开发过程的应用方法。第二部分“学习案例”包括第16章到第22章,结合实例详细分析了UML的应用......一起来看看 《UML基础、案例与应用》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

SHA 加密
SHA 加密

SHA 加密工具

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试