博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Spacy 使用
阅读量:5009 次
发布时间:2019-06-12

本文共 405 字,大约阅读时间需要 1 分钟。

# 前提是必须安装: python -m spacy download en nlp = spacy.load('en') text = u"you are best. it is lemmatize test for spacy. I love these books. amines (when protonated)" doc = nlp(text) # 观察分词 token = [t for t in doc] # 分词我们就用这个orth_  可以识别标点符号 token2 = [token.orth_ for token in doc] # 观察词干化 lemma = [l.lemma_ for l in doc] # 词性标注 pos = [p.pos_ for p in doc]

转载于:https://www.cnblogs.com/demo-deng/p/10115976.html

你可能感兴趣的文章
POJ 1860 Currency Exchange(SPFA 判断有无“正”环)
查看>>
angular6项目中使用scss
查看>>
书籍阅读目录(给愚钝的自己)
查看>>
-[UIKeyboardLayoutStar release]: message sent to deallocated instance
查看>>
无法执行该操作,因为链接服务器 "XXX" 的 OLE DB 访问接口 "SQLNCLI10" 无法启动分布式事务。...
查看>>
JDK7 新特性
查看>>
广告地址屏蔽
查看>>
收缩SqlServer数据库日记方法
查看>>
每日英语:15 places to find inspiration
查看>>
as3播放视频卡的解决方法
查看>>
python3 re模块正则匹配字符串中的时间信息
查看>>
BCP IN示例
查看>>
cacheline基本理论
查看>>
Linux-信号
查看>>
font-awesome
查看>>
数学专业的数学与计算机专业的数学的比较(转)
查看>>
力扣—— 删除字符串中的所有相邻重复项
查看>>
期末总结
查看>>
哎呀,我老大写Bug啦——记一次MessageQueue的优化
查看>>
Hive 的基本概念
查看>>