问答

python – 非英语单词的词形还原?

 来源    2018-12-31    0  

我想应用词形还原来减少词语的屈折形式.我知道,对于英语WordNet提供了这样的功能,但我也有兴趣将词典化应用于荷兰语,法语,西班牙语和意大利语.有没有值得信赖和确认的方式来解决这个问题?谢谢!

尝试CLIPS的模式库,他们支持德语,英语,西班牙语,法语和意大利语.正是您所需要的:http://www.clips.ua.ac.be/pattern

不幸的是它只适用于Python 2,不支持Python3.

使用Python从文本中删除非英语单词
问答我正在对python进行数据清理练习,我正在清理的文本包含我想删除的意大利语单词.我一直在网上搜索我是否可以使用像nltk这样的工具包在Python上执行此操作. 例如给出一些文字: "Io ...
如何检查词是否是Python的英语单词?
问答我想检查一个Python程序,如果一个词在英语字典. 我相信nltk wordnet接口可能是去的方式,但我没有线索如何使用它这样一个简单的任务. def is_english_word(word): ...
python – 获取英语单词的基本形式
问答我试图获得一个英语单词的基本英语单词,该单词是从其基本形式修改的.这个问题已在这里提出,但我没有看到正确的答案,所以我试图这样说.我尝试了两个来自NLTK包的词干器和一个词形变换器,它们是搬运器,干扰 ...
python 输入英语单词,查看汉语意思
日志# -*- coding:utf-8 -*- import urllib2 import lxml.html as HTML def get_wordmean(): url = 'http://www ...
python – 单词列表的词形还原
问答所以我在文本文件中有一个单词列表.我想对它们进行词形还原以删除具有相同含义但处于不同时态的词.喜欢尝试,试过等.当我这样做时,我不断收到类似TypeError的错误:不可用的类型:'list' res ...
ruby – 正则表达式将非英语字母与非单词字符匹配
问答@raw_array[i]=~/[\W]/ 非常简单的正则表达式. 当我尝试使用一些非拉丁字母(俄语为具体)时,条件是错误的. 我该怎么办?::@raw_array[i] =~ /[\p{L}]/ 用 ...
php – 如何替换与非英语(UTF-8)单词交错的英语单词
问答如何匹配和替换与波斯语单词交错的英语单词? 波斯语字母不是拉丁语.问题是英语单词与波斯语单词交错(以从右到左书写)没有正确显示,除非它们被一个设置从左到右方向的跨度包围. 因此,我需要用 word替换 ...
shell-script – 非英语语言文本中的单词频率:如何合并单数和复数形式等?
问答我根据频率在一些文本文件中对法语单词进行排序,重点是洞察力而不是统计意义.挑战在于保留重音字符并在形成用于排序的单词标记的上下文中在元音(l',d')前面处理article forms. 文件中的mo ...
使用非英语语言对关键字和变量进行Python编程
问答我的最终目标是让知道乌尔都语而不是英语的人能够在Python环境中编程. 乌尔都语是从左到右书写的.我想有所有python关键字的Urdu版本,并使用Urdu字符来定义变量/函数/类名. 这个目标可能 ...
python – 即使verb.exc添加了正确的值,为什么NLTK词形还原输出有错误?
问答当我打开verb.exc时,我可以看到 saw see 虽然我在代码中使用了词形还原 >>>print lmtzr.lemmatize('saw', 'v') saw 怎么会发生这种 ...
如何在python中查找单词序列?
问答我有一个像这个example.txt的大文本文件: http://www.fullbooks.com/The-Jacket-Star-Rover-1.html 用awk: cat example.tx ...
Python:检查单词列表中的任何单词是否与正则表达式模式列表中的任何模式匹配
问答我在.txt文件中有很长的单词列表和regular expression patterns,我这样读了: with open(fileName, "r") as f1: patte ...
python – Keras seq2seq – 单词嵌入
问答我正在基于Keras的seq2seq创建一个生成的聊天机器人.我使用了这个站点的代码:https://machinelearningmastery.com/develop-encoder-decode ...
在HTML输入中写入非英语数字
问答我有一个ASP .Net核心Web应用程序,我正在使用Devextreme控件. 我的申请应该支持波斯语和阿拉伯语,包括数字和日期. 我有我的本地Windows键盘与波斯语,当我输入记事本,例如它显示 ...
非英语字符的正则表达式
问答我需要检查一些字符串是否包含任何非英文字符. x = c('Kält', 'normal', 'normal with, punctuation ~-+!', 'normal with number ...
delphi – 检查管理员用户登录非英语安装的Windows
问答我有一些小问题--我有一个程序,用于在数据库中存储用户列表,如果用户在列表中,则在程序启动时进行比较,或者在让用户使用之前是管理员.目前,我用来检查用户是否是管理员的方式只是将用户名与名为" ...
javascript – Airbnb react-dates日历与非英语语言环境
问答我试图使用非英语语言环境(波斯语)airbnb react-dates,一切正常,除了本月的第一天. 这些月份从波斯语(Jalaali)日历的第一天开始到第30天,从月的第10天开始,并持续到下个月的 ...
objective-c – 如何使用nspredicate对非英语字符串进行排序?
问答我正在使用排序描述符对获取请求的结果进行排序. NSFetchRequest* req = [[NSFetchRequest alloc] initWithEntityName:[MyEntity e ...
python – 匹配所有单词序列的正则表达式
问答我需要一个python正则表达式,它将匹配字符串中所有(非空)单词序列,假设word是非空白字符的任意非空序列. 有点像这样的东西: s = "ab cd efg" re.find ...