多语言实体链接工具包 Yahoo FEL

码农软件 · 软件分类 · WIKI系统 · 2020-02-04 09:12:49

软件介绍

Fast Entity Linker 用于训练模型,以将实体链接到文档和查询中的知识库(维基百科),是一款无监督、准确、可扩展多语言实体名称识别和链接系统,同时包含英语、西班牙语和中文数据包。

在算法上,使用了实体嵌入,click-log 数据和高效聚类等方法来实现高精度。该系统通过使用压缩数据结构和主动散列函数以实现低内存占用和快速执行。实体嵌入(Entity embeddings)是基于向量的表示,它捕获上下文中引用实体的方式。

目前,快速实体链接器(Fast Entity Linker)是仅有的三个可用于多语言实体命名识别和链接系统(其他是 DBpedia Spotlight 和 Babelfy)之一。除了独立的实体链接器,这一软件还包括了可用于创建和压缩来自维基百科的不同语言中的词/实体嵌入和数据包等工具。其中,包含了所有英语维基百科信息的数据包只有 2GB!

开源工具包中有许多可用的应用程序,其中之一是将情绪归于文本中检测到的实体,而不是整个文本本身。许多现有的情绪分析工具将与文本相关联的情感值整理作为一个整体处理,这使得系统很难跟踪用户对任何单独实体的情绪。使用我们的工具包,开发者们可以让系统自动提取给定文本中的“正面”和“负面”信息,从而更清楚地了解用户对各个单独实体的情绪。

本文地址:https://codercto.com/soft/d/24857.html

算法的乐趣

算法的乐趣

王晓华 / 人民邮电出版社 / 2015-4 / 79.00元

算法之大,大到可以囊括宇宙万物的运行规律;算法之小,小到寥寥数行代码即可展现一个神奇的功能。算法的应用和乐趣在生活中无处不在: 历法和二十四节气计算使用的是霍纳法则和求解一元高次方程的牛顿迭代法; 音频播放器跳动的实时频谱背后是离散傅立叶变换算法; DOS时代著名的PCX图像文件格式使用的是简单有效的RLE压缩算法; RSA加密算法的光环之下是朴实的欧几里德算法、蒙哥马利算......一起来看看 《算法的乐趣》 这本书的介绍吧!

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具