python crf中文分词(crf++工具)

python crf中文分词(crf++工具)

v0.58 官方版

大小:434KB 语言:简体中文

类别:编程工具 系统:WinXP, Win7, Win8, Win10

立即下载
  • python crf中文分词(crf++工具) v0.58 官方版 0

crf++是一款非常常用的变成开源工具,主要用于文本标注、分词等等,用户可以非常轻松的的完成各种变成任务。目前,crf++是国内最实用的一款软件,深受广大程序员们的喜爱。还在等什么!快来旋风软件园下载吧!

crf++软件内容

doc文件夹:就是官方主页的内容

example文件夹:有四个任务的训练数据(test.data)、测试数据(train.data)和模板文件(template),还有一个执行脚本文件exec.sh。

libcrffpp.dll:训练程序和测试程序需要使用的静态链接库。

clr_learn.exe:crf++的训练程序

crl_test.exe:crf++的测试程序

sdk文件夹:crf++的头文件和静态链接库。

crf++最新版下载

相关介绍

条件随机场(crf)由lafferty等人于2001年提出,结合了最大熵模型和隐马尔可夫模型的特点,是一种无向图模型,近年来在分词、词性标注和命名实体识别等序列标注任务中取得了很好的效果。条件随机场是一个典型的判别式模型,其联合概率可以写成若干势函数联乘的形式,其中最常用的是线性链条件随机场。若让x=(x1,x2,…xn)表示被观察的输入数据序列,y=(y1,y2,…yn)表示一个状态序列,在给定一个输入序列的情况下,线性链的crf模型定义状态序列的联合条件概率为

p(y|x)=exp{} (2-14)

z(x)={} (2-15)

其中:z是以观察序列x为条件的概率归一化因子;fj(yi-1,yi,x,i)是一个任意的特征函数;是每个特征函数的权值。

使用方法

1、解压后将crf_learn.exe crf_test.exe libcrfpp.dll文件复制到example文件夹的任意文件夹下

2、打开cmd命令行模式cd到1中目录。

3、输入指令crf_learn template train.data model即可生成model文件

更新时间:2020-02-07 11:19
包名:
MD5:406ba91db908a1151ca4957c51320d3b
相关应用
玩家评论
我要跟贴
取消
最新应用