其实我不是学工程的,只不过想用一下CRF++来培训一个语料库。来本版碰碰运气,看看
有没有高人懂或者用过。
这个CRF++的信息可以在下面这个网站找到。 http://chasen.org/~taku/software/CRF++/
这个网站上说语料库要格式化成如下的样式,最后一列就是你的语言模型将要预测的tag
。
He PRP B-NP
reckons VBZ B-VP
the DT B-NP
current JJ I-NP
account NN I-NP
deficit NN I-NP
will MD B-VP
narrow VB I-VP
to TO B-PP
only RB B-NP
# # I-NP
1.8 CD I-NP
billion CD I-NP
in IN B-PP
September NNP B-NP
我要培训一个part-of-speech tagged语料库。这个语料库是这样的