NLP-Chp9-句法分析

2018-07-14 NLP 0 Word Count: 714(words) Read Count: 2(minutes)

类型：

英语中的结构歧义随介词短语组合个数的增加而不断加深的，这个组合个数我们称之为开塔兰数，$C_N=\Bigg( \begin{aligned}2n \ n\end{aligned}\Bigg)\frac{1}{n+1}=\frac{(2n)!}{(n!)^2(n+1)}$

基本方法和开源的句法分析器：

Chart算法的时间复杂度为：
$O(Kn^3)$ (K 为一常数, n是句子长度)

在依存语法理论中，“依存”就是指词与词之间支配与被支配的关系，这种关系不是对等的，而是有方向的。

对依存图和依存树的形式约束为：

由此来保证句子的依存分析结果是一棵有“根(root) ”的树结构。

建立一个依存句法分析器一般需要完成以下三部分工作：

目前依存句法结构描述一般采用有向图方法或依存树方法，所采用的句法分析算法可大致归为以下4类：

无标记依存正确率(unlabeled attachment score, UA)：

所有词中找到其正确支配词的词所占的百分比，没有找到支配词的词(即根结点)也算在内。
带标记依存正确率(labeled attachment score, LA)：

所有词中找到其正确支配词并且依存关系类型也标注正确的词所占的百分比，根结点也算在内。
依存正确率(dependency accuracy, DA)：

所有非根结点词中找到其正确支配词的词所占的百分比。
根正确率(root accuracy, RA)：有两种定义方式：

本文链接： http://example.com/2018/07/14/NLP-Chp9-%E5%8F%A5%E6%B3%95%E5%88%86%E6%9E%90/

版权声明： 本博客所有文章除特别声明外，均采用 CC BY 4.0 CN协议许可协议。转载请注明出处！

xmz