m******r 发帖数: 42 | 1 如何把一个英语string分成句子?我直接用separator或者Regex都可以做,
但想不出来如何处理i.e. e.g.这类词。比如这句话应该是判断为一个句子:
He's looking for his host, i.e. the person who'll travel with him.
中间那个"i.e."把我的分割方法全破坏了。有什么好的处理方法吗? |
d****o 发帖数: 1055 | 2 一般就用句号分割。
但是遇到你这种特殊得,就考虑一下特殊情况。
【在 m******r 的大作中提到】 : 如何把一个英语string分成句子?我直接用separator或者Regex都可以做, : 但想不出来如何处理i.e. e.g.这类词。比如这句话应该是判断为一个句子: : He's looking for his host, i.e. the person who'll travel with him. : 中间那个"i.e."把我的分割方法全破坏了。有什么好的处理方法吗?
|
m******r 发帖数: 42 | 3 我觉得建立一个特殊词的lookup table好像也不靠谱啊。
【在 d****o 的大作中提到】 : 一般就用句号分割。 : 但是遇到你这种特殊得,就考虑一下特殊情况。
|
h****e 发帖数: 928 | |
g****y 发帖数: 240 | 5 如果每句话的开始都是capital letter的话,可以用python的lookahead assertion
regex:
\.(?!\s*[a-z])
【在 m******r 的大作中提到】 : 如何把一个英语string分成句子?我直接用separator或者Regex都可以做, : 但想不出来如何处理i.e. e.g.这类词。比如这句话应该是判断为一个句子: : He's looking for his host, i.e. the person who'll travel with him. : 中间那个"i.e."把我的分割方法全破坏了。有什么好的处理方法吗?
|