{ "cells": [ { "cell_type": "markdown", "metadata": { "id": "BZPSH4VkK7J2" }, "source": [ "欢迎来到HanLP在线交互环境,这是一个Jupyter记事本,可以输入任意Python代码并在线执行。请点击左上角【Run】来运行这篇NLP教程。\n", "\n", "\n", "\n" ] }, { "cell_type": "markdown", "metadata": { "id": "XxPAiNwSK7J4" }, "source": [ "## 安装\n", "量体裁衣,HanLP提供**RESTful**(云端)和**native**(本地)两种API,分别面向轻量级和海量级两种场景。无论何种API何种语言,HanLP接口在语义上保持一致,你可以**任选一种**API来运行本教程。\n", "\n", "### 轻量级RESTful API\n", "\n", "仅数KB,适合敏捷开发、移动APP等场景。简单易用,无需GPU配环境,**强烈推荐**,秒速安装:\n" ] }, { "cell_type": "code", "execution_count": 1, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "lgMa4kbfK7J5", "outputId": "5bb662d8-1665-4bcc-c517-70d1c4bc4837" }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Requirement already satisfied: hanlp_restful in /usr/local/lib/python3.7/dist-packages (0.0.7)\n", "Requirement already satisfied: hanlp-common in /usr/local/lib/python3.7/dist-packages (from hanlp_restful) (0.0.9)\n", "Requirement already satisfied: phrasetree in /usr/local/lib/python3.7/dist-packages (from hanlp-common->hanlp_restful) (0.0.8)\n" ] } ], "source": [ "!pip install hanlp_restful" ] }, { "cell_type": "markdown", "metadata": { "id": "N4G6GbNmK7J6" }, "source": [ "创建客户端,填入服务器地址:" ] }, { "cell_type": "code", "execution_count": 2, "metadata": { "id": "3XM9-3-oK7J6" }, "outputs": [], "source": [ "from hanlp_restful import HanLPClient\n", "HanLP = HanLPClient('https://www.hanlp.com/api', auth=None, language='zh') # auth不填则匿名,zh中文,mul多语种" ] }, { "cell_type": "markdown", "metadata": { "id": "pbeFH9jmK7J7" }, "source": [ "调用`parse`接口,传入一篇文章,得到HanLP精准的分析结果。" ] }, { "cell_type": "code", "execution_count": 3, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "mNJPvZ_3K7J7", "outputId": "4048d0d6-2dad-4582-e327-f99338f8f72b" }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "{\n", " \"tok/fine\": [\n", " [\"2021年\", \"HanLPv2.1\", \"为\", \"生产\", \"环境\", \"带来\", \"次\", \"世代\", \"最\", \"先进\", \"的\", \"多\", \"语种\", \"NLP\", \"技术\", \"。\"],\n", " [\"阿婆主\", \"来到\", \"北京\", \"立方庭\", \"参观\", \"自然\", \"语义\", \"科技\", \"公司\", \"。\"]\n", " ],\n", " \"tok/coarse\": [\n", " [\"2021年\", \"HanLPv2.1\", \"为\", \"生产环境\", \"带来\", \"次世代\", \"最\", \"先进\", \"的\", \"多语种\", \"NLP\", \"技术\", \"。\"],\n", " [\"阿婆主\", \"来到\", \"北京立方庭\", \"参观\", \"自然语义科技公司\", \"。\"]\n", " ],\n", " \"pos/ctb\": [\n", " [\"NT\", \"NR\", \"P\", \"NN\", \"NN\", \"VV\", \"JJ\", \"NN\", \"AD\", \"JJ\", \"DEG\", \"CD\", \"NN\", \"NR\", \"NN\", \"PU\"],\n", " [\"NN\", \"VV\", \"NR\", \"NR\", \"VV\", \"NN\", \"NN\", \"NN\", \"NN\", \"PU\"]\n", " ],\n", " \"pos/pku\": [\n", " [\"t\", \"nx\", \"p\", \"vn\", \"n\", \"v\", \"b\", \"n\", \"d\", \"a\", \"u\", \"a\", \"n\", \"nx\", \"n\", \"w\"],\n", " [\"n\", \"v\", \"ns\", \"ns\", \"v\", \"n\", \"n\", \"n\", \"n\", \"w\"]\n", " ],\n", " \"pos/863\": [\n", " [\"nt\", \"w\", \"p\", \"v\", \"n\", \"v\", \"a\", \"nt\", \"d\", \"a\", \"u\", \"a\", \"n\", \"ws\", \"n\", \"w\"],\n", " [\"n\", \"v\", \"ns\", \"n\", \"v\", \"n\", \"n\", \"n\", \"n\", \"w\"]\n", " ],\n", " \"ner/msra\": [\n", " [[\"2021年\", \"DATE\", 0, 1], [\"HanLPv2.1\", \"ORGANIZATION\", 1, 2]],\n", " [[\"北京立方庭\", \"LOCATION\", 2, 4], [\"自然语义科技公司\", \"ORGANIZATION\", 5, 9]]\n", " ],\n", " \"ner/pku\": [\n", " [],\n", " [[\"北京立方庭\", \"ns\", 2, 4], [\"自然语义科技公司\", \"nt\", 5, 9]]\n", " ],\n", " \"ner/ontonotes\": [\n", " [[\"2021年\", \"DATE\", 0, 1], [\"HanLPv2.1\", \"ORG\", 1, 2]],\n", " [[\"北京立方庭\", \"FAC\", 2, 4], [\"自然语义科技公司\", \"ORG\", 5, 9]]\n", " ],\n", " \"srl\": [\n", " [[[\"2021年\", \"ARGM-TMP\", 0, 1], [\"HanLPv2.1\", \"ARG0\", 1, 2], [\"为生产环境\", \"ARG2\", 2, 5], [\"带来\", \"PRED\", 5, 6], [\"次世代最先进的多语种NLP技术\", \"ARG1\", 6, 15]], [[\"最\", \"ARGM-ADV\", 8, 9], [\"先进\", \"PRED\", 9, 10], [\"技术\", \"ARG0\", 14, 15]]],\n", " [[[\"阿婆主\", \"ARG0\", 0, 1], [\"来到\", \"PRED\", 1, 2], [\"北京立方庭\", \"ARG1\", 2, 4]], [[\"阿婆主\", \"ARG0\", 0, 1], [\"参观\", \"PRED\", 4, 5], [\"自然语义科技公司\", \"ARG1\", 5, 9]]]\n", " ],\n", " \"dep\": [\n", " [[6, \"tmod\"], [6, \"nsubj\"], [6, \"prep\"], [5, \"nn\"], [3, \"pobj\"], [0, \"root\"], [8, \"amod\"], [15, \"nn\"], [10, \"advmod\"], [15, \"rcmod\"], [10, \"assm\"], [13, \"nummod\"], [15, \"nn\"], [15, \"nn\"], [6, \"dobj\"], [6, \"punct\"]],\n", " [[2, \"nsubj\"], [0, \"root\"], [4, \"nn\"], [2, \"dobj\"], [2, \"conj\"], [9, \"nn\"], [9, \"nn\"], [9, \"nn\"], [5, \"dobj\"], [2, \"punct\"]]\n", " ],\n", " \"sdp\": [\n", " [[[6, \"Time\"]], [[6, \"Exp\"]], [[5, \"mPrep\"]], [[5, \"Desc\"]], [[6, \"Datv\"]], [[13, \"dDesc\"]], [[0, \"Root\"], [8, \"Desc\"], [13, \"Desc\"]], [[15, \"Time\"]], [[10, \"mDegr\"]], [[15, \"Desc\"]], [[10, \"mAux\"]], [[8, \"Quan\"], [13, \"Quan\"]], [[15, \"Desc\"]], [[15, \"Nmod\"]], [[6, \"Pat\"]], [[6, \"mPunc\"]]],\n", " [[[2, \"Agt\"], [5, \"Agt\"]], [[0, \"Root\"]], [[4, \"Loc\"]], [[2, \"Lfin\"]], [[2, \"ePurp\"]], [[8, \"Nmod\"]], [[9, \"Nmod\"]], [[9, \"Nmod\"]], [[5, \"Datv\"]], [[5, \"mPunc\"]]]\n", " ],\n", " \"con\": [\n", " [\"TOP\", [[\"IP\", [[\"NP\", [[\"NT\", [\"2021年\"]]]], [\"NP\", [[\"NR\", [\"HanLPv2.1\"]]]], [\"VP\", [[\"PP\", [[\"P\", [\"为\"]], [\"NP\", [[\"NN\", [\"生产\"]], [\"NN\", [\"环境\"]]]]]], [\"VP\", [[\"VV\", [\"带来\"]], [\"NP\", [[\"ADJP\", [[\"NP\", [[\"ADJP\", [[\"JJ\", [\"次\"]]]], [\"NP\", [[\"NN\", [\"世代\"]]]]]], [\"ADVP\", [[\"AD\", [\"最\"]]]], [\"VP\", [[\"JJ\", [\"先进\"]]]]]], [\"DEG\", [\"的\"]], [\"NP\", [[\"QP\", [[\"CD\", [\"多\"]]]], [\"NP\", [[\"NN\", [\"语种\"]]]]]], [\"NP\", [[\"NR\", [\"NLP\"]], [\"NN\", [\"技术\"]]]]]]]]]], [\"PU\", [\"。\"]]]]]],\n", " [\"TOP\", [[\"IP\", [[\"NP\", [[\"NN\", [\"阿婆主\"]]]], [\"VP\", [[\"VP\", [[\"VV\", [\"来到\"]], [\"NP\", [[\"NR\", [\"北京\"]], [\"NR\", [\"立方庭\"]]]]]], [\"VP\", [[\"VV\", [\"参观\"]], [\"NP\", [[\"NN\", [\"自然\"]], [\"NN\", [\"语义\"]], [\"NN\", [\"科技\"]], [\"NN\", [\"公司\"]]]]]]]], [\"PU\", [\"。\"]]]]]]\n", " ]\n", "}\n" ] } ], "source": [ "doc = HanLP.parse(\"2021年HanLPv2.1为生产环境带来次世代最先进的多语种NLP技术。阿婆主来到北京立方庭参观自然语义科技公司。\")\n", "print(doc)" ] }, { "cell_type": "markdown", "metadata": { "id": "w4E8Kn_nK7J8" }, "source": [ "#### 可视化\n", "输出结果是一个可以`json`化的`dict`,键为[NLP任务名](https://hanlp.hankcs.com/docs/data_format.html#naming-convention),值为分析结果。关于标注集含义,请参考[《语言学标注规范》](https://hanlp.hankcs.com/docs/annotations/index.html)及[《格式规范》](https://hanlp.hankcs.com/docs/data_format.html)。我们购买、标注或采用了世界上量级最大、种类最多的语料库用于联合多语种多任务学习,所以HanLP的标注集也是覆盖面最广的。通过`doc.pretty_print`,可以在等宽字体环境中得到可视化,你需要取消换行才能对齐可视化结果。我们已经发布HTML环境的可视化,在Jupyter Notebook中自动对齐中文。" ] }, { "cell_type": "code", "execution_count": 4, "metadata": { "colab": { "base_uri": "https://localhost:8080/", "height": 575 }, "id": "GZ79la4LK7J8", "outputId": "b9bd5dc0-52f9-4b42-93fd-7c4e49214ace" }, "outputs": [ { "data": { "text/html": [ "
Dep Tree
────────────
┌─────────►
│┌────────►
││┌─►┌─────
│││ │ ┌─►
│││ └─►└──
┌┼┴┴────────
││ ┌─►
││ ┌───►└──
││ │ ┌─►
││ │┌──►├──
││ ││ └─►
││ ││ ┌─►
││ ││┌─►└──
││ │││ ┌─►
│└─►└┴┴──┴──
└──────────►
Token
─────────
2021年
HanLPv2.1
为
生产
环境
带来
次
世代
最
先进
的
多
语种
NLP
技术
。
Relati
──────
tmod
nsubj
prep
nn
pobj
root
amod
nn
advmod
rcmod
assm
nummod
nn
nn
dobj
punct
PoS
───
NT
NR
P
NN
NN
VV
JJ
NN
AD
JJ
DEG
CD
NN
NR
NN
PU
Tok
─────────
2021年
HanLPv2.1
为
生产
环境
带来
次
世代
最
先进
的
多
语种
NLP
技术
。
NER Type
────────────────
───►DATE
───►ORGANIZATION
Tok
─────────
2021年
HanLPv2.1
为
生产
环境
带来
次
世代
最
先进
的
多
语种
NLP
技术
。
SRL PA1
────────────
───►ARGM-TMP
───►ARG0
◄─┐
├►ARG2
◄─┘
╟──►PRED
◄─┐
│
│
│
├►ARG1
│
│
│
◄─┘
Tok
─────────
2021年
HanLPv2.1
为
生产
环境
带来
次
世代
最
先进
的
多
语种
NLP
技术
。
SRL PA2
────────────
───►ARGM-ADV
╟──►PRED
───►ARG0
Tok
─────────
2021年
HanLPv2.1
为
生产
环境
带来
次
世代
最
先进
的
多
语种
NLP
技术
。
PoS 3 4 5 6 7 8 9
─────────────────────────────────────────────────────────
NT ───────────────────────────────────────────►NP ───┐
NR ───────────────────────────────────────────►NP────┤
P ───────────┐ │
NN ──┐ ├────────────────────────►PP ───┐ │
NN ──┴►NP ───┘ │ │
VV ──────────────────────────────────┐ │ │
JJ ───►ADJP──┐ │ ├►VP────┤
NN ───►NP ───┴►NP ───┐ │ │ │
AD ───────────►ADVP──┼►ADJP──┐ ├►VP ───┘ ├►IP
JJ ───────────►VP ───┘ │ │ │
DEG──────────────────────────┤ │ │
CD ───►QP ───┐ ├►NP ───┘ │
NN ───►NP ───┴────────►NP────┤ │
NR ──┐ │ │
NN ──┴────────────────►NP ───┘ │
PU ──────────────────────────────────────────────────┘
Dep Tree
────────────
┌─►
┌┬────┬──┴──
││ │ ┌─►
││ └─►└──
│└─►┌───────
│ │ ┌───►
│ │ │┌──►
│ │ ││┌─►
│ └─►└┴┴──
└──────────►
Tok
───
阿婆主
来到
北京
立方庭
参观
自然
语义
科技
公司
。
Relat
─────
nsubj
root
nn
dobj
conj
nn
nn
nn
dobj
punct
Po
──
NN
VV
NR
NR
VV
NN
NN
NN
NN
PU
Tok
───
阿婆主
来到
北京
立方庭
参观
自然
语义
科技
公司
。
NER Type
────────────────
◄─┐
◄─┴►LOCATION
◄─┐
│
├►ORGANIZATION
◄─┘
Tok
───
阿婆主
来到
北京
立方庭
参观
自然
语义
科技
公司
。
SRL PA1
────────
───►ARG0
╟──►PRED
◄─┐
◄─┴►ARG1
Tok
───
阿婆主
来到
北京
立方庭
参观
自然
语义
科技
公司
。
SRL PA2
────────
───►ARG0
╟──►PRED
◄─┐
│
├►ARG1
◄─┘
Tok
───
阿婆主
来到
北京
立方庭
参观
自然
语义
科技
公司
。
Po 3 4 5 6
────────────────────────────────
NN───────────────────►NP ───┐
VV──────────┐ │
NR──┐ ├►VP ───┐ │
NR──┴►NP ───┘ │ │
VV──────────┐ ├►VP────┤
NN──┐ │ │ ├►IP
NN │ ├►VP ───┘ │
NN ├►NP ───┘ │
NN──┘ │
PU──────────────────────────┘
Dep Tree
────────────
┌─────────►
│┌────────►
││┌─►┌─────
│││ │ ┌─►
│││ └─►└──
┌┼┴┴────────
││ ┌─►
││ ┌───►└──
││ │ ┌─►
││ │┌──►├──
││ ││ └─►
││ ││ ┌─►
││ ││┌─►└──
││ │││ ┌─►
│└─►└┴┴──┴──
└──────────►
Token
─────────
2021年
HanLPv2.1
为
生产
环境
带来
次
世代
最
先进
的
多
语种
NLP
技术
。
Relati
──────
tmod
nsubj
prep
nn
pobj
root
amod
nn
advmod
rcmod
assm
nummod
nn
nn
dobj
punct
PoS
───
NT
NR
P
NN
NN
VV
JJ
NN
AD
JJ
DEG
CD
NN
NR
NN
PU
Tok
─────────
2021年
HanLPv2.1
为
生产
环境
带来
次
世代
最
先进
的
多
语种
NLP
技术
。
NER Type
────────
───►DATE
───►WWW
Tok
─────────
2021年
HanLPv2.1
为
生产
环境
带来
次
世代
最
先进
的
多
语种
NLP
技术
。
SRL PA1
────────────
───►ARGM-TMP
───►ARG0
◄─┐
├►ARG2
◄─┘
╟──►PRED
◄─┐
│
│
│
├►ARG1
│
│
│
◄─┘
Tok
─────────
2021年
HanLPv2.1
为
生产
环境
带来
次
世代
最
先进
的
多
语种
NLP
技术
。
SRL PA2
────────────
───►ARGM-ADV
╟──►PRED
───►ARG0
Tok
─────────
2021年
HanLPv2.1
为
生产
环境
带来
次
世代
最
先进
的
多
语种
NLP
技术
。
PoS 3 4 5 6 7 8 9
─────────────────────────────────────────────────────────
NT ───────────────────────────────────────────►NP ───┐
NR ───────────────────────────────────────────►NP────┤
P ───────────┐ │
NN ──┐ ├────────────────────────►PP ───┐ │
NN ──┴►NP ───┘ │ │
VV ──────────────────────────────────┐ │ │
JJ ───►ADJP──┐ │ ├►VP────┤
NN ───►NP ───┴►NP ───┐ │ │ │
AD ───────────►ADVP──┼►ADJP──┐ ├►VP ───┘ ├►IP
JJ ───────────►VP ───┘ │ │ │
DEG──────────────────────────┤ │ │
CD ───►QP ───┐ ├►NP ───┘ │
NN ───►NP ───┴────────►NP────┤ │
NR ──┐ │ │
NN ──┴────────────────►NP ───┘ │
PU ──────────────────────────────────────────────────┘
Dep Tree
────────────
┌─►
┌┬────┬──┴──
││ │ ┌─►
││ └─►└──
│└─►┌───────
│ │ ┌───►
│ │ │┌──►
│ │ ││┌─►
│ └─►└┴┴──
└──────────►
Tok
───
阿婆主
来到
北京
立方庭
参观
自然
语义
科技
公司
。
Relat
─────
nsubj
root
nn
dobj
conj
nn
nn
nn
dobj
punct
Po
──
NN
VV
NR
NR
VV
NN
NN
NN
NN
PU
Tok
───
阿婆主
来到
北京
立方庭
参观
自然
语义
科技
公司
。
NER Type
────────────────
───►LOCATION
───►LOCATION
◄─┐
│
├►ORGANIZATION
◄─┘
Tok
───
阿婆主
来到
北京
立方庭
参观
自然
语义
科技
公司
。
SRL PA1
────────
───►ARG0
╟──►PRED
◄─┐
◄─┴►ARG1
Tok
───
阿婆主
来到
北京
立方庭
参观
自然
语义
科技
公司
。
SRL PA2
────────
───►ARG0
╟──►PRED
◄─┐
│
├►ARG1
◄─┘
Tok
───
阿婆主
来到
北京
立方庭
参观
自然
语义
科技
公司
。
Po 3 4 5 6
────────────────────────────────
NN───────────────────►NP ───┐
VV──────────┐ │
NR──┐ ├►VP ───┐ │
NR──┴►NP ───┘ │ │
VV──────────┐ ├►VP────┤
NN──┐ │ │ ├►IP
NN │ ├►VP ───┘ │
NN ├►NP ───┘ │
NN──┘ │
PU──────────────────────────┘
阿婆主 来到 北京 立方庭 参观 自然 语义 科技 公司 。
阿婆主 来到 北京立方庭 参观 自然语义科技公司 。
阿婆主/n 来到/v 北京/ns 立方庭/ns 参观/v 自然/n 语义/n 科技/n 公司/n 。/w
阿婆主/n 来到/v 北京立方庭/ns 参观/v 自然语义科技公司/n 。/w
Tok
───
阿婆主
来到
北京
立方庭
参观
自然
语义
科技
公司
。
NER Type
────────────────
───►LOCATION
───►LOCATION
◄─┐
│
├►ORGANIZATION
◄─┘
Dep Tree
────────────
┌─►
┌┬────┬──┴──
││ │ ┌─►
││ └─►└──
│└─►┌───────
│ │ ┌───►
│ │ │┌──►
│ │ ││┌─►
│ └─►└┴┴──
└──────────►
Tok
───
阿婆主
来到
北京
立方庭
参观
自然
语义
科技
公司
。
Relat
─────
nsubj
root
nn
dobj
conj
nn
nn
nn
dobj
punct
Po
──
NN
VV
NR
NR
VV
NN
NN
NN
NN
PU
Tok
───
阿婆主
来到
北京
立方庭
参观
自然
语义
科技
公司
。
Po 3 4 5 6
────────────────────────────────
NN───────────────────►NP ───┐
VV──────────┐ │
NR──┐ ├►VP ───┐ │
NR──┴►NP ───┘ │ │
VV──────────┐ ├►VP────┤
NN──┐ │ │ ├►IP
NN │ ├►VP ───┘ │
NN ├►NP ───┘ │
NN──┘ │
PU──────────────────────────┘
Dep Tree
──────────────
┌─►
┌─────────►├──
│ └─►
│ ┌────────►
│ │┌───────►
│ ││ ┌─►
│ ││┌───►├──
│ │││ └─►
│ │││┌─────►
│ ││││┌────►
│ │││││┌───►
│ ││││││┌──►
│ │││││││┌─►
│┌─►└┴┴┴┴┴┴┼──
││ └─►
││ ┌─►
││ ┌─►├──
││ │ └─►
└┴──────┴┬┬┬──
││└─►
│└──►
└───►
Token
─────────
2021
年
、
HanLPv2.1
は
次
世代
の
最
先端
多
言語
NLP
技術
を
本番
環境
に
導入
し
ます
。
Relation
────────
nummod
obl
punct
compound
case
compound
nmod
case
compound
compound
compound
compound
compound
obj
case
compound
obl
case
root
aux
aux
punct
PoS
───
NUM
CL
PU
NPR
P
N
N
P
N
N
NUM
N
N
N
P
N
N
P
VB
VB0
AX
PU
Tok
─────────
2021
年
、
HanLPv2.1
は
次
世代
の
最
先端
多
言語
NLP
技術
を
本番
環境
に
導入
し
ます
。
NER Type
────────────
◄─┐
◄─┴►DATE
───►ARTIFACT
Tok
─────────
2021
年
、
HanLPv2.1
は
次
世代
の
最
先端
多
言語
NLP
技術
を
本番
環境
に
導入
し
ます
。
SRL PA1
────────
───►修飾
╟──►PRED
Tok
─────────
2021
年
、
HanLPv2.1
は
次
世代
の
最
先端
多
言語
NLP
技術
を
本番
環境
に
導入
し
ます
。
SRL PA3
────────
◄─┐
◄─┴►修飾
╟──►PRED
Tok
─────────
2021
年
、
HanLPv2.1
は
次
世代
の
最
先端
多
言語
NLP
技術
を
本番
環境
に
導入
し
ます
。
SRL PA4
────────
◄─┐
│
│
├►修飾
│
◄─┘
◄─┐
◄─┴►ノ
╟──►PRED
Tok
─────────
2021
年
、
HanLPv2.1
は
次
世代
の
最
先端
多
言語
NLP
技術
を
本番
環境
に
導入
し
ます
。
SRL PA5
────────
───►修飾
╟──►PRED
Tok
─────────
2021
年
、
HanLPv2.1
は
次
世代
の
最
先端
多
言語
NLP
技術
を
本番
環境
に
導入
し
ます
。
SRL PA6
────────
◄─┐
├►時間
◄─┘
◄─┐
◄─┴►ガ
◄─┐
│
│
│
│
├►ヲ
│
│
│
◄─┘
◄─┐
├►ニ
◄─┘
╟──►PRED
Tok
─────────
2021
年
、
HanLPv2.1
は
次
世代
の
最
先端
多
言語
NLP
技術
を
本番
環境
に
導入
し
ます
。
PoS 3 4 5 6 7 8
────────────────────────────────────────────────────
NUM──┐
CL ──┴►NUMCLP──────── ───────────────────►NP ───┐
PU ──────── ───────── ──────────────────────────┤
NPR───►NP ─────┐ │
P ───────── ───┴►──── ───────────────────►PP────┤
N ───┐ │
N ───┴►NP ─────┐ │
P ───────── ───┴►PP ────┐ │
N ───────── ───────── │ │
N ────►NP ──────►CONJP──┤ │
NUM──────── ───────── ├►NML ──┐ │
N ───────── ───────── │ │ ├►IP
N ───────── ───────── ──┘ ├►NP ───┐ │
N ───────── ───────── ──────────┘ ├►PP────┤
P ───────── ───────── ──────────────────┘ │
N ───┐ │
N ───┴►NP ─────┐ │
P ───────── ───┴►──── ───────────────────►PP────┤
VB ──────── ───────── ──────────────────────────┤
VB0──────── ───────── ──────────────────────────┤
AX ──────── ───────── ──────────────────────────┤
PU ──────── ───────── ──────────────────────────┘
Dep Tree
──────────────
┌─►
┌─────────►├──
│ └─►
│ ┌─────►
│ │┌────►
│ ││┌───►
│ │││┌──►
│ ││││┌─►
│ ┌─►└┴┴┴┼──
│ │ └─►
│ │ ┌─►
│ │ ┌─►└──
│ │ │ ┌─►
│ │┌─►└──┼──
│ ││ └─►
│┌─►└┴─────┬──
││ └─►
││ ┌──►
││ │┌─►
││ ┌─►┌┬┼┼──
││ │ │││└─►
││ │ ││└──►
││ │ │└───►
││ │ └────►
││ │ ┌─►
└┴───┴────┬┼──
│└─►
└──►
Toke
────
奈須
きのこ
は
1973
年
11
月
28
日
に
千葉
県
円空
山
で
生まれ
、
ゲーム
制作
会社
「
ノーツ
」
の
設立
者
だ
。
Relation
────────
compound
nsubj
case
compound
compound
compound
compound
nummod
obl
case
compound
nmod
compound
obl
case
acl
punct
compound
compound
nmod
punct
compound
punct
case
compound
root
cop
punct
PoS
───
NPR
NPR
P
NUM
CL
NUM
CL
NUM
CL
P
NPR
NPR
NPR
NPR
P
VB
PU
N
N
N
PUL
NPR
PUR
P
N
N
AX
PU
Tok
────
奈須
きのこ
は
1973
年
11
月
28
日
に
千葉
県
円空
山
で
生まれ
、
ゲーム
制作
会社
「
ノーツ
」
の
設立
者
だ
。
NER Type
────────────────
◄─┐
◄─┴►PERSON
◄─┐
│
│
├►DATE
│
◄─┘
◄─┐
│
├►LOCATION
◄─┘
───►ORGANIZATION
Tok
────
奈須
きのこ
は
1973
年
11
月
28
日
に
千葉
県
円空
山
で
生まれ
、
ゲーム
制作
会社
「
ノーツ
」
の
設立
者
だ
。
SRL PA1
────────
◄─┐
◄─┴►ノ?
╟──►PRED
Tok
────
奈須
きのこ
は
1973
年
11
月
28
日
に
千葉
県
円空
山
で
生まれ
、
ゲーム
制作
会社
「
ノーツ
」
の
設立
者
だ
。
SRL PA2
────────
◄─┐
├►ガ
◄─┘
◄─┐
│
│
├►時間
│
│
◄─┘
◄─┐
│
├►デ
│
◄─┘
╟──►PRED
Tok
────
奈須
きのこ
は
1973
年
11
月
28
日
に
千葉
県
円空
山
で
生まれ
、
ゲーム
制作
会社
「
ノーツ
」
の
設立
者
だ
。
SRL PA3
────────
◄─┐
◄─┴►ノ
╟──►PRED
Tok
────
奈須
きのこ
は
1973
年
11
月
28
日
に
千葉
県
円空
山
で
生まれ
、
ゲーム
制作
会社
「
ノーツ
」
の
設立
者
だ
。
SRL PA4
────────
◄─┐
├►ガ
◄─┘
◄─┐
│
│
├►ヲ
│
│
◄─┘
╟──►PRED
Tok
────
奈須
きのこ
は
1973
年
11
月
28
日
に
千葉
県
円空
山
で
生まれ
、
ゲーム
制作
会社
「
ノーツ
」
の
設立
者
だ
。
SRL PA5
────────
◄─┐
├►ガ
◄─┘
╟──►PRED
Tok
────
奈須
きのこ
は
1973
年
11
月
28
日
に
千葉
県
円空
山
で
生まれ
、
ゲーム
制作
会社
「
ノーツ
」
の
設立
者
だ
。
PoS 3 4 5 6 7 8 9 10 11
───────────────────────────────────────────────────────────────────────────
NPR──┐
NPR──┴►NP ─────┐
P ───────── ───┴────────────────────────────────────────────────►PP ───┐
NUM──┐ │
CL ──┴►NUMCLP──┐ │
NUM──┐ │ │
CL ──┴►NUMCLP──┼►NP ───┐ │
NUM──┐ │ │ │
CL ──┴►NUMCLP──┘ ├►PP ───┐ │
P ───────── ───────────┘ │ │
NPR──┐ │ │
NPR──┴►PP ─────┐ │ │
NPR──────── ├►NP ───┐ ├────────────────────────────────►IP────┤
NPR──────── ───┘ ├►PP────┤ │
P ───────── ───────────┘ │ │
VB ──────── ───────────────────┘ ├►IP
PU ──────── ───────────────────────────────────────────────────────────┤
N ───┐ │
N ───┴►NP ──────►PRN ──┐ │
N ───────── ───────────┴►NP ────►PRN ──┐ │
PUL──────── ───────────────────────────┤ │
NPR──────── ───────────────────────────┼►NP ───┐ │
PUR──────── ───────────────────────────┘ ├►PP ───┐ │
P ───────── ───────────────────────────────────┘ ├►IP ───┐ │
N ───────── ───────────────────────────────────────────┘ ├►NP────┤
N ───────── ───────────────────────────────────────────────────┘ │
AX ──────── ───────────────────────────────────────────────────────────┤
PU ──────── ───────────────────────────────────────────────────────────┘
Dep Tree
──────────
┌─►
┌─►├──
│ └─►
│ ┌─►
┌┬┬─┴──┴──
│││ ┌───►
│││ │┌──►
│││ ││┌─►
││└─►└┴┴──
││ ┌──►
││ │┌─►
│└───►└┴──
└────────►
Token
────────────────
In
2021
,
HanLPv2.1
delivers
state-of-the-art
multilingual
NLP
techniques
to
production
environments
.
Relation
────────
case
obl
punct
nsubj
root
amod
amod
compound
obj
case
compound
obl
punct
Lemma
────────────────
in
2021
,
HANlpv2.1
deliver
state-of-the-art
multilingual
NLP
technique
to
production
environment
.
PoS
─────
ADP
NUM
PUNCT
PROPN
VERB
ADJ
ADJ
PROPN
NOUN
ADP
NOUN
NOUN
PUNCT
Tok
────────────────
In
2021
,
HanLPv2.1
delivers
state-of-the-art
multilingual
NLP
techniques
to
production
environments
.
NER Type
───────────────
───►DATE
───►WORK_OF_ART
Tok
────────────────
In
2021
,
HanLPv2.1
delivers
state-of-the-art
multilingual
NLP
techniques
to
production
environments
.
SRL PA1
────────────
◄─┐
◄─┴►ARGM-TMP
───►ARG0
╟──►PRED
◄─┐
├►ARG2
◄─┘
Tok
────────────────
In
2021
,
HanLPv2.1
delivers
state-of-the-art
multilingual
NLP
techniques
to
production
environments
.
PoS 3 4 5 6
──────────────────────────────────
ADP ───────────┐
NUM ────►NP ───┴────────►PP ───┐
PUNCT──────────────────────────┤
PROPN───────────────────►NP────┤
VERB ──────────────────┐ │
ADJ ───┐ │ │
ADJ │ │ │
PROPN ├────────►NP────┼►VP────┼►S
NOUN ──┘ │ │
ADP ───────────┐ │ │
NOUN ──┐ ├►PP ───┘ │
NOUN ──┴►NP ───┘ │
PUNCT──────────────────────────┘
Dep Tree
─────────────
┌─►
┌────────►├──
│ └─►
│┌───────►┌──
││ └─►
││ ┌─►
││ ┌───►├──
││ │ └─►
││ │┌─────►
││ ││┌────►
││ │││┌───►
││ ││││┌──►
││ │││││┌─►
││┌─►└┴┴┴┴┼──
│││ └─►
│││ ┌─►
│││ ┌─►├──
│││ │ └─►
└┴┴────┴─┬┬──
│└─►
└──►
Token
─────────
2021
年
、
HanLPv2.1
は
次
世代
の
最
先端
多
言語
NLP
技術
を
本番
環境
に
導入
します
。
Relation
────────
nummod
obl
punct
nsubj
case
compound
nmod
case
compound
compound
compound
compound
compound
obj
case
compound
obl
case
root
aux
punct
Lemma
─────────
2021
年
、
HANLPV2.1
は
次
世代
の
最
先端
多
言語
NLP
技術
を
本番
環境
に
導入
します
。
PoS
─────
NUM
NOUN
PUNCT
NOUN
ADP
NOUN
NOUN
ADP
NOUN
NOUN
NOUN
NOUN
NOUN
NOUN
ADP
NOUN
NOUN
ADP
VERB
AUX
PUNCT
Tok
─────────
2021
年
、
HanLPv2.1
は
次
世代
の
最
先端
多
言語
NLP
技術
を
本番
環境
に
導入
します
。
NER Type
────────
◄─┐
◄─┴►DATE
Tok
─────────
2021
年
、
HanLPv2.1
は
次
世代
の
最
先端
多
言語
NLP
技術
を
本番
環境
に
導入
します
。
PoS 3 4 5 6 7 8 9
───────────────────────────────────────────────────────────
NUM ───────────────────────────────────────────────────┐
NOUN ──────────────────────────────────────────────────┤
PUNCT──────────────────────────────────────────────────┤
NOUN ──────────────────────────────────────────────────┤
ADP ───────────────────────────┐ │
NOUN ──────────────────────────┤ │
NOUN ──────────────────────────┤ │
ADP ───────────────────────────┼►VP ────►VP ────►IP────┤
NOUN ───►ADJP──┐ │ │
NOUN ───►ADJP──┴►ADJP──┐ │ │
NOUN ───────────►ADJP──┴►ADJP──┘ ├►IP
NOUN ──┐ │
NOUN ├►NP ───┐ │
NOUN ──┘ ├►NP ───┐ │
ADP ───────────┘ │ │
NOUN ──────────────────┼►NP ───┐ │
NOUN ──────────────────┘ ├►NP ───┐ │
ADP ────────────────────►PP ───┘ │ │
VERB ──┐ ├────────►NP────┤
AUX ───┴────────────────────────►VP ───┘ │
PUNCT──────────────────────────────────────────────────┘
Dep Tree
────────────
┌─►
┌────►└──
│┌──────►
││ ┌──►
││ │┌─►
││┌─►└┴──
┌┬─┴┴┴──────
││ ┌──────►
││ │ ┌─►
││ │┌──►└──
││ ││ ┌─►
││ ││┌─►└──
││ │││ ┌─►
│└─►└┴┴──┴──
└──────────►
Token
─────────
2021
年
HanLPv2.1
为
生产
环境
带来
次世代
最
先进的
多
语种
NLP
技术
。
Relation
─────────
nummod
nmod:tmod
nsubj
case
nmod
obl
root
nmod
advmod
amod
nummod
nmod
nmod
obj
punct
Lemma
─────────
2021
年
HANlpv2.1
为
生产
环境
带来
次世代
最
先进的
多
语种
NLP
技术
。
PoS
─────
NUM
NOUN
X
ADP
NOUN
NOUN
VERB
NOUN
ADV
ADJ
NUM
NOUN
X
NOUN
PUNCT
Tok
─────────
2021
年
HanLPv2.1
为
生产
环境
带来
次世代
最
先进的
多
语种
NLP
技术
。
NER Type
──────────
◄─┐
◄─┴►DATE
───►PERSON
Tok
─────────
2021
年
HanLPv2.1
为
生产
环境
带来
次世代
最
先进的
多
语种
NLP
技术
。
SRL PA1
────────────
◄─┐
◄─┴►ARGM-TMP
╟──►PRED
Tok
─────────
2021
年
HanLPv2.1
为
生产
环境
带来
次世代
最
先进的
多
语种
NLP
技术
。
PoS 3 4 5 6 7 8
───────────────────────────────────────────────────
NUM ───┐
NOUN ──┴────────────────────────────────►NP ───┐
X ──────────────────────────────────────►NP────┤
ADP ───────────┐ │
NOUN ──┐ ├────────────────►PP ───┐ │
NOUN ──┴►NP ───┘ │ │
VERB ──────────────────────────┐ ├►VP────┤
NOUN ───────────►ADJP──┐ │ │ │
ADV ────►ADVP──┐ │ ├►VP ───┘ ├►IP
ADJ ────►ADJP──┴►ADJP──┤ │ │
NUM ────►QP ───┐ ├►NP ───┘ │
NOUN ───►NP ───┴►NP────┤ │
X ─────┐ │ │
NOUN ──┴────────►NP ───┘ │
PUNCT──────────────────────────────────────────┘