# 如何绘制美妙的注意力矩阵可视化图

本章节主要介绍如何使用`matplotlib`和`seaborn`绘制注意力矩阵的可视化图。故首先要引用依赖库如下: ```python import numpy as np import matplotlib.pyplot as plt import seaborn as sns ``` 如果还未安装上述库，可以通过以下安装指令安装: ```shell pip install seaborn ``` 接下来，首先让我们来初始化一个用于绘制注意力图的矩阵: ```python data_matrix = np.mat( [[27.5, 28.3, 32.5, 40.8, 42.5], [40.0, 42.6, 53.1, 58.8, 60.2], [34.4, 38.2, 56.2, 57.3, 56.9], [57.4, 63.9, 70.2, 70.2, 71.7]] ) ``` > 实际使用时也可以首先通过 `np.save(f, data_matrix)` 将自动计算得到的矩阵存储到文件 `f = open('data.npy', 'wb')` 中，在绘制脚本中使用 `np.load(open('data.npy', 'rb'))` 进行数据读取。接下来，有些时候我们需要在注意力图的横轴或纵轴使用到Latex的相关语法如 `\textsc`，或者为了与论文中的字体风格更加匹配，可以引入如下定义 (前提是绘图环境中已经成功安装Latex，并配置好了相关的环境变量): ```python plt.rc('text', usetex=True) plt.rc('text.latex', preamble=r'\usepackage{lmodern}') ``` 接下来，直接使用以下代码进行注意力矩阵的绘制: ```python fig = sns.heatmap(data_matrix, linewidth=0.5, # 将具体的数字写在对应的表格中，%.1f 指定了样式，在较复杂的样式中可以去掉 annot=np.array(['%.1f' % point for point in np.array(data_matrix.ravel())[0]]).reshape(np.shape(data_matrix)), # 这里必须置空，否则会出现问题 fmt='', yticklabels=["Extra Hard", "Hard", "Medium", "Easy"], # 如果 usetext=True, 这里可以使用 latex 语法比如 $\leq$ = < xticklabels=["BART", "$\leq$ Easy", "$\leq$ Medium", "$\leq$ Hard", "$\leq$ Extra Hard"], vmax=75.0, vmin=25.0, # cmap 决定了注意力图的色调 cmap="YlGnBu") ``` 在这里笔者解释一下每个选项的含义: - `np.array(data_matrix.ravel())[0]` 是为了将矩阵从二维变成一维，把文本依次排列在每个单元格上 - 但当矩阵过大时，一般我们不会显示每个单元格内的具体数字，此时可以将 `annot` 该行去掉 - `yticklabels` 是纵轴从下往上的标签列表，其长度需要与 `data_matrix` 行的数量一样 - `xticklabels` 是横轴从左往右的标签列表，其长度需要与 `data_matrix` 列的数量一样 - `linewidth` 是分隔单元格的线的宽度 - `ymax` 和 `ymin` 分别指定了色系两端对应的值 - `cmap` 是注意力图的色系，推荐以下选择

最后，给纵轴和横轴分别写上对应的标签: ```python plt.ylabel("Question Difficulty Level in Downstream", labelpad=25) plt.xlabel("SQL Difficulty Level in Pre-training", labelpad=25) ``` 即可调整布局并保存成用在论文中的格式: ```python # 调整布局至合适的位置 plt.tight_layout() # 保存文件 plt.savefig('attention.pdf') ```