# 变更日志 | 类型 | 说明 | |:----|:----| | A | 新增 | | U | 更新 | | D | 删除 | | T | 测试 | | O | 优化 | | F | 修复BUG | # release_0.0.1 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | A | 基本功能的实现 | 2020-1-7 21:46:32 | | # release_0.0.2 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | O | 优化最大长度匹配模式 | 2020-1-8 09:34:35 | | | 2 | A | 新增替换实现 | 2020-1-8 09:34:35 | 性能优于各种博客的直接正则替换。| | 3 | O | 优化公共代码到 heaven 项目 | 2020-1-8 09:34:35 | 便于后期统一维护整理。| | 4 | O | 初步优化 DFA 对应 map 的大小 | 2020-1-8 09:34:35 | | # release_0.0.3 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | O | 优化敏感词大小 | 2020-1-8 09:34:35 | | # release_0.0.4 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | A | 支持大小写转换 | 2020-1-9 09:34:35 | | | 1 | A | 支持半角全角转换 | 2020-1-9 09:34:35 | | # release_0.0.5 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | D | 移除单个字符 `v` | 2020-1-9 09:34:35 | | | 2 | D | 移除单个字符 `我` | 2020-1-10 09:34:35 | | | 3 | O | 责任链模式优化代码实现 | 2020-1-10 09:34:35 | | | 4 | A | 支持数字格式化转换 | 2020-1-10 09:34:35 | | | 5 | A | 支持数字敏感词验证 | 2020-1-10 09:34:35 | | | 6 | O | 优化所有写法的数字为阿拉伯写法 | 2020-1-10 09:34:35 | | # release_0.0.6 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | A | 添加中文繁简体转换支持 | 2020-1-10 09:34:35 | | | 2 | A | 添加英文常见写法转换支持 | 2020-1-10 09:34:35 | | | 3 | A | 新增敏感词 `艹` | 2020-1-10 09:34:35 | | | 4 | D | 移除单个词 `k买仆办功务动区卖台吨天房本歌滚灾独证踢弓` | 2020-1-10 09:34:35 | | # release_0.0.7 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | A | 添加忽略重复词支持 | 2020-1-10 09:34:35 | | # release_0.0.8 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | A | 添加用户自定义敏感词和白名单 | 2020-1-10 09:34:35 | | # release_0.0.9 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | A | 添加邮箱检测 | 2020-1-11 09:34:35 | | # release_0.0.10 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | F | 修复依赖包 heaven 版本 | 2020-1-11 09:34:35 | | # release_0.0.11 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | A | 添加对于数字过滤的可配置型 | 2020-1-14 22:48:12 | | | 2 | A | 添加部分敏感词 | 2020-1-14 22:48:12 | | # release_0.0.12 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | A | 添加对于网址的过滤 | 2020-1-16 20:51:58 | | # release_0.0.13 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | A | 新增 Helper 工具类 | 2021-5-12 20:51:58 | | | 2 | A | 新增动态词库初始化支持 | 2021-5-12 20:51:58 | | # release_0.0.14 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | A | 开发样式配置特性 | 2021-5-31 20:51:58 | | # release_0.0.15 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | A | 优化 init 方式 | 2021-7-16 20:51:58 | | # release_0.1.0 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | A | 返回敏感词对应的下标范围 | 2021-8-8 20:51:58 | | | 2 | U | ignoreRepeat 默认为 false | 2021-8-8 20:51:58 | | | 3 | U | 把测试、系统、买卖、彩票等常用词移出敏感词库 | 2021-8-8 20:51:58 | | # release_0.1.1 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | F | 自定义敏感词 allow/deny 进行格式化处理 | 2021-12-11 23:51:58 | | # release_0.2.0 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | A | 允许用户自定义替换策略 | 2022-01-15 23:51:58 | | | 2 | U | 升级二方数据库依赖 | 2022-01-15 23:51:58 | | # release_0.2.1 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:---|:---|:---|:--| | 1 | O | 移除日志初始化的控台日志输出 | 2023-02-17 23:51:58 | | | 2 | A | 支持数字检验的长度指定 | 2022-01-17 23:51:58 | | # release_0.3.0 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|:-----------------|:--------------------|:--| | 1 | O | 移除冗余的耗时统计 | 2023-06-06 23:51:58 | | | 2 | A | 优化代码实现方式,添加工具类方法 | 2023-06-06 23:51:58 | | # release_0.3.1 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|:------|:--------------------|:------------------------------------------------| | 1 | O | 敏感词添加 | 2023-06-06 23:51:58 | 幸运/幸运儿/17年前/1条/1梯两户/1比1/年检/幸存/幸运/幸运儿/恶搞/游戏机/日/草 | | 2 | A | 敏感词添加 | 2023-06-06 23:51:58 | SB | # release_0.3.2 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|:--------|:--------------------|:-------| | 1 | O | 中文繁简体样式 | 2023-06-07 23:51:58 | 调整实现策略 | | 2 | A | 代码结构优化 | 2023-06-07 23:51:58 | 调整实现策略 | # release_0.4.0 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|:------------|:--------------------|:-------| | 1 | O | 优化单词校验逻辑 | 2023-06-08 23:51:58 | | | 2 | A | 新增是否单词校验的开关 | 2023-06-08 23:51:58 | | # release_0.5.0 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|-----------------------------|:--------------------|:-------| | 1 | A | 优化单词结果,减少 String 创建 | 2023-06-08 23:51:58 | | | 2 | A | 优化 contains 判断,减少 String 创建 | 2023-06-08 23:51:58 | | # release_0.6.0 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|--------------------------|:--------------------|:-------| | 1 | O | 性能优化:字符映射统一处理一遍,而不是每次都处理 | 2023-06-09 23:51:58 | | | 2 | D | 移除废弃的 replaceContext | 2023-06-09 23:51:58 | | # release_0.7.0 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|---------------------------------------------|:--------------------|:----------------| | 1 | A | IWordMap 命名调整为 IWordData, 添加 Tree 实现。优化内存占用 | 2023-06-09 23:51:58 | 避免过于限制,放开便于后续拓展 | # release_0.8.0 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|---------------------------------------------|:--------------------|:----------------| | 1 | A | 添加 ICharFormatCombine | 2023-06-10 23:51:58 | 允许用户自定义格式化组合策略 | | 2 | A | 添加 ISensitiveCheckCombine | 2023-06-10 23:51:58 | 允许用户自定义敏感词校验组合策略 | | 3 | A | 添加 IWordAllowDenyCombine | 2023-06-10 23:51:58 | 允许用户自定义 allow+deny 的组合策略 | | 4 | A | 添加引导类进阶的配置使用说明 | 2023-06-10 23:51:58 | 放在后续,避免内部接口不够稳定 | | 5 | U | 内部接口名称统一为 IWordXXX | 2023-06-10 23:51:58 | | # release_0.9.0 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|-----------------|:--------------------|:------| | 1 | O | 移除单个汉字+部分常用词的脏词 | 2023-11-17 23:51:58 | 降低误判率 | # release_0.10.0 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|------------------|:--------------------|:------| | 1 | A | 添加脏词的标签接口,便于后续拓展 | 2023-12-05 23:51:58 | | # release_0.11.0 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|----------------------|:--------------------|:------| | 1 | A | 添加忽略字符接口,便于跳过一些干扰的字符 | 2023-12-08 23:51:58 | | # release_0.12.0 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|----------------------------------------------|:--------------------|:------| | 1 | A | 添加 wordTags 标签结果处理类 | 2023-12-18 23:51:58 | | | 2 | A | 添加 AbstractWordResultHandler 处理类,便于后续拓展和统一管理 | 2023-12-18 23:51:58 | | # release_0.13.0 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|-----------------------------------|:--------------------|:------| | 1 | A | 对匹配后的单词,额外可以做一次校验,比如做一次英文全词匹配的验证。 | 2024-02-19 23:51:58 | | # release_0.13.1 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|------------|:-------------------|:-------------------------------------------------| | 1 | F | 修正单词匹配 BUG | 2024-2-28 16:16:42 | https://github.com/houbb/sensitive-word/pull/47 | # release_0.13.2 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|----------------------|:------------------|:-------------------------------------------------| | 1 | O | 优化部分2长度的英文,避免误判 | 2024-4-7 21:04:18 | | | 2 | O | 升级 heaven 版本到 v0.9.0 | 2024-4-7 21:04:18 | | # release_0.13.3 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|------------------------------------------------------------------------------------------------------------------------|:------------------|:-------------------------------------------------| | 1 | O | 移除辉煌、辅导、迅雷、运营、近亲、连接、1期、2o年、2期、3期、46级、4川、4风、4级证、5周年、5月天、610、64、6级证、89、8964、89年、9成、fa票、ftp://、nrqr、o78569 | 2024-4-8 21:04:18 | | | 2 | O | 移除pqαr、q币、tqrqu、v商、xi藏、xrnvs、xrqu、xrtbrnvs、x藏、you行、αqrqr、αqrqu、αrnvs、αrwqnvs、丁香、万岁、上海交大、上海交警、不良、专6、专8、丑化、东升、中华、中华人民共和国 | 2024-4-8 21:04:18 | | | 3 | O | 中南海、中国、中考、主义、主权、举行、举办、乌克兰、乌鲁木齐、乡巴佬、买房、争鸣、二战、亚洲、亡国、交警、交通部、亵渎、人渣、人质、人鬼情未了、今有广东 | 2024-4-7 21:04:18 | | | 4 | O | 仙剑、仙侣奇缘、仙界传、仙笛、代理、价格、仿真、优惠、会员、传单、伤亡、住宅、佛祖、佛教、作秀、佳薇、供应、侦探、侮辱、侵犯、俄国、俄罗斯、保监会、信仰、信号、信息、信用卡、信誉、修炼、 | 2024-4-7 21:04:18 | | | 5 | O | 倒塌、倒退、倚天、借记卡、值勤、倾城美人、假冒、偷税、储蓄卡、催泪、催眠、傲视、傲神传、僵尸、充值、光线、光明日报、克隆、免费使用、全套、全户型、全职、全集、公务员、公司、公告、公司网址、公安、公安局、公寓、 | 2024-4-7 21:04:18 | | | 6 | O | 公文、公证、兰博、共产、其它、内幕、冒险岛、凤凰、凶手、出卖、出售、出版社、出货、击毙、刀剑、分析、刑警、列宁、别墅、制作、制服、刷卡、剑侠世界、剧毒、加冰 | 2024-4-7 21:04:18 | | | 7 | O | 动向、动漫、助理、助听器、劲舞、劳务、北京、北韩、千年、千岛湖、华语、协警、卡通、卧底、卫星电视、卫生部、卫生巾、印章、历史、压制、压迫、原子弹、原点、参拜、 | 2024-4-7 21:04:18 | | | 8 | O | 反攻、发售、发票、受伤、变天、变态、口腔科、古兰经、古龙、可儿、可塑、台湾、叱咤、号码、司机、同志、名刀、名师、后庭、后庭花、吐血、启蒙派、告示、呻吟、和平、和弦、咨询、哥哥、哥白尼 | 2024-4-7 21:04:18 | | | 9 | O | 唐僧、商务、商业楼、商圈、商铺、商标、善恶有报、喷剂、回族、回馈、围攻、国务院、国家、国庆、国歌、圆满、圣母、在十月、地址、地产、地球文明 | 2024-4-7 21:04:18 | | | 10 | O | 地震、均价、坠落、城堡、城管、增值税、复仇、复制、复活、多维、大宝、大师、大话、天猫、天骄、太监、头孢、奥运、奥运会、女人、如影逐形、如来、妈妈、姐夫、姐姐、孤儿 | 2024-4-7 21:04:18 | | | 11 | O | 学习班、学位证、学历证、学历证书、宇宙真理、安全监管、安全部、安定、安息、完美世界、宗教、官场、官方、定金、定额、宝莲灯、审查、审计、客户、客服、客服人员、密码 | 2024-4-7 21:04:18 | | | 12 | O | 富婆、富姐、富姐婆、寻仇、导师、导弹、导火索、导航、封神、封锁、小说、小龙女、尖值、屏蔽、岁月无声、崩盘、巡查、工商、工商局、巨商、巴赫、市长、 | 2024-4-7 21:04:18 | | | 13 | O | 师傅、师父、帐号、帝国主义、常委、幸运儿、广告、广电、广电局、广电总局、庐江、废墟、建筑、开发、开发票、开放、引导、弟子、形式主义、征途、 | 2024-4-7 21:04:18 | | | 14 | O | 微信、怀旧、性情、性情中人、总局、总理、总裁、恭喜、您被、户口本、户型、房产、房地产、房型、房间、手机、托福、投票、抗战、抗议、报国、报警、拉sa、拉萨、招商、招募、 | 2024-4-7 21:04:18 | | | 15 | O | 拦截、拿破仑、指导员、挑战、捆绑、探头、接班、摄像、收藏品、改革、政治、救援、教徒、数通、文化部、断电、新浪、新闻出版、无线耳机、无线通话、日本、日本人、旺铺、 | 2024-4-7 21:04:18 | | | 16 | O | 昏迷、易容、星月、星星月亮、星相、春光、春色、暧昧、月嫂、月卡、月光宝盒、朝鲜、朝鲁、期货、本店、本色、杜鹃、杨j、格斗、梵高、检察、检查、楼盘、欲望、正义、 | 2024-4-7 21:04:18 | | | 17 | O | 武力、武器、武神、武警、歹徒、死亡、残疾、母亲、毕业、毕业证、毕加索、民族、民国、民政局、民警、汉人、江山、江山如此多娇、江湖、汪洋、沉沦、沁园春、沙僧、 | 2024-4-7 21:04:18 | | | 18 | O | 洗牙、洞穴、活动、消息、淘宝、混沌、清仓、清真、清纯、渡口、温b、温馨、温馨提示、激情、烟花、烟草、烟草局、然后、燃烧、爆炸、爸爸、爷爷、父亲、爹娘、牙科、牙疼、牙签、牙周炎、 | 2024-4-7 21:04:18 | | | 19 | O | 牢记、牲口、狙击、独立、猥琐、现代中国、现金、现货、现房、瓦斯、生肖、用户、电信、电影、电影下载、电话、男装、疫苗、病毒、监督、监管、监管局、盗版、盘古、相亲会 | 2024-4-7 21:04:18 | | | 20 | O | 省长、督察、短信、破坏、硬币、礼品、礼物、社会、社会主义、祖国、祖宗、离婚、秃鹰、种子、租房、租售、移动、移民、税务、穷人、空降、签证、简历、米粒、精装、纪元、经济、经典语录、绝版 | 2024-4-7 21:04:18 | | | 21 | O | 统治、维护、维权、缅甸、缠上、缺陷、网址、网关、网易、网站、网站建设、网络、网购、罪行、美利坚、美国、美女、群发、老板、老板手机、考号、考研、耳机、 | 2024-4-7 21:04:18 | | | 22 | O | 耶和华、耶稣、联合国、联合行动、 联系、联通、股票、自fe、自制、自拍、舆论、舒淇、航天、航班、航空、花园、苹果、茅台、茉莉花、药水、莎士比亚、落榜、蒙面、蓝光、虎头、 | 2024-4-7 21:04:18 | | | 23 | O | 虎牙、虎门、蛤蟆、融资、行驶证、街铺、被迫、西游、西臧、西藏、观世音、解放军、警察、讲法、论文、证书、证件、证券、诛仙、诡异、语句、语音、诱惑、资格、跟踪、路人、躲猫猫、通告 | 2024-4-7 21:04:18 | | | 24 | O | 通知、通讯录、道教、采花、重生、钓鱼、钢珠、铃声、链接、销售、错别字、锤子、锤锤、面积、预测、领土、领导、风水、风花、首长、鲁迅、鲍鱼、鸡尾酒、麻将、 | 2024-4-7 21:04:18 | | # release_0.13.4 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|---------------------------------------------------------------------|:------------------|:-------------------------------------------------| | 1 | O | 移除 一直对、组织、验证码、数据库、服务器、火药、世界都、聚集、国内、制造、解码、万里、视频、中国好声音 | 2024-4-9 21:04:18 | | | 2 | O | 移除 骑士、移动公司、战役、战场、飞机票、逃逸、自由、杂志、使用人数、域名服务、人民日报、一粒沙、牛顿、三国演义、哥伦布、 | 2024-4-9 21:04:18 | | | 3 | O | 移除 订票、财政部、搜狐、人员变动、惊天动地、试卷、华莱士、空闲时间、泰晤士报、企业家、气象局、诺贝尔奖、多多益善、论坛、外交部 | 2024-4-9 21:04:18 | | | 4 | O | 移除 焚烧、雅典娜、真相、真善美、制造、万里、法国、世界都、昨日重现、信息中心、马克思、刘德华、内蒙古、 | 2024-4-9 21:04:18 | | | 5 | O | 移除 涿州、中国联通、中国网通、李老师、写字楼、人民银行、卡拉、牛魔王、 张杰、哪里找、爱因斯坦、天地之间、不玩了、里根、监听器、监听 | 2024-4-9 21:04:18 | | | 6 | O | 移除 选举、登陆、中国移动、运营者、客户服务、精益求精、下载速度、好朋友、拦截器、账号、无界、深入浅出、腾讯、解码器、管理员、白皮书 | 2024-4-9 21:04:18 | | | 7 | O | 移除 监听、运营商、一起玩、转化、超市 | 2024-4-9 21:04:18 | | # release_0.14.0 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|------------|:-------------------|:-------------------------------------------------| | 1 | A | 结果添加敏感词的类别 | 2024-4-11 15:02:25 | | # release_0.15.0 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|---------------------|:-------------------|:-------------------------------------------------| | 1 | F | 调整默认文件名称,避免和其他框架重合。 | 2024-4-23 21:02:25 | https://github.com/houbb/sensitive-word/issues/54 | # release_0.16.0 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|----------------------|:-------------------|:-------------------------------------------------------| | 1 | A | 支持资源的释放,如 andriod 场景 | 2024-4-26 21:02:25 | 废弃版本,https://github.com/houbb/sensitive-word/issues/53 | # release_0.16.1 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|----------------------|:-------------------|:----------------------------------------------------------| | 1 | F | 支持资源的释放,如 andriod 场景 | 2024-4-26 21:02:25 | 修正未调用问题,https://github.com/houbb/sensitive-word/issues/53 | # release_0.16.2 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|------------------------------------------------------------------------------------------|:------------------|:------| | 1 | O | 敏感词优化移除: 译码器/鞋帽/破解/看下/快乐水/冷却/招聘/搬迁/机票/谣言/第4代/赚钱/1989年/贫穷/护士/工作人员/网通/超速/明心/人民/服务管理/刺激/心水/ | 2024-6-01 15:02:25 | | | 2 | O | 敏感词优化移除: 影院/公关/韦小宝/挣钱/资本主义/人也/战争/水浒/女装/装修/妹妹/他爸爸/他妈妈 | 2024-6-01 15:02:25 | | | 3 | O | 默认关闭数字+网址+邮箱的校验 | 2024-6-01 15:02:25 | 降低误判率 | # release_0.17.0 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|---------|:------------------|:------| | 1 | A | IPV4 校验 | 2024-6-01 15:02:25 | https://github.com/houbb/sensitive-word/issues/43 | # release_0.18.0 | 序号 | 变更类型 | 说明 | 时间 | 备注 | |:---|:-----|-------------------------|:-------------------|:-----| | 1 | A | 优化网址匹配策略,避免命中 1.jpg 之类的 | 2024-7-07 15:02:25 | |