-
Notifications
You must be signed in to change notification settings - Fork 12
/
Copy pathcqkm_cm.src.dict.yaml
85 lines (67 loc) · 4.76 KB
/
cqkm_cm.src.dict.yaml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
---
name: cqkm_cm.src
version: "1.0"
sort: by_weight
columns:
- text
- code
- weight
- stem
encoder:
exclude_patterns:
- '^[iuv].*$|[ao]$'
rules:
- length_equal: 2
formula: "AaAbBaBb"
- length_equal: 3
formula: "AaAbBaCa"
- length_in_range: [4, 300]
formula: "AaBaCaZa"
import_tables:
- cqkm_cm #主码表
# - ipinyin #反查副码表
# - A #示例A副码表
# - B #示例B副码表
# - C #示例C副码表
#注:申明副码表后却无文件会卡死
...
#【1】本文件为超强快码 Rime 平台用户词库,下称「源词库」
#【2】源词库意义:意使跨平台 Rime 输入法引擎用有且仅有一个的用户词库打通 Win/Linux/Android/Ios/Mac 等主流手机和PC端;不对初始词库做修改就并存用户自加词,实现用户词库与原词库1+1=1的效果,一份用户码表走天下。
#【3】本方案的初始码表实为源词库的下属扩展词库,初始码表名为:cqkm_cm.dict.yaml。初始码表与此码表后缀可视为“.dict.yaml”,由utf-8文本格式直接更改后缀而成。
#【4】一个词条占一行,行末尾不可有符号。任一词条前加“#”号可使其失效,标志其后内容仅起注释及解释代码的作用。
#【5】请注意!码表会用到Tab制表符以切分编码与字词,Tab制表符不显示,视觉上与空格相似,但空格不生效不可以使用空格,请注意区别Tab和空格。若想使用Tab制表符,可以复制此重括号中的使用→【 】
#【6】往下可逐行加入带有编码的用户自加字词,格式为:
#“词组+Tab+编码”
#①当编码为原词库中空码时则四码上屏;重码时则自加词居后;
#②若欲使与原词库重码时自加词居于前,则格式为:“词组+Tab+编码+Tab+2” ,示例:
#例壹 dhsl
#↑“例壹”居dhsl编码最后(去掉上行#号生效)
#例贰 dhsl 2
#↑“例贰”在dhsl编码最前,调频(去掉上行#号生效)
#【7】Rime平台下加词可无编码进行,词库会在部署后自动为没有编码的词条编码。例如下两句诗并未编码也可被打出:
春眠不觉晓处处闻啼鸟
春眠不觉晓,处处闻啼鸟;夜来风雨声,花落知多少
#欲使无编码所加词条与下属初始码表重码时居于前,应使用“词条+Tab+Tab+2”格式。例如:
#倒时 2
#↑“倒时”自动编码后会居该编码首位(去掉上行#号生效)
#【8】初始码表实为源词库的下属扩展词库,如有庞大的专业或系列词库需要无编码加词,可效仿初始词库将其单独以扩展方式挂接在源词库之下。方法:
# ㈠:将准备好词库命名为“A.dict.yaml”(utf-8编码,一个词条占用一行)并使之与源词库在同一文件夹内。
# ㈡:复制下示5行内容并删除前面的井号粘贴到刚做好的词库“A.dict.yaml”里面,要粘贴到第一行,这样第一个词条应该在“...”这三个点的下面。
#---
#name: A
#version: "2.0"
#sort: by_weight
#...
# ㈢:在源词库表头“import_tables”下删除A列前井号(即在本文上部),即申明A词库为用户词库中的下属挂接词库。重新部署即完成挂接。
#需要注意的是,在源词库的import_tables下面申明下属词库后却无词库,则程序可能卡死;如去掉源词库import_tables下属的B示例词库前的井号则表示需要使用“B.dict.yaml”文件,若没有B.dict.yaml文件则程序卡死。
#微调初始码表中的排序:假设在初始码表中aaaa编码下有三重且顺序为ABC,将其以下格式时:
#C aaaa
#则此时会更改初始码表排序,先后顺序变为CAB;也可尝试混合调频
#【9】精准造词的管理:windows端可用“小狼毫助手”工具导出合并等处理,亦可手动处理。手动方法:「用户资料同步」后在用户文件夹找到方案对应文件并打开。(如超强快码的方案对应文件为cqkm.txt)
# ①使用此正则替换成空内容去掉无关内容:\n[^#].+
# ②再使用下式:(\n)enc([a-z]{4}) (\t[^t].+?)\t.+替换为$1$2$3
# ③整理自己造的词,挑选加入源词库或者保存。
# ④使用第①步处理后直接保存,还可反向导入词库中。(※具体可以使用这种方式手动同步PC各端或安卓同文上同用rime的自造词,详见 Rime 官网说明。不太建议此种方式同步,不是很方便,还是建议把导出的词放到此源词库中)
#如上述皆无法满足需求,必然是属于真正的diy用户,根本无需源词库只保留自己经常改动的初始码表即可。
#数据无价,注意保存备份,可以定期保存,程序升级前,可以先取出,再覆盖回去
日期 date