词语拼音数据。
拼音数据的格式:
{phrase}: {pinyin}
-
以
#开头的行是注释 -
行尾的
#也是注释 -
{phrase}汉字词语 -
{pinyin}词语的拼音,使用空格分隔每个汉字的拼音 -
一行一个词语的读音,有多个音的词语会出现在多行
-
示例:
# 注释 中国: zhōng guó 北京: běi jīng # 注释
文件说明:
overwrite.txt: 手工纠正的拼音数据pinyin.txt:pinyin.txt + overwrite.txt后的拼音数据zdic_cibs.txt: 汉典网 汉语词典拼音数据zdic_cybs.txt: 汉典网 成语词典拼音数据cc_cedict.txt: cc-cedict.org 拼音数据
large_pinyin.txt:zdic_cibs.txt + zdic_cybs.txt + cc_cedict.txt + pinyin.txt + overwrite.txt后的拼音数据
- 修改
pinyin.txt或overwrite.txt都可以了 - 执行
make merge命令可以按照合并规则生成最新的pinyin.txt和large_pinyin.txt
- 初始数据基于 phrases-dict.js 和 phrases_dict.py
- 汉典 zdic.net
- 字海网,叶典网
- 国学大师国学网
- CC-CEDICT download - MDBG English to Chinese dictionary
- 漢語大詞典
- mozillazg/pinyin-data: 汉字拼音数据
- mozillazg/python-pinyin: 汉字转拼音(pypinyin)
- mozillazg/pypinyin-dict: 在 pypinyin 项目中使用 phrase-pinyin-data 里不同数据文件里的数据