Skip to content

Latest commit

 

History

History
106 lines (78 loc) · 14.2 KB

models_list.md

File metadata and controls

106 lines (78 loc) · 14.2 KB

PP-OCR系列模型列表(V2.1,2021年9月6日更新)

说明

  1. 2.1版模型相比2.0版模型,2.1的模型在模型精度上做了提升
  2. 2.0版模型和1.1版模型 的主要区别在于动态图训练vs.静态图训练,模型性能上无明显差距。
  3. 本文档提供的是PPOCR自研模型列表,更多基于公开数据集的算法介绍与预训练模型可以参考:算法概览文档

PaddleOCR提供的可下载模型包括推理模型训练模型预训练模型slim模型,模型区别说明如下:

模型类型 模型格式 简介
推理模型 inference.pdmodel、inference.pdiparams 用于预测引擎推理,详情
训练模型、预训练模型 *.pdparams、*.pdopt、*.states 训练过程中保存的模型的参数、优化器状态和训练中间信息,多用于模型指标评估和恢复训练
slim模型 *.nb 经过飞桨模型压缩工具PaddleSlim压缩后的模型,适用于移动端/IoT端等端侧部署场景(需使用飞桨Paddle Lite部署)。

各个模型的关系如下面的示意图所示。

1. 文本检测模型

模型名称 模型简介 配置文件 推理模型大小 下载地址
ch_PP-OCRv2_det_slim 【最新】slim量化+蒸馏版超轻量模型,支持中英文、多语种文本检测 ch_PP-OCRv2_det_cml.yml 3M 推理模型
ch_PP-OCRv2_det 【最新】原始超轻量模型,支持中英文、多语种文本检测 ch_PP-OCRv2_det_cml.yml 3M 推理模型 / 训练模型
ch_ppocr_mobile_slim_v2.0_det slim裁剪版超轻量模型,支持中英文、多语种文本检测 ch_det_mv3_db_v2.0.yml 2.6M 推理模型
ch_ppocr_mobile_v2.0_det 原始超轻量模型,支持中英文、多语种文本检测 ch_det_mv3_db_v2.0.yml 3M 推理模型 / 训练模型
ch_ppocr_server_v2.0_det 通用模型,支持中英文、多语种文本检测,比超轻量模型更大,但效果更好 ch_det_res18_db_v2.0.yml 47M 推理模型 / 训练模型

2. 文本识别模型

2.1 中文识别模型

模型名称 模型简介 配置文件 推理模型大小 下载地址
ch_PP-OCRv2_rec_slim 【最新】slim量化版超轻量模型,支持中英文、数字识别 ch_PP-OCRv2_rec.yml 9M 推理模型 / 训练模型
ch_PP-OCRv2_rec 【最新】原始超轻量模型,支持中英文、数字识别 ch_PP-OCRv2_rec_distillation.yml 8.5M 推理模型 / 训练模型
ch_ppocr_mobile_slim_v2.0_rec slim裁剪量化版超轻量模型,支持中英文、数字识别 rec_chinese_lite_train_v2.0.yml 6M 推理模型 / 训练模型
ch_ppocr_mobile_v2.0_rec 原始超轻量模型,支持中英文、数字识别 rec_chinese_lite_train_v2.0.yml 5.2M 推理模型 / 训练模型 / 预训练模型
ch_ppocr_server_v2.0_rec 通用模型,支持中英文、数字识别 rec_chinese_common_train_v2.0.yml 94.8M 推理模型 / 训练模型 / 预训练模型

说明: 训练模型是基于预训练模型在真实数据与竖排合成文本数据上finetune得到的模型,在真实应用场景中有着更好的表现,预训练模型则是直接基于全量真实数据与合成数据训练得到,更适合用于在自己的数据集上finetune。

2.2 英文识别模型

模型名称 模型简介 配置文件 推理模型大小 下载地址
en_number_mobile_slim_v2.0_rec slim裁剪量化版超轻量模型,支持英文、数字识别 rec_en_number_lite_train.yml 2.7M 推理模型 / 训练模型
en_number_mobile_v2.0_rec 原始超轻量模型,支持英文、数字识别 rec_en_number_lite_train.yml 2.6M 推理模型 / 训练模型

2.3 多语言识别模型(更多语言持续更新中...)

模型名称 字典文件 模型简介 配置文件 推理模型大小 下载地址
french_mobile_v2.0_rec ppocr/utils/dict/french_dict.txt 法文识别 rec_french_lite_train.yml 2.65M 推理模型 / 训练模型
german_mobile_v2.0_rec ppocr/utils/dict/german_dict.txt 德文识别 rec_german_lite_train.yml 2.65M 推理模型 / 训练模型
korean_mobile_v2.0_rec ppocr/utils/dict/korean_dict.txt 韩文识别 rec_korean_lite_train.yml 3.9M 推理模型 / 训练模型
japan_mobile_v2.0_rec ppocr/utils/dict/japan_dict.txt 日文识别 rec_japan_lite_train.yml 4.23M 推理模型 / 训练模型
chinese_cht_mobile_v2.0_rec ppocr/utils/dict/chinese_cht_dict.txt 中文繁体识别 rec_chinese_cht_lite_train.yml 5.63M 推理模型 / 训练模型
te_mobile_v2.0_rec ppocr/utils/dict/te_dict.txt 泰卢固文识别 rec_te_lite_train.yml 2.63M 推理模型 / 训练模型
ka_mobile_v2.0_rec ppocr/utils/dict/ka_dict.txt 卡纳达文识别 rec_ka_lite_train.yml 2.63M 推理模型 / 训练模型
ta_mobile_v2.0_rec ppocr/utils/dict/ta_dict.txt 泰米尔文识别 rec_ta_lite_train.yml 2.63M 推理模型 / 训练模型
latin_mobile_v2.0_rec ppocr/utils/dict/latin_dict.txt 拉丁文识别 rec_latin_lite_train.yml 2.6M 推理模型 / 训练模型
arabic_mobile_v2.0_rec ppocr/utils/dict/arabic_dict.txt 阿拉伯字母 rec_arabic_lite_train.yml 2.6M 推理模型 / 训练模型
cyrillic_mobile_v2.0_rec ppocr/utils/dict/cyrillic_dict.txt 斯拉夫字母 rec_cyrillic_lite_train.yml 2.6M 推理模型 / 训练模型
devanagari_mobile_v2.0_rec ppocr/utils/dict/devanagari_dict.txt 梵文字母 rec_devanagari_lite_train.yml 2.6M 推理模型 / 训练模型

更多支持语种请参考: 多语言模型

3. 文本方向分类模型

模型名称 模型简介 配置文件 推理模型大小 下载地址
ch_ppocr_mobile_slim_v2.0_cls slim量化版模型,对检测到的文本行文字角度分类 cls_mv3.yml 2.1M 推理模型 / 训练模型
ch_ppocr_mobile_v2.0_cls 原始分类器模型,对检测到的文本行文字角度分类 cls_mv3.yml 1.38M 推理模型 / 训练模型

4. Paddle-Lite 模型

模型版本 模型简介 模型大小 检测模型 文本方向分类模型 识别模型 Paddle-Lite版本
PP-OCRv2 蒸馏版超轻量中文OCR移动端模型 11M 下载地址 下载地址 下载地址 v2.9
PP-OCRv2(slim) 蒸馏版超轻量中文OCR移动端模型 4.9M 下载地址 下载地址 下载地址 v2.9
V2.0 ppocr_v2.0超轻量中文OCR移动端模型 7.8M 下载地址 下载地址 下载地址 v2.9
V2.0(slim) ppocr_v2.0超轻量中文OCR移动端模型 3.3M 下载地址 下载地址 下载地址 v2.9