mindspore-lab
diff --git a/‎docs/cn/datasets/borndigital.md
Lines changed: 2 additions & 9 deletions b/‎docs/cn/datasets/borndigital.md
Lines changed: 2 additions & 9 deletions
diff --git a/‎docs/cn/datasets/casia10k.md
Lines changed: 1 addition & 7 deletions b/‎docs/cn/datasets/casia10k.md
Lines changed: 1 addition & 7 deletions
diff --git a/‎docs/cn/datasets/ccpd.md
Lines changed: 1 addition & 7 deletions b/‎docs/cn/datasets/ccpd.md
Lines changed: 1 addition & 7 deletions
diff --git a/‎docs/cn/datasets/chinese_text_recognition.md
Lines changed: 2 additions & 4 deletions b/‎docs/cn/datasets/chinese_text_recognition.md
Lines changed: 2 additions & 4 deletions
diff --git a/‎docs/cn/datasets/cocotext.md
Lines changed: 2 additions & 7 deletions b/‎docs/cn/datasets/cocotext.md
Lines changed: 2 additions & 7 deletions
diff --git a/‎docs/cn/datasets/converters.md
Lines changed: 1 addition & 1 deletion b/‎docs/cn/datasets/converters.md
Lines changed: 1 addition & 1 deletion
diff --git a/‎docs/cn/datasets/ctw.md
Lines changed: 2 additions & 8 deletions b/‎docs/cn/datasets/ctw.md
Lines changed: 2 additions & 8 deletions
diff --git a/‎docs/cn/datasets/ctw1500.md
Lines changed: 1 addition & 3 deletions b/‎docs/cn/datasets/ctw1500.md
Lines changed: 1 addition & 3 deletions
diff --git a/‎docs/cn/datasets/ic19_art.md
Lines changed: 2 additions & 10 deletions b/‎docs/cn/datasets/ic19_art.md
Lines changed: 2 additions & 10 deletions
diff --git a/‎docs/cn/datasets/icdar2015.md
Lines changed: 5 additions & 8 deletions b/‎docs/cn/datasets/icdar2015.md
Lines changed: 5 additions & 8 deletions
diff --git a/‎docs/cn/datasets/lsvt.md
Lines changed: 2 additions & 9 deletions b/‎docs/cn/datasets/lsvt.md
Lines changed: 2 additions & 9 deletions
diff --git a/‎docs/cn/datasets/mlt2017.md
Lines changed: 5 additions & 8 deletions b/‎docs/cn/datasets/mlt2017.md
Lines changed: 5 additions & 8 deletions
diff --git a/‎docs/cn/datasets/mtwi2018.md
Lines changed: 2 additions & 8 deletions b/‎docs/cn/datasets/mtwi2018.md
Lines changed: 2 additions & 8 deletions
diff --git a/‎docs/cn/datasets/rctw17.md
Lines changed: 1 addition & 7 deletions b/‎docs/cn/datasets/rctw17.md
Lines changed: 1 addition & 7 deletions
diff --git a/‎docs/cn/datasets/rects.md
Lines changed: 2 additions & 9 deletions b/‎docs/cn/datasets/rects.md
Lines changed: 2 additions & 9 deletions
diff --git a/‎docs/cn/datasets/sroie.md
Lines changed: 2 additions & 9 deletions b/‎docs/cn/datasets/sroie.md
Lines changed: 2 additions & 9 deletions
diff --git a/‎docs/cn/datasets/svt.md
Lines changed: 1 addition & 3 deletions b/‎docs/cn/datasets/svt.md
Lines changed: 1 addition & 3 deletions
diff --git a/‎docs/cn/datasets/syntext150k.md
Lines changed: 4 additions & 2 deletions b/‎docs/cn/datasets/syntext150k.md
Lines changed: 4 additions & 2 deletions
diff --git a/‎docs/cn/datasets/synthtext.md
Lines changed: 1 addition & 1 deletion b/‎docs/cn/datasets/synthtext.md
Lines changed: 1 addition & 1 deletion
diff --git a/‎docs/cn/datasets/td500.md
Lines changed: 1 addition & 2 deletions b/‎docs/cn/datasets/td500.md
Lines changed: 1 addition & 2 deletions
diff --git a/‎docs/cn/datasets/textocr.md
Lines changed: 1 addition & 8 deletions b/‎docs/cn/datasets/textocr.md
Lines changed: 1 addition & 8 deletions
@@ -2,19 +2,12 @@
 
 ## 数据集下载
 
-原生数字图像数据集（Born-Digital Images）[官网](https://rrc.cvc.uab.es/?ch=1)
+原生数字图像数据集（Born-Digital Images）[官网](https://rrc.cvc.uab.es/?ch=1) | [下载链接](https://rrc.cvc.uab.es/?ch=1&com=downloads)
 
-注意: 在下载之前，你需要先注册一个账号。
-
-<details open markdown>
-    <summary>从何处下载Born-Digital Images数据集</summary>
-
-[下载地址](https://rrc.cvc.uab.es/?ch=1&com=downloads)
+> 注意: 在下载之前，请先注册一个账号。
 
 该数据集分为4个任务: 任务1为文本定位, 任务2为文本分割, 任务3为单词识别, 任务4为端到端文本检测识别。这里我们仅考虑下载使用任务1数据集。
 
-</details>
-
 下载图像和注释后，解压缩文件并根据需要重命名，例如`train_images`是图像，`train_labels` 是标签, 最终目录结构如下：
 ```txt
 Born-Digital
 
@@ -1,14 +1,8 @@
 # CASIA-10K 数据集
 
 ## 数据集下载
-CASIA-10K 数据集[官网](http://www.nlpr.ia.ac.cn/pal/CASIA10K.html)
 
-<details open markdown>
-    <summary>从何处下载CASIA-10K数据集</summary>
-
-[下载地址](http://www.nlpr.ia.ac.cn/pal/CASIA10K.html)
-
-</details>
+CASIA-10K 数据集[下载链接](http://www.nlpr.ia.ac.cn/pal/CASIA10K.html)
 
 请从上述网站下载数据并解压缩文件。解压文件后，数据结构应该是这样的：
 
 
@@ -2,18 +2,12 @@
 
 ## 数据集下载
 
-CCPD数据集[官网](https://github.com/detectRecog/CCPD)
-<details open markdown>
-    <summary>从何处下载CCPD数据集</summary>
-
-[下载地址](https://github.com/detectRecog/CCPD)
+CCPD数据集[下载链接](https://github.com/detectRecog/CCPD)
 
 该数据集被分为3个部分：训练集、验证集和测试集，每个集合的标签可在`splits`文件夹下发现。
 
 图像的注释可在图像的文件名中找到，具体格式及描述可在[官网](https://github.com/detectRecog/CCPD#dataset-annotations)查阅。
 
-</details>
-
 请从上述网站下载数据并解压缩文件。解压文件后，数据结构应该是这样的：
 
 ```txt
 
@@ -1,12 +1,10 @@
 # 中文文字识别数据集
 
-本文档介绍中文文本识别的数据集准备。
-
 ## 数据下载
 
-按照 [Benchmarking-Chinese-Text-Recognition](https://github.com/FudanVI/benchmarking-chinese-text-recognition) 中的设置，我们使用与 [Datasets](https://github.com/FudanVI/benchmarking-chinese-text-recognition#datasets) 中描述的相同的训练、验证和评估数据。
+按照 [Benchmarking-Chinese-Text-Recognition](https://github.com/FudanVI/benchmarking-chinese-text-recognition) 中的设置，我们使用与 [Datasets](https://github.com/FudanVI/benchmarking-chinese-text-recognition#datasets) 章节中描述的相同的训练、验证和评估数据。
 
-请下载[Download](https://github.com/FudanVI/benchmarking-chinese-text-recognition/blob/main/README.md#download)中介绍的以下LMDB文件：
+请下载 [Download](https://github.com/FudanVI/benchmarking-chinese-text-recognition/blob/main/README.md#download) 章节中介绍的以下LMDB文件：
 
 - 场景数据集：联合数据集包含 [RCTW](https://rctw.vlrlab.net/dataset), [ReCTS](https://rrc.cvc.uab.es/?ch=12&com=downloads), [LSVT](https://rrc.cvc.uab.es/?ch=16&com=introduction), [ArT](https://rrc.cvc.uab.es/?ch=14&com=downloads), [CTW](https://link.springer.com/article/10.1007/s11390-019-1923-y)
 - 网页：[MTWI](https://tianchi.aliyun.com/competition/entrance/231684/introduction)
 
@@ -4,14 +4,9 @@
 
 COCO-Text数据集[官网](https://rrc.cvc.uab.es/?ch=5)
 
-注意: 在下载之前，你需要先注册一个账号。
+数据集图像和JSON标注文件`annotations v1.4 JSON`可从[此处](https://rrc.cvc.uab.es/?ch=5&com=downloads)下载。
 
-<details open markdown>
-    <summary>从何处下载COCO-Text数据集</summary>
-
-[下载地址](https://rrc.cvc.uab.es/?ch=5&com=downloads)，注释可下载 `annotations v1.4 JSON`。
-
-</details>
+> 注意：在下载之前，请先注册一个账号。
 
 请从上述网站下载数据并解压缩文件。解压文件后，数据结构应该是这样的：
 
 
@@ -3,7 +3,7 @@
 您也可以参考 [`convert_datasets.sh`](https://github.com/mindspore-lab/mindocr/blob/main/tools/convert_datasets.sh)。这是将给定目录下所有数据集的标注文件转换为通用格式的Shell 脚本。
 
 <details open markdown>
-<summary>要下载OCR数据集并将其转换为所需的数据格式，请参阅以下介绍.</summary>
+<summary>要下载OCR数据集并将其转换为所需的数据格式，请参阅以下介绍。</summary>
 
 - [Born-Digital Images](borndigital.md)
 - [CASIA-10K](casia10k.md)
 
@@ -2,18 +2,12 @@
 
 ## 数据集下载
 
-COCO-Text数据集[官网](https://ctwdataset.github.io/)
+COCO-Text数据集[官网](https://ctwdataset.github.io/) | [下载链接](https://ctwdataset.github.io/downloads.html)
 
-注意: 您需要填写表格才能下载此数据集。
-
-<details open markdown>
-    <summary>从何处下载CTW数据集</summary>
-
-[下载地址](https://ctwdataset.github.io/downloads.html)
+> 注意: 您需要填写表格才能下载此数据集。
 
 图像分为26批，即26个不同的.tar存档文件，格式为`images-trainval/ctw-trainval*.tar`。所有26批都需要下载。
 注释存档文件名为`ctw-annotations.tar.gz`。
-</details>
 
 下载压缩后的图像后，解压后将所有图像收集到单个文件夹中，例如`train_val/`，注释也进行相应解压。最终目录结构如下：
 
 
@@ -1,9 +1,7 @@
 # SCUT-CTW1500 数据集
 
 ## 数据下载
-文本检测数据集（SCUT-CTW1500）[官网](https://github.com/Yuliang-Liu/Curve-Text-Detector)
-
-[下载数据集](https://github.com/Yuliang-Liu/Curve-Text-Detector)
+文本检测数据集（SCUT-CTW1500）[下载链接](https://github.com/Yuliang-Liu/Curve-Text-Detector)
 
 请从上述网站下载数据并解压缩文件。解压文件后，数据结构应该是这样的：
 
 
@@ -2,19 +2,11 @@
 
 ## 数据集下载
 
-ICDAR2019 ArT数据集[官网](https://rrc.cvc.uab.es/?ch=14)
-
-注意: 在下载之前，你需要先注册一个账号。
-
-<details open markdown>
-    <summary>从何处下载ICDAR2019 ArT数据集</summary>
-
-[下载地址](https://rrc.cvc.uab.es/?ch=14&com=downloads)
+ICDAR2019 ArT数据集 [官网](https://rrc.cvc.uab.es/?ch=14) | [下载链接](https://rrc.cvc.uab.es/?ch=14&com=downloads)
+> 注意: 在下载之前，请先注册一个账号。
 
 图像需要下载“任务1和任务3”部分中的存档文件`train_images.tar.gz`。注释需要下载同一节中的.JSON文件`train_labels.json`。
 
-</details>
-
 请从上述网站下载数据并解压缩文件。解压文件后，数据结构应该是这样的：
 ```txt
 ICDAR2019-ArT
 
@@ -1,18 +1,15 @@
 # ICDAR 2015 数据集
 
 ## 数据集下载
-ICDAR 2015 [文章](https://rrc.cvc.uab.es/?ch=4)
+ICDAR 2015 [官网](https://rrc.cvc.uab.es/?ch=4) | [下载链接](https://rrc.cvc.uab.es/?ch=4&com=downloads)
 
-[下载地址](https://rrc.cvc.uab.es/?ch=4&com=downloads): 在下载之前，您需要先注册一个账号。
-
-<details open markdown>
-  <summary>从何处下载 ICDAR 2015</summary>
+> 注意：在下载之前，请先注册一个账号。
 
 ICDAR 2015 挑战赛分为三个任务。任务1是文本定位。任务3是单词识别。任务4是端到端文本检测识别。任务2文本分割的数据不可用。
 
 ### Text Localization
 
-有四个与任务1相关的文件需要下载（[下载地址](https://rrc.cvc.uab.es/?ch=4&com=downloads)）， 它们分别是：
+有四个与任务1相关的文件需要下载， 它们分别是：
 
 ```
 ch4_training_images.zip
@@ -23,7 +20,7 @@ Challenge4_Test_Task1_GT.zip
 
 ### Word Recognition
 
-有三个与任务3相关的文件需要下载（[下载地址](https://rrc.cvc.uab.es/?ch=4&com=downloads)）， 它们分别是：
+有三个与任务3相关的文件需要下载， 它们分别是：
 
 ```
 ch4_training_word_images_gt.zip
@@ -35,7 +32,7 @@ Challenge4_Test_Task3_GT.txt
 
 ### E2E
 
-有九个与任务4相关的文件需要下载（[下载地址](https://rrc.cvc.uab.es/?ch=4&com=downloads)）。其中包括任务1中的四个文件， 还有五个词汇文件。
+有九个与任务4相关的文件需要下载。其中包括任务1中的四个文件， 还有五个词汇文件。
 
 ```
 ch4_training_vocabulary.txt
 
@@ -2,19 +2,12 @@
 
 ## 数据集下载
 
-LSVT数据集[官网](https://rrc.cvc.uab.es/?ch=16)
+LSVT数据集[官网](https://rrc.cvc.uab.es/?ch=16) | [下载链接](https://rrc.cvc.uab.es/?ch=16&com=downloads)
 
-注意: 在下载之前，你需要先注册一个账号。
-
-<details open markdown>
-    <summary>从何处下载LSVT数据集</summary>
-
-[下载地址](https://rrc.cvc.uab.es/?ch=16&com=downloads)
+> 注意: 在下载之前，请先注册一个账号。
 
 图像需要下载`train_full_images_0.tar.gz`和`train_full_images_1.tar.gz`两个压缩文件，注释需要下载`train_full_labels.json`文件。
 
-</details>
-
 图像下载解压缩后，请合并到同一个文件中，例如`train_images`，最终目录结构如下：
 ```txt
 LSVT
 
@@ -2,18 +2,15 @@
 
 ## 数据集下载
 
-MLT (Multi-Lingual) 2017 [文章](https://ieeexplore.ieee.org/abstract/document/8270168)
+MLT (Multi-Lingual) 2017 [论文](https://ieeexplore.ieee.org/abstract/document/8270168) | [下载链接](https://rrc.cvc.uab.es/?ch=8&com=downloads)
 
-[下载地址](https://rrc.cvc.uab.es/?ch=8&com=downloads): 在下载之前，您需要先注册一个账号。
+> 注意：在下载之前，请先注册一个账号。
 
-<details open markdown>
-  <summary>从何处下载 MLT 2017</summary>
-
-MLT 2017 数据集包含两个任务. 任务 1 是文本检测 (多语言文本)。 任务2是文本识别。
+MLT 2017 数据集包含两个任务：任务 1 是文本检测 (多语言文本)。 任务2是文本识别。
 
 ### 文本检测
 
-有11个与任务1相关的文件需要下载（[下载地址](https://rrc.cvc.uab.es/?ch=8&com=downloads)）， 它们分别是：
+有11个与任务1相关的文件需要下载，它们分别是：
 
 ```
 ch8_training_images_x.zip(x from 1 to 8)
@@ -26,7 +23,7 @@ ch8_validation_localization_transcription_gt_v2.zip
 
 ### 文本识别
 
-有6个与任务2相关的文件需要下载（[下载地址](https://rrc.cvc.uab.es/?ch=8&com=downloads)）， 它们分别是：
+有6个与任务2相关的文件需要下载，它们分别是：
 ```
  ch8_training_word_images_gt_part_x.zip (x from 1 to 3)
  ch8_validation_word_images_gt.zip
 
@@ -2,18 +2,12 @@
 
 ## 数据集下载
 
-LSVT数据集[官网](https://tianchi.aliyun.com/competition/entrance/231651/introduction)
+LSVT数据集[官网](https://tianchi.aliyun.com/competition/entrance/231651/introduction) | [下载链接](https://tianchi.aliyun.com/dataset/137084?t=1687249173526)
 
-注意: 在下载之前，你需要先注册一个账号。
-
-<details open markdown>
-    <summary>从何处下载ICPR MTWI-2018数据集</summary>
-
-[下载地址](https://tianchi.aliyun.com/dataset/137084?t=1687249173526)
+> 注意: 在下载之前，请先注册一个账号。
 
 该数据集共分为3个任务：任务1为网页图像的文本行（列）识别, 任务2为网页图像文本检测, 任务3为端到端的网页图像文本检测和识别，这三个任务共享相同的训练数据：`mtwi_train.zip`；任务1使用`mtwi_task1.zip`作为测试集, 任务2和3使用`mtwi_task2_3.zip`作为测试集。这里我们仅下载和使用`mtw_train.zip`。
 
-</details>
 
 请从上述网站下载数据并解压缩文件。解压文件后，数据结构应该是这样的：
 ```txt
 
@@ -2,16 +2,10 @@
 
 ## 数据集下载
 
-RCTW-17数据集[官网](https://rctw.vlrlab.net/)
-<details open markdown>
-    <summary>从何处下载RCTW-17数据集</summary>
-
-[下载地址](https://rctw.vlrlab.net/dataset)
+RCTW-17数据集[官网](https://rctw.vlrlab.net/) | [下载链接](https://rctw.vlrlab.net/dataset)
 
 图像训练集分为两个集合`train_images.zip.001`和`train_images.zip.002`，注释文件为`*_gts.zip`。
 
-</details>
-
 图像下载解压缩后，请合并到同一个文件中，例如`train_images`，最终目录结构如下：
 ```txt
 RCTW-17
 
@@ -2,16 +2,9 @@
 
 ## 数据集下载
 
-ReCTS数据集[官网](https://rrc.cvc.uab.es/?ch=12)
+ReCTS数据集[官网](https://rrc.cvc.uab.es/?ch=12) | [下载链接](https://rrc.cvc.uab.es/?ch=12&com=downloads)
 
-注意: 在下载之前，你需要先注册一个账号。
-
-<details open markdown>
-    <summary>从何处下载ReCTS数据集</summary>
-
-[下载地址](https://rrc.cvc.uab.es/?ch=12&com=downloads)
-
-</details>
+> 注意: 在下载之前，请先注册一个账号。
 
 请从上述网站下载数据并解压缩文件。解压文件后，数据结构应该是这样的：
 ```txt
 
@@ -2,19 +2,12 @@
 
 ## 数据集下载
 
-SROIE数据集[官网](https://rrc.cvc.uab.es/?ch=13)
+SROIE数据集[官网](https://rrc.cvc.uab.es/?ch=13) | [下载链接](https://rrc.cvc.uab.es/?ch=13&com=downloads)
 
-注意: 在下载之前，你需要先注册一个账号。
-
-<details open markdown>
-    <summary>从何处下载SROIE数据集</summary>
-
-[下载地址](https://rrc.cvc.uab.es/?ch=13&com=downloads)
+> 注意: 在下载之前，请先注册一个账号。
 
 该数据集共3个任务：任务1为文本检测，任务2为OCR，任务3为关键信息提取。这里，我们仅下载和使用任务1数据集。
 
-</details>
-
 请从上述网站下载数据并解压缩文件。解压文件后，数据结构应该是这样的：
 ```txt
 SROIE
 
@@ -1,9 +1,7 @@
 # The Street View Text(SVT) 数据集
 
 ## 数据下载
-街景文本数据集（SVT）[官网](http://www.iapr-tc11.org/mediawiki/index.php/The_Street_View_Text_Dataset)
-
-[下载数据集](http://www.iapr-tc11.org/mediawiki/index.php/The_Street_View_Text_Dataset)
+街景文本数据集（SVT）[下载链接](http://www.iapr-tc11.org/mediawiki/index.php/The_Street_View_Text_Dataset)
 
 请从上述网站下载数据并解压缩文件。解压文件后，数据结构应该是这样的：
 
 
@@ -2,9 +2,11 @@
 
 ## 数据集下载
 
-SynText150k [文章](https://arxiv.org/abs/2002.10200)
+SynText150k [论文](https://arxiv.org/abs/2002.10200)
 
-下载 Syntext-150k (Part1: 54,327 [[imgs]](https://universityofadelaide.box.com/s/1jcvu6z9jojmhzojuqrwxvwxmrlw7uib)[[annos]](https://universityofadelaide.box.com/s/zc73pyzvymqkjg3vkb2ayjol7y5a4fsk). Part2: 94,723 [[imgs]](https://universityofadelaide.box.com/s/ibihmhkzpc1zuh56mxyehad1dv1l73ua)[[annos]](https://universityofadelaide.box.com/s/rk55zheij8ubvwgzg7dfjbxgi27l8xld).)
+下载 Syntext-150k
+- Part1: 54,327 [[图像]](https://universityofadelaide.box.com/s/1jcvu6z9jojmhzojuqrwxvwxmrlw7uib)[[标注]](https://universityofadelaide.box.com/s/zc73pyzvymqkjg3vkb2ayjol7y5a4fsk)
+- Part2: 94,723 [[图像]](https://universityofadelaide.box.com/s/ibihmhkzpc1zuh56mxyehad1dv1l73ua)[[标注]](https://universityofadelaide.box.com/s/rk55zheij8ubvwgzg7dfjbxgi27l8xld)
 
 
 在下载完成后，把这两个文件放在 `[path-to-data-dir]` 文件夹内，如下所示:
 
@@ -4,7 +4,7 @@
 
 SynthText是一个合成生成的数据集，其中单词实例被放置在自然场景图像中，并考虑了场景布局。
 
-[论文](https://www.robots.ox.ac.uk/~vgg/publications/2016/Gupta16/) | [下载SynthText](https://academictorrents.com/details/2dba9518166cbd141534cbf381aa3e99a087e83c)
+[论文](https://www.robots.ox.ac.uk/~vgg/publications/2016/Gupta16/) | [下载链接](https://academictorrents.com/details/2dba9518166cbd141534cbf381aa3e99a087e83c)
 
 下载`SynthText.zip`文件并解压缩到`[path-to-data-dir]`文件夹中：
 ```
 
@@ -1,9 +1,8 @@
 # MSRA Text Detection 500(MSRA-TD500) 数据集
 
 ## 数据下载
-文本检测数据集（MSRA-TD500）[官网](http://www.iapr-tc11.org/mediawiki/index.php/MSRA_Text_Detection_500_Database_(MSRA-TD500))
 
-[下载数据集](http://www.iapr-tc11.org/mediawiki/index.php/MSRA_Text_Detection_500_Database_(MSRA-TD500))
+文本检测数据集（MSRA-TD500）[下载链接](http://www.iapr-tc11.org/mediawiki/index.php/MSRA_Text_Detection_500_Database_(MSRA-TD500))
 
 请从上述网站下载数据并解压缩文件。解压文件后，数据结构应该是这样的：
 
 
@@ -2,14 +2,7 @@
 
 ## 数据集下载
 
-TextOCR数据集[官网](https://textvqa.org/textocr/)
-
-<details open markdown>
-    <summary>从何处下载TextOCR数据集</summary>
-
-[下载地址](https://textvqa.org/textocr/dataset/)
-
-</details>
+TextOCR数据集[官网](https://textvqa.org/textocr/) | [下载链接](https://textvqa.org/textocr/dataset/)
 
 请从上述网站下载数据并解压缩文件。解压文件后，数据结构应该是这样的：
 ```txt