From 5e368846b6efba357291ef18076d18e6a1153b10 Mon Sep 17 00:00:00 2001 From: AlightSoulmate <2314297572@qq.com> Date: Tue, 1 Apr 2025 20:23:53 +0800 Subject: [PATCH 1/5] [csv/zh-cn] Add translation for csv tutorials --- zh-cn/csv.md | 78 ++++++++++++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 78 insertions(+) create mode 100644 zh-cn/csv.md diff --git a/zh-cn/csv.md b/zh-cn/csv.md new file mode 100644 index 0000000000..24970a9647 --- /dev/null +++ b/zh-cn/csv.md @@ -0,0 +1,78 @@ +--- +language: CSV +contributors: +- [Timon Erhart, 'https://github.com/turbotimon/'] +translators: +- [Luca Yu, 'https://github.com/AlightSoulmate/'] +--- + +CSV(Comma-Separated Values,逗号分隔值)是一种轻量级纯文本表格数据格式,常用于程序间数据交换,特别适合电子表格与数据库传输。其简单结构和易读性使其成为跨平台数据互操作的“一等公民”,能有效解决格式不兼容问题。 + +虽然 RFC 4180 提供了 CSV 格式的标准,但在实际应用中,"CSV" 这一术语通常被广义地用于指代任何符合以下条件的文本文件: + +- 可被解析为表格数据 +- 使用分隔符分隔字段(列) +- 使用换行符分隔记录(行) +- 可选地在第一行包含表头 + +```csv +Name, Age, DateOfBirth +Alice, 30, 1993-05-14 +Bob, 25, 1998-11-02 +Charlie, 35, 1988-03-21 +``` + +## 行与列的分隔符 + +每行数据用换行符(`\n`或`\r\n`)分隔,各字段则用特定分隔符隔开。虽然逗号最常用,但在某些地区(如德国用逗号表示小数时)会改用分号(`;`)。制表符(`\t`)分隔的则称为TSV(制表符分隔值)。 + +示例:使用分号作为分隔符,并使用逗号表示小数点: + +```csv +Name; Age; Grade +Alice; 30; 50,50 +Bob; 25; 45,75 +Charlie; 35; 60,00 +``` + +## 数据类型 + +CSV 文件本身不定义数据类型。数字和日期均以纯文本存储,并且具体的解析方式取决于导入该文件的软件。通常情况下,数据的解析方式如下: + +```csv +数据, 解析方式 +1.100, 解析为整数 (integer) +2.100.00, 解析为浮点数 (floating-point) +3.2024-12-03, 解析为日期或字符串(取决于解析器) +4.Hello World, 解析为文本字符串 (string) +5."1234", 解析为文本(string),而非数字 +``` + +## 字符串引用与特殊字符 + +只有当字符串包含分隔符、特殊字符,或可能被误认为数字时,才必须使用引号。但通常建议始终加上引号,以提高文档可读性和健壮性。 + +```csv +示例: +1.未加引号的字符串, +2."建议加引号的字符串(良好实践)", +3."如果包含分隔符,则必须加引号", +4."如果包含特殊字符(如换行符 \n 或制表符 \t),也必须加引号", +5."引号字符本身通常通过双写引号("")来转义", +6."某些系统则使用反斜杠来转义引号(例如:\")", +``` + +强烈建议同一份文档内的引用方式保持一致,例如,上方示例的5、6分别使用 `""` 和 `\"` 转义引号,混用它们将导致解析错误。 + +## 编码格式 + +CSV 文件可能使用不同的字符编码。大多数现代 CSV 文件使用 UTF-8 编码,但旧系统可能仍然采用 ASCII 或 ISO-8859 等其他编码格式。 + +如果 CSV 文件需要在不同系统之间传输或共享,建议**明确指定编码格式**,以避免字符解析错误。 + +如果你接触过爬虫或数据库,一定熟悉CSV文件,我建议你通过学习python等语言的csv文件操作来熟悉csv格式特性! + +## 更多资源 + ++ [维基百科](https://en.wikipedia.org/wiki/Comma-separated_values) ++ [RFC 4180](https://datatracker.ietf.org/doc/html/rfc4180) \ No newline at end of file From c672ddc17645d3ca076d2a822f496192c444d3ec Mon Sep 17 00:00:00 2001 From: AlightSoulmate <2314297572@qq.com> Date: Tue, 1 Apr 2025 21:02:45 +0800 Subject: [PATCH 2/5] modified: zh-cn/csv.md --- zh-cn/csv.md | 8 ++++++-- 1 file changed, 6 insertions(+), 2 deletions(-) diff --git a/zh-cn/csv.md b/zh-cn/csv.md index 24970a9647..0cf987525c 100644 --- a/zh-cn/csv.md +++ b/zh-cn/csv.md @@ -6,7 +6,9 @@ translators: - [Luca Yu, 'https://github.com/AlightSoulmate/'] --- -CSV(Comma-Separated Values,逗号分隔值)是一种轻量级纯文本表格数据格式,常用于程序间数据交换,特别适合电子表格与数据库传输。其简单结构和易读性使其成为跨平台数据互操作的“一等公民”,能有效解决格式不兼容问题。 +CSV(逗号分隔值)是一种轻量级纯文本表格数据格式,其结构简单、可读性高,常用于程序间数据交换。 + +CSV 格式十分适合表格与数据库传输,能有效解决格式不兼容问题,使其成为跨平台数据互操作的“一等公民”。 虽然 RFC 4180 提供了 CSV 格式的标准,但在实际应用中,"CSV" 这一术语通常被广义地用于指代任何符合以下条件的文本文件: @@ -24,7 +26,9 @@ Charlie, 35, 1988-03-21 ## 行与列的分隔符 -每行数据用换行符(`\n`或`\r\n`)分隔,各字段则用特定分隔符隔开。虽然逗号最常用,但在某些地区(如德国用逗号表示小数时)会改用分号(`;`)。制表符(`\t`)分隔的则称为TSV(制表符分隔值)。 +行:每行数据用换行符(`\n`或`\r\n`)分隔。 + +列:各字段常用特定分隔符(常用逗号)隔开,只在某些地区(如德国用逗号表示小数)改用分号(`;`)。制表符(`\t`)分隔的称为TSV(制表符分隔值)。 示例:使用分号作为分隔符,并使用逗号表示小数点: From 56c7f6bb62ec5f41b056a02c0494c91411c905e2 Mon Sep 17 00:00:00 2001 From: AlightSoulmate <2314297572@qq.com> Date: Tue, 1 Apr 2025 21:12:51 +0800 Subject: [PATCH 3/5] modified: zh-cn/csv.md --- zh-cn/csv.md | 14 ++++++++------ 1 file changed, 8 insertions(+), 6 deletions(-) diff --git a/zh-cn/csv.md b/zh-cn/csv.md index 0cf987525c..5f1cf6b4b7 100644 --- a/zh-cn/csv.md +++ b/zh-cn/csv.md @@ -41,7 +41,9 @@ Charlie; 35; 60,00 ## 数据类型 -CSV 文件本身不定义数据类型。数字和日期均以纯文本存储,并且具体的解析方式取决于导入该文件的软件。通常情况下,数据的解析方式如下: +CSV 文件本身不定义数据类型。数字和日期均以纯文本存储。 + +具体的解析方式取决于导入该文件的软件。通常情况下,数据的解析方式如下: ```csv 数据, 解析方式 @@ -54,7 +56,7 @@ CSV 文件本身不定义数据类型。数字和日期均以纯文本存储, ## 字符串引用与特殊字符 -只有当字符串包含分隔符、特殊字符,或可能被误认为数字时,才必须使用引号。但通常建议始终加上引号,以提高文档可读性和健壮性。 +当字符串包含分隔符、特殊字符,或可能被误认为数字时,必须使用引号。通常建议始终加上引号,以提高文档可读性和健壮性。 ```csv 示例: @@ -66,15 +68,15 @@ CSV 文件本身不定义数据类型。数字和日期均以纯文本存储, 6."某些系统则使用反斜杠来转义引号(例如:\")", ``` -强烈建议同一份文档内的引用方式保持一致,例如,上方示例的5、6分别使用 `""` 和 `\"` 转义引号,混用它们将导致解析错误。 +强烈建议同一份文档内的引用方式保持一致,例如,上方示例5、6分别用 `""` 和 `\"` 转义引号,而混用将导致解析错误。 ## 编码格式 -CSV 文件可能使用不同的字符编码。大多数现代 CSV 文件使用 UTF-8 编码,但旧系统可能仍然采用 ASCII 或 ISO-8859 等其他编码格式。 +CSV 文件可能使用不同的字符编码。现代大多使用 UTF-8 ,但旧系统可能仍然采用 ASCII 或 ISO-8859 等。 -如果 CSV 文件需要在不同系统之间传输或共享,建议**明确指定编码格式**,以避免字符解析错误。 +如果 CSV 文件需要在不同系统之间传输或共享,建议明确指定编码格式,以避免解析错误。 -如果你接触过爬虫或数据库,一定熟悉CSV文件,我建议你通过学习python等语言的csv文件操作来熟悉csv格式特性! +最后,如果你接触过爬虫或数据库,一定熟悉CSV文件,我建议你通过学习python等语言的csv文件操作来熟悉csv格式特性! ## 更多资源 From 2e437a7f27488dc06c1df26f04b381643b479ae9 Mon Sep 17 00:00:00 2001 From: AlightSoulmate <2314297572@qq.com> Date: Tue, 1 Apr 2025 21:39:23 +0800 Subject: [PATCH 4/5] modified: zh-cn/csv.md --- zh-cn/csv.md | 40 +++++++++++++++++++++++----------------- 1 file changed, 23 insertions(+), 17 deletions(-) diff --git a/zh-cn/csv.md b/zh-cn/csv.md index 5f1cf6b4b7..6dd332882b 100644 --- a/zh-cn/csv.md +++ b/zh-cn/csv.md @@ -1,16 +1,20 @@ --- language: CSV contributors: -- [Timon Erhart, 'https://github.com/turbotimon/'] + - [Timon Erhart, "https://github.com/turbotimon/"] translators: -- [Luca Yu, 'https://github.com/AlightSoulmate/'] + - [Luca Yu, "https://github.com/AlightSoulmate/"] --- -CSV(逗号分隔值)是一种轻量级纯文本表格数据格式,其结构简单、可读性高,常用于程序间数据交换。 +CSV(逗号分隔值)是一种轻量级纯文本表格数据格式,十分适合表格与数据库传输,常用于程序间数据交换。 -CSV 格式十分适合表格与数据库传输,能有效解决格式不兼容问题,使其成为跨平台数据互操作的“一等公民”。 +它具有以下显著特点: -虽然 RFC 4180 提供了 CSV 格式的标准,但在实际应用中,"CSV" 这一术语通常被广义地用于指代任何符合以下条件的文本文件: +- 结构简单 +- 直观易读 +- 跨系统兼容性强 + +"CSV" 这一术语可以指代任何符合以下条件的文本文件: - 可被解析为表格数据 - 使用分隔符分隔字段(列) @@ -28,7 +32,7 @@ Charlie, 35, 1988-03-21 行:每行数据用换行符(`\n`或`\r\n`)分隔。 -列:各字段常用特定分隔符(常用逗号)隔开,只在某些地区(如德国用逗号表示小数)改用分号(`;`)。制表符(`\t`)分隔的称为TSV(制表符分隔值)。 +列:各字段常用逗号隔开,只在某些地区(如德国用逗号表示小数)改用分号(`;`)。用制表符(`\t`)分隔的称为 TSV(制表符分隔值)。 示例:使用分号作为分隔符,并使用逗号表示小数点: @@ -56,29 +60,31 @@ CSV 文件本身不定义数据类型。数字和日期均以纯文本存储。 ## 字符串引用与特殊字符 -当字符串包含分隔符、特殊字符,或可能被误认为数字时,必须使用引号。通常建议始终加上引号,以提高文档可读性和健壮性。 +只有当字符串包含分隔符、特殊字符,或可能被误认为数字时,才必须用引号进行引用。 + +不过建议始终给字符串加上引号,以提高可读性和健壮性。 ```csv 示例: -1.未加引号的字符串, +1.未加引号的字符串, 2."建议加引号的字符串(良好实践)", 3."如果包含分隔符,则必须加引号", -4."如果包含特殊字符(如换行符 \n 或制表符 \t),也必须加引号", -5."引号字符本身通常通过双写引号("")来转义", -6."某些系统则使用反斜杠来转义引号(例如:\")", +4."如果包含特殊字符(如换行符 \n 或制表符 \t),也必须加引号", +5."引号字符本身通常通过双写引号("")来转义", +6."某些系统则使用反斜杠来转义引号(例如:\")", ``` -强烈建议同一份文档内的引用方式保持一致,例如,上方示例5、6分别用 `""` 和 `\"` 转义引号,而混用将导致解析错误。 +注意同一份文档内的引用方式保持一致,例如示例 5、6 分别用 `""` 和 `\"` 转义引号,混用将导致解析错误。 ## 编码格式 -CSV 文件可能使用不同的字符编码。现代大多使用 UTF-8 ,但旧系统可能仍然采用 ASCII 或 ISO-8859 等。 +现代大多使用 UTF-8 编码格式,但旧系统可能仍然采用 ASCII 或 ISO-8859 等。 -如果 CSV 文件需要在不同系统之间传输或共享,建议明确指定编码格式,以避免解析错误。 +在不同系统之间传输或共享 CSV 文件时,建议明确指定编码格式,以避免解析错误。 -最后,如果你接触过爬虫或数据库,一定熟悉CSV文件,我建议你通过学习python等语言的csv文件操作来熟悉csv格式特性! +最后,如果你接触过爬虫或数据库,一定熟悉 CSV 文件,我建议你通过学习 python 等语言的 csv 文件操作来熟悉 csv 格式特性! ## 更多资源 -+ [维基百科](https://en.wikipedia.org/wiki/Comma-separated_values) -+ [RFC 4180](https://datatracker.ietf.org/doc/html/rfc4180) \ No newline at end of file +- [维基百科](https://en.wikipedia.org/wiki/Comma-separated_values) +- [RFC 4180](https://datatracker.ietf.org/doc/html/rfc4180) From 94977cd16b3192b023cc5e08cadbdc1646c73674 Mon Sep 17 00:00:00 2001 From: AlightSoulmate <2314297572@qq.com> Date: Tue, 1 Apr 2025 21:43:27 +0800 Subject: [PATCH 5/5] modified: zh-cn/csv.md --- zh-cn/csv.md | 12 ++++++------ 1 file changed, 6 insertions(+), 6 deletions(-) diff --git a/zh-cn/csv.md b/zh-cn/csv.md index 6dd332882b..b9c189c8d0 100644 --- a/zh-cn/csv.md +++ b/zh-cn/csv.md @@ -1,20 +1,20 @@ --- language: CSV contributors: - - [Timon Erhart, "https://github.com/turbotimon/"] + - [Timon Erhart, 'https://github.com/turbotimon/'] translators: - - [Luca Yu, "https://github.com/AlightSoulmate/"] + - [Luca Yu, 'https://github.com/AlightSoulmate/'] --- CSV(逗号分隔值)是一种轻量级纯文本表格数据格式,十分适合表格与数据库传输,常用于程序间数据交换。 -它具有以下显著特点: +它具有以下特点: - 结构简单 - 直观易读 - 跨系统兼容性强 -"CSV" 这一术语可以指代任何符合以下条件的文本文件: +在实际应用中,"CSV" 这一术语可以指代任何符合以下条件的文本文件: - 可被解析为表格数据 - 使用分隔符分隔字段(列) @@ -45,9 +45,9 @@ Charlie; 35; 60,00 ## 数据类型 -CSV 文件本身不定义数据类型。数字和日期均以纯文本存储。 +CSV 文件本身不定义数据类型,数字和日期均以纯文本存储,具体的解析方式取决于导入该文件的软件。 -具体的解析方式取决于导入该文件的软件。通常情况下,数据的解析方式如下: +通常,数据的解析方式如下: ```csv 数据, 解析方式