You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: 9-regular-expressions/03-regexp-unicode/article.md
+8-8Lines changed: 8 additions & 8 deletions
Display the source diff
Display the rich diff
Original file line number
Diff line number
Diff line change
@@ -18,7 +18,7 @@ Ainsi, les caractères comme `a` et `≈` occupent 2 octets, tandis que les code
18
18
19
19
Il y a longtemps, lorsque le langage JavaScript a été créé, l'encodage Unicode était plus simple : il n'y avait pas de caractères à 4 octets. Ainsi, certaines fonctionnalités du langage les gèrent toujours de manière incorrecte.
20
20
21
-
Par exemple, `length` pense qu'il y a deux caractères:
21
+
Par exemple, la propriété `length` pense qu'il y a deux caractères:
22
22
23
23
```js run
24
24
alert('😄'.length); // 2
@@ -41,9 +41,9 @@ Il existe une bibliothèque logicielle [XRegExp](http://xregexp.com) qui fournit
41
41
42
42
Chaque caractère dans Unicode a beaucoup de propriétés. Ils décrivent à quelle "catégorie" le caractère appartient, et contiennent diverses informations à son sujet.
43
43
44
-
Par exemple, si un caractère a la propriété `Letter` (Lettre), cela signifie que le caractère appartient à un alphabet (de n'importe quelle langue). Et la propriété `Number` (Nombre) signifie que c'est un chiffre: peut-être l'arabe ou le chinois, et ainsi de suite.
44
+
Par exemple, si un caractère a la propriété `Letter` (Lettre), cela signifie que le caractère appartient à un alphabet (de n'importe quelle langue). Et la propriété `Number` (Nombre) signifie que c'est un chiffre: peut-être l'arabe ou le chinois, et ainsi de suite.
45
45
46
-
Nous pouvons rechercher des caractères avec une propriété, écrite comme`pattern:\p{…}`. Pour utiliser `pattern:\p{…}`, une expression régulière doit avoir l'indicateur `pattern:u`.
46
+
Nous pouvons rechercher des caractères avec une propriété, écrite sous la forme`pattern:\p{…}`. Pour utiliser `pattern:\p{…}`, une expression régulière doit avoir l'indicateur `pattern:u`.
47
47
48
48
Par exemple, `\p{Letter}` désigne une lettre dans n'importe quelle langue. Nous pouvons également utiliser `\p{L}`, car `L` est un alias de `Letter` (Lettre). Il existe des alias plus courts pour presque toutes les propriétés.
49
49
@@ -72,7 +72,7 @@ Voici les principales catégories de caractères et leurs sous-catégories:
72
72
- connecteur `Pc`,
73
73
- tiret `Pd`,
74
74
- citation initiale `Pi`,
75
-
- citation final`Pf`,
75
+
- citation finale`Pf`,
76
76
- ponctuation ouvrante `Ps`,
77
77
- ponctuation fermante `Pe`,
78
78
- autre `Po`.
@@ -83,7 +83,7 @@ Voici les principales catégories de caractères et leurs sous-catégories:
83
83
- Symbole `S`:
84
84
- devise `Sc`,
85
85
- modificateur `Sk`,
86
-
-math`Sm`,
86
+
-mathématique`Sm`,
87
87
- autre `So`.
88
88
- Séparateur `Z`:
89
89
- ligne `Zl`,
@@ -97,10 +97,10 @@ Voici les principales catégories de caractères et leurs sous-catégories:
97
97
- substitut `Cs`.
98
98
99
99
100
-
Ainsi, par exemple si nous avons besoin de lettres en minuscules, nous pouvons écrire ``pattern:\p{Ll}`, de signes de ponctuation : `pattern:\p{P}` et ainsi de suite.
100
+
Ainsi, par exemple si nous avons besoin de lettres en minuscules, nous pouvons écrire `pattern:\p{Ll}`, de signes de ponctuation : `pattern:\p{P}` et ainsi de suite.
101
101
102
102
Il existe également d'autres catégories dérivées, comme:
103
-
-`Alphabétique`(`Alpha`), qui comprend les lettres `L`, plus les numéros de lettre `Nl` (par exemple Ⅻ - un caractère pour le chiffre romain 12), plus quelques autres symboles `Other_Alphabetic` (Autre alphabétiques)(`OAlpha`).
103
+
-`Alphabetic` (Alphabétique)(`Alpha`), qui comprend les lettres `L`, plus les numéros de lettre `Nl` (par exemple Ⅻ - un caractère pour le chiffre romain 12), plus quelques autres symboles `Other_Alphabetic` (Autre alphabétiques)(`OAlpha`).
104
104
-`Hex_Digit` comprend des chiffres hexadécimaux : `0-9`, `a-f`.
105
105
- ...Et ainsi de suite.
106
106
@@ -115,7 +115,7 @@ Unicode prend en charge de nombreuses propriétés différentes, leur liste comp
115
115
116
116
Par exemple, recherchons des nombres hexadécimaux, écrits sous la forme `xFF`, où `F` est un chiffre hexadécimal (0..1 ou A..F).
117
117
118
-
Un chiffre hexadécimal peut être désigné par `pattern:\p{Hex_Digit}`:
118
+
Un chiffre hexadécimal peut être désigné par `pattern:\p{Hex_Digit}`:
0 commit comments