照合名
二重字
照合名として使用可能な二重字は以下のとおりである。
“ae” 、“Ae” 、“AE” 、“ch” 、“Ch” 、“CH” 、“ll” 、“Ll” 、“LL” 、“ss” 、“Ss” 、“SS” 、“nj” 、“Nj” 、“NJ” 、“dz” 、“Dz” 、“DZ” 、“lj” 、“Lj” および “LJ”。
例えば次の正規表現は、
[[.ae.]-c]
照合順が “ae” と “c” の間となるあらゆる文字にマッチする。
POSIX シンボル名
単一文字に加えて以下の表のシンボル名は照合要素名として利用可能である。これにより [
か ]
にマッチさせたい場合に、例えば次のように書くことができる。
[[.left-square-bracket.][.right-square-bracket.]]
名前 |
文字 |
---|---|
NUL |
\x00 |
SOH |
\x01 |
STX |
\x02 |
ETX |
\x03 |
EOT |
\x04 |
ENQ |
\x05 |
ACK |
\x06 |
alert |
\x07 |
backspace |
\x08 |
tab |
\t |
newline |
\n |
vertical-tab |
\v |
form-feed |
\f |
carriage-return |
\r |
SO |
\xE |
SI |
\xF |
DLE |
\x10 |
DC1 |
\x11 |
DC2 |
\x12 |
DC3 |
\x13 |
DC4 |
\x14 |
NAK |
\x15 |
SYN |
\x16 |
ETB |
\x17 |
CAN |
\x18 |
EM |
\x19 |
SUB |
\x1A |
ESC |
\x1B |
IS4 |
\x1C |
IS3 |
\x1D |
IS2 |
\x1E |
IS1 |
\x1F |
space |
\x20 |
exclamation-mark |
! |
quotation-mark |
" |
number-sign |
# |
dollar-sign |
$ |
percent-sign |
% |
ampersand |
& |
apostrophe |
' |
left-parenthesis |
( |
right-parenthesis |
) |
asterisk |
* |
plus-sign |
+ |
comma |
, |
hyphen |
- |
period |
. |
slash |
/ |
zero |
0 |
one |
1 |
two |
2 |
three |
3 |
four |
4 |
five |
5 |
six |
6 |
seven |
7 |
eight |
8 |
nine |
9 |
colon |
: |
semicolon |
; |
less |
< |
equals-sign |
= |
greater-than-sign |
> |
question-mark |
? |
commercial-at |
@ |
left-square-bracket |
[ |
backslash |
\ |
right-square-bracket |
] |
circumflex |
^ |
underscore |
_ |
grave-accent |
` |
left-curly-bracket |
{ |
vertical-line |
| |
right-curly-bracket |
} |
tilde |
~ |
DEL |
\x7F |
名前付き Unicode 文字
(u32regex
型を用いて)Unicode 正規表現を使用すると、Unicode 文字の通常のシンボル名(Unidata.txt
にデータがある)が考慮される。よって、例えば
[[.CYRILLIC CAPITAL LETTER I.]]
は Unicode 文字 0x0418 にマッチする。