Independent Submission S. Sharikov Request for Comments: 5992 Regtime Ltd Category: Informational D. Miloshevic ISSN: 2070-1721 Afilias J. Klensin October 2010
Internationalized Domain Names Registration and Administration Guidelines for European Languages Using Cyrillic
Abstract
抽象
This document is a guideline for registries and registrars on registering internationalized domain names (IDNs) based on (in alphabetical order) Bosnian, Bulgarian, Byelorussian, Kildin Sami, Macedonian, Montenegrin, Russian, Serbian, and Ukrainian languages in a DNS zone. It describes appropriate characters for registration and variant considerations for characters from Greek and Latin scripts with similar appearances and/or derivations.
この文書では、DNSゾーン内(アルファベット順)に基づいて登録する国際化ドメイン名(IDN)のレジストリとレジストラのためのガイドラインボスニア語、ブルガリア語、ベラルーシ語、Kildinサミ、マケドニア、モンテネグロ、ロシア語セルビア語、ウクライナ語です。これは、似た外見および/または派生とギリシャ語とラテン語のスクリプトからの文字の登録およびバリアントの配慮のために適切な文字を記述しています。
Status of This Memo
このメモのステータス
This document is not an Internet Standards Track specification; it is published for informational purposes.
このドキュメントはインターネット標準化過程仕様ではありません。それは、情報提供の目的のために公開されています。
This is a contribution to the RFC Series, independently of any other RFC stream. The RFC Editor has chosen to publish this document at its discretion and makes no statement about its value for implementation or deployment. Documents approved for publication by the RFC Editor are not a candidate for any level of Internet Standard; see Section 2 of RFC 5741.
これは、独立して、他のRFCストリームの、RFCシリーズへの貢献です。 RFC Editorはその裁量でこの文書を公開することを選択し、実装や展開のためにその値についての声明を出すていません。 RFC編集者によって公表のために承認されたドキュメントは、インターネット標準の任意のレベルの候補ではありません。 RFC 5741のセクション2を参照してください。
Information about the current status of this document, any errata, and how to provide feedback on it may be obtained at http://www.rfc-editor.org/info/rfc5992.
このドキュメントの現在の状態、任意の正誤表、そしてどのようにフィードバックを提供するための情報がhttp://www.rfc-editor.org/info/rfc5992で取得することができます。
Copyright Notice
著作権表示
Copyright (c) 2010 IETF Trust and the persons identified as the document authors. All rights reserved.
著作権(C)2010 IETF信託とドキュメントの作成者として特定の人物。全著作権所有。
This document is subject to BCP 78 and the IETF Trust's Legal Provisions Relating to IETF Documents (http://trustee.ietf.org/license-info) in effect on the date of publication of this document. Please review these documents carefully, as they describe your rights and restrictions with respect to this document.
この文書では、BCP 78と、この文書の発行日に有効なIETFドキュメント(http://trustee.ietf.org/license-info)に関連IETFトラストの法律の規定に従うものとします。彼らは、この文書に関してあなたの権利と制限を説明するように、慎重にこれらの文書を確認してください。
Table of Contents
目次
1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.1. Similar Characters and Variants . . . . . . . . . . . . . 3 1.2. Terminology . . . . . . . . . . . . . . . . . . . . . . . 4 2. Languages and Characters . . . . . . . . . . . . . . . . . . . 5 2.1. Bosnian and Serbian . . . . . . . . . . . . . . . . . . . 5 2.2. Bulgarian . . . . . . . . . . . . . . . . . . . . . . . . 5 2.3. Byelorussian (Belarusian, Belarusan) . . . . . . . . . . . 5 2.4. Kildin Sami . . . . . . . . . . . . . . . . . . . . . . . 6 2.5. Macedonian . . . . . . . . . . . . . . . . . . . . . . . . 7 2.6. Montenegrin . . . . . . . . . . . . . . . . . . . . . . . 7 2.7. Russian . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.8. Serbian . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.9. Ukrainian . . . . . . . . . . . . . . . . . . . . . . . . 8 3. Language-Based Tables . . . . . . . . . . . . . . . . . . . . 8 4. Table Processing Rules . . . . . . . . . . . . . . . . . . . . 8 5. Table Format . . . . . . . . . . . . . . . . . . . . . . . . . 8 6. Steps after Registering an Input Label . . . . . . . . . . . . 9 7. Security Considerations . . . . . . . . . . . . . . . . . . . 9 8. Acknowledgments . . . . . . . . . . . . . . . . . . . . . . . 10 9. References . . . . . . . . . . . . . . . . . . . . . . . . . . 10 9.1. Normative References . . . . . . . . . . . . . . . . . . . 10 9.2. Informative References . . . . . . . . . . . . . . . . . . 10 Appendix A. European Cyrillic Character Tables . . . . . . . . . 13
Cyrillic is one of a fairly small number of scripts that are used, with different subsets of characters, to write a large number of languages, some of which are not closely related to the others. When those languages might be used together in a zone (typical of generic TLDs (gTLDs) but likely in other zones both at and below the root), special considerations for intermixing characters may apply. Cyrillic also has the property that, while it is usually considered a separate script from the Latin (Roman) and Greek ones, it shares many characters with them, creating opportunities for visual confusion. Those difficulties are especially pronounced when "all of Cyrillic" is used rather than only the characters associated with a particular language.
キリル文字は、他の人に密接に関連していないそのうちのいくつかの言語、多数の書き込みに、文字の異なるサブセットで、使用されているスクリプトのかなり少数の一つです。これらの言語は(ルートに以下の両方のジェネリックトップレベルドメイン(gTLDを)の代表的なものの、他のゾーンの可能性が高い)ゾーンで一緒に使用される可能性があります場合は、インターミキシングの文字のための特別な考慮事項が適用される場合があります。キリル文字は、また、それは通常、ラテン(ローマ)とギリシャのものとは別のスクリプトと考えている間に、それは視覚的な混乱のための機会を創出し、彼らと多くの文字を共有し、プロパティを持っています。 「キリル文字のすべてが、」特定の言語に関連付けられた文字だけではなく、使用されている場合、これらの困難は特に顕著です。
This specification provides guidelines for the use of Cyrillic, as encoded in Unicode [Unicode52] with internationalized domain name (IDN) labels derived from most "European" languages that use the script (use of the term "European" is a convenience, since there is disagreement about the relevant boundaries for different purposes and, of course, much of Russia lies within geological Asia). Specifically, it covers (in alphabetic order) Bosnian, Bulgarian,
Unicodeでエンコードされたように、この仕様は[Unicode52]国際化ドメイン名(IDN)のラベルは、スクリプト(用語の使用を使用するほとんどの「ヨーロッパ」の言語から派生して利便性があることから、「ヨーロッパ」で、キリル文字の使用のためのガイドラインを提供します)もちろん、ロシアの多くは地質学、アジア内にある、関連する境界についての意見の相違は、異なる目的のためであると。具体的には、ブルガリア語(アルファベット順で)ボスニアをカバー
Byelorussian, the Kildin member of the Sami (often written "Saami") language family, Macedonian, Montenegrin, Russian, Serbian, and Ukrainian. Supplemental tables, based on information in the Unicode Standard and a recently completed Montenegrin government standard [MontenegrinChars] are provided for use with Montenegrin. Moldovan is no longer in official use with Cyrillic script: no registrations are considered likely in Cyrillic, at least within the relevant ccTLD, and it is not further discussed in this document. Languages of Asia that use Cyrillic are not considered here and should be the subject of separate specifications.
ベラルーシ、サミのKildinメンバー(しばしば書かれた「サーミ」)語族、マケドニア、モンテネグロ、ロシア語、セルビア語、およびウクライナ語。 Unicode標準の情報と最近完了モンテネグロ政府の標準[MontenegrinChars]に基づいて、補足の表は、モンテネグロで使用するために提供されています。モルドバはキリル文字での公式使用されていません:なし登録は、少なくとも、関連するccTLDの内、キリル文字ではそうみなされていない、それはさらに、この文書で説明されていません。キリル文字を使用して、アジアの言語はここでは考慮されず、別の仕様の対象とすべきです。
While Cyrillic script is the primary one used for many of the relevant languages and countries, Latin script is often used instead of, or in combination with, it. Standard keyboards used in most of the countries have both Cyrillic and Latin characters. Therefore, some registries could use Latin scripts for domain name registration in their zones. From time to time, some registries and users have claimed that there is a requirement for mixing Cyrillic and Latin characters in the same label. We strongly recommend against such mixing as user confusion is almost certain to result. In addition, registries that support many scripts will probably encounter the need to support labels in Greek or Latin scripts as well as Cyrillic, and a large number of character forms are shared among those three scripts.
キリル文字のスクリプトは、関連する言語と国の多くに使用される主要なものですが、ラテン文字は、多くの場合、代わりに、またはとの組み合わせで、それを使用されています。ほとんどの国で使用される標準的なキーボードはキリル文字とラテン文字の両方を持っています。そのため、いくつかのレジストリは、そのゾーンにドメイン名の登録のためのラテン文字を使用することができます。時々、いくつかのレジストリとユーザーが同じラベルにキリルとラテン文字を混合するための要件があることを主張しています。ユーザーの混乱が発生することはほぼ確実であると私たちは強く、このような混合に対してお勧めします。また、多くのスクリプトをサポートしてレジストリは、おそらくギリシャ語やラテン語のスクリプトだけでなく、キリル文字のラベルをサポートする必要性に遭遇すると、文字の形の多くは、これらの3つのスクリプト間で共有されています。
Because the DNS has no way for the end user to distinguish among the languages that might have been used to inspire a particular label, it seems useful to treat the characters of a large number of languages that use Cyrillic in their writing systems together, rather than trying to differentiate them. The discussion and tables in this specification should provide a foundation for developing more restrictive rules for zones in which only a single language is likely to be used, but it does not specify those language-specific rules.
DNSは、エンドユーザが特定のラベルを鼓舞するために使用されている可能性があります言語を区別するための方法がないので、それはではなく、一緒に彼らの書き込みシステムにキリル文字を使用する言語の多数の文字を治療するのに有用と思われますそれらを区別しようとしています。本明細書における議論やテーブルは、単一の言語が使用される可能性があるが、それはそれらの言語固有のルールを指定しないでゾーンのより制限のルールを開発するための基盤を提供する必要があります。
Readers of this document should be aware that its recommendations are about use in DNS labels. The orthography for some of the languages involved, especially Kildin Sami, is not completely standardized and local usage sometimes permits substitution of Latin-based characters for their Cyrillic equivalents. Unless they are required by official orthographies, those substitutions should generally be avoided in DNS labels because of the risk of additional user confusion with the Latin characters that are visually similar.
このドキュメントの読者は、その勧告はDNSラベルでの使用についてであることを認識すべきです。関与の言語、特にKildinサミのいくつかのための正書法は、完全に標準化されておらず、地元の使用量は、時には彼らのキリル同等物のためのラテン語ベースの文字の置換が可能になります。彼らは公式正書法で要求される場合を除き、これらの置換は、一般的にあるため、視覚的に類似しており、ラテン文字を追加ユーザーの混乱のリスクのDNSラベルでは避けるべきです。
For some human languages, there are characters and/or strings that have equivalent or near-equivalent meanings. If someone is allowed to register a name with such a character or string, the registry might want to automatically register all the names that have the same meaning in that language. Further, some registries might want to restrict the set of characters to be registered for language-based reasons.
一部の人間の言語では、文字および/または同等またはほぼ同等の意味を持つ文字列があります。誰かがそのような文字や文字列で名前を登録することが許可されている場合は、レジストリは自動的にその言語で同じ意味を持つすべての名前を登録することもできます。さらに、いくつかのレジストリは、言語ベースの理由で登録する文字のセットを制限したい場合があります。
So-called "variant techniques", introduced in the JET specification for the CJK script [RFC3743] and its generalization [RFC4290], describe ways of registering IDNs to decrease the risk of misunderstandings, cybersquatting, and other forms of confusion.
CJKスクリプト[RFC3743]とその一般化[RFC4290]のためのJET仕様で導入された、いわゆる「変異体技術」は、誤解、サイバースクワッティング、および混乱の他の形態のリスクを減少させるのIDNを登録する方法について説明します。
The tables below (Appendix A) identify confusable characters in Latin and Greek scripts that might be easily confused with Cyrillic ones.
(付録A)以下の表は、簡単にキリル文字のものと混同される可能性がありますラテン語やギリシャ語のスクリプトで混同しやすい文字を識別します。
As with variant approaches for other scripts (e.g., see RFC 4713 [RFC4713] for the Chinese language or RFC 5564 [RFC5564] for the Arabic language), this document identifies sets of characters that need special consideration and provides information about them. A registry that handles names using these characters can then make a policy decision about how to actually handle them. The options for those policy decisions would include automatically registering all look-alike strings to the same registrant, registering one such string and blocking the others, and so on.
他のスクリプトのバリアントのアプローチと同様に、この文書では、特別な配慮を必要とし、それらについての情報を提供した文字のセットを特定する(例えば、アラビア語の言語のための中国語またはRFC 5564 [RFC5564]のためのRFC 4713 [RFC4713]を参照)。これらの文字を使用して名前を扱うレジストリは、実際にそれらを処理する方法についての政策決定を行うことができます。これらの政策決定のためのオプションが自動的にようにそのような文字列を登録し、他の人をブロックし、同じ登録者にすべてそっくりの文字列を登録し、含まれるであろう。
The terminology that follows is derived from the JET specification for the CJK script [RFC3743] and its generalization [RFC4290], but this specification does not depend on them. All characters listed here have been verified to be "PVALID" under the IDNA2008 specification [RFC5890] [RFC5892].
以下の用語は、CJKスクリプト[RFC3743]とその一般化[RFC4290]のためのJET仕様に由来しているが、この仕様では、それらに依存しません。ここに記載されているすべての文字がIDNA2008仕様[RFC5890] [RFC5892]の下の「PVALID」であることが確認されています。
A "string" is a sequence of one or more characters.
「文字列」は、一つ以上の文字の列です。
This document discusses characters that have equivalent or near-equivalent characters or strings. The "base character" is the character that has one or more equivalents; the "variant(s)" are the character(s) and/or string(s) that are equivalent to the base character.
この文書では、同等またはほぼ同等の文字または文字列を持つ文字について説明します。 「基本文字は」1当量以上を持っているキャラクターです。 「変異体(複数可)、」基本文字と等価である文字(複数可)および/または文字列(複数可)です。
A "registration bundle" is the set of all labels that comes from expanding all base characters for a single name into their variants.
「登録バンドルには、」それらの変形に単一の名前のためにすべての基本文字を拡大してから来ているすべてのラベルのセットです。
A registry is the administrative authority for a DNS zone. That is, the registry is the body that makes and enforces policies that are used in a particular zone in the DNS. The term "registry" applies to all zones in the DNS, not only those that exist at the top level.
レジストリは、DNSゾーンの管理権限です。つまり、レジストリは、DNS内の特定のゾーンで使用されているポリシーを行い、強制体です。用語「レジストリは」だけでなく、トップレベルに存在するもの、DNS内のすべてのゾーンに適用されます。
In the interest of clarity and balance, this document describes a "Base Cyrillic" set of 23 characters for use in comparing the character usage for Russian and Central European languages that use Cyrillic. The balance of this section compares the character usage of the individual languages in that group.
明快さとバランスの関心では、この文書には、キリル文字を使用し、ロシアと中央ヨーロッパ言語の文字の使用量を比較で使用するための23文字の「ベースキリル文字」のセットを記述します。このセクションのバランスは、そのグループ内の個々の言語の文字の使用状況を比較します。
"Base Cyrillic" consists of the following Unicode code points (names associated with these code points and those below appear in Appendix A): U+0430, U+0431, U+0432, U+0433, U+0434, U+0435, U+0436, U+0437, U+043A, U+043B, U+043C, U+043D, U+043E, U+043F, U+0440, U+0441, U+0442, U+0443, U+0444, U+0445, U+0446, U+0447, U+0448.
U + 0430、U + 0431、U + 0432、U + 0433、U + 0434、U + 0435: "ベースキリル" は、以下のUnicodeコードポイント(これらのコードポイントと以下のものに関連付けられた名前は、付録Aに表示される)からなります、U + 0436、U + 0437、U + 043A、U + 043B、U + 043C、U + 043D、U + 043E、U + 043F、U + 0440、U + 0441、U + 0442、U + 0443、U 0444、U + 0445、U + 0446、U + 0447、U + 0448。
In addition, modern writing systems that use Cyrillic do not have digits separate from the "European" ones used with Latin characters. For registries that permit digits to appear in domain name labels, the "Base Cyrillic" code point listed above should be considered to include U+0030, U+0031, U+0032, U+0033, U+0034, U+0035, U+0036, U+0037, U+0038, and U+0039 (Digit Zero, and Digit One through Digit Nine). The Hyphen-Minus character (U+002D) may also be used.
また、キリル文字を使用して近代的な書き込みシステムは、数字は、ラテン文字で使用される「ヨーロッパ」のものとは別に持っていません。ドメイン名ラベルに表示される数字を許可するレジストリについては、上記 "基本キリル" コードポイントがU + 0030、U + 0031、U + 0032、U + 0033、U + 0034、U + 0035を含むと考えられるべきです、 U + 0036、U + 0037、U + 0038、およびU + 0039(桁ゼロ、及び桁〜9桁の一つ)。ハイフンマイナス文字(U + 002D)を用いてもよいです。
It is worth noting that the EU top-level domain registry allows Cyrillic registrations using 32 code points [EU-registry]. That list is sufficient for some of the languages listed here but not for others.
[EU-レジストリ] EUトップレベルドメインレジストリが32個のコードポイントを使用してキリル文字登録を可能にすることは注目に値します。このリストは、他人のために、ここではなく、記載されている言語のいくつかのために十分です。
The individual languages that are the focus of this specification are discussed below (in English alphabetical order).
本明細書の焦点である個々の言語は、(英語のアルファベット順に)以下に説明します。
Bosnian and Serbian have 30 letters in the alphabet and the additional seven characters to the base of 23 shared Cyrillic characters: U+0438, U+0458, U+0452, U+0459, U+045A, U+045B, U+045F.
U + 0438、U + 0458、U + 0452、U + 0459、U + 045A、U +の値に045B、U + 045F:ボスニアとセルビア語はキリル文字を共有23のベースにアルファベットで30文字、追加の7つの文字をしています。
The Bulgarian alphabet has 30 characters, seven in addition to the basic 23: U+0438, U+0439, U+0449, U+044A, U+044C, U+044E, U+044F.
U + 0438、U + 0439、U + 0449、U + 044A、U + 044C、U + 044E、U + 044F:ブルガリア語のアルファベットは30文字、基本的な23のほかに7を持っています。
The Byelorussian (now often spelled Belarusian or Belarusan) alphabet has 32 characters, i.e., nine characters in addition to the Base Cyrillic set of 23 characters: U+0451, U+0456, U+0439, U+044B, U+044C, U+045E, U+044D, U+044E, U+044F.
アルファベットは32個の文字を持っている(現在は多くの場合、ベラルーシやBelarusan綴ら)ベラルーシ、すなわち、23文字の基本キリル文字セットに加えて、9つの文字:U + 0451、U + 0456、U + 0439、U + 044B、U + 044C、 U + 045E、U + 044D、U + 044E、U + 044F。
The phonetics of the Kildin Sami are quite complex and not easily represented in Cyrillic (see, e.g., Kertom's work [Kert]). The orthography is not standardized and the writing system may best be thought of as an attempt to transcribe the language phonetically (primary in Latin script in the 1930s but in Cyrillic more recently). Different scholars have reported different numbers of phonemes, further complicating the transcription process. Kertom identifies 53 consonants with long-short distinctions and, in many cases, hard-soft ones. He also identifies ascending and descending diphthongs and one triphthong as well as more common short and long vowels.
Kildinサミの音声学は非常に複雑かつ容易に(例えば、Kertomの仕事[KERT]を参照)キリル文字で表されていません。正書法は標準化されていないと書き込みシステムが最良の音声学(1930年代のが、キリル文字でラテン文字で主要最近で)言語を転写するための試みとして考えることができます。別の学者は、さらに、転写プロセスを複雑に、音素の異なる数を報告しています。 Kertomは53個のロング・ショートの区別と子音と、多くの場合、ハード・ソフトのものを識別します。彼はまた、昇順と降順二重母音と1 triphthongだけでなく、より一般的な短期および長期の母音を識別します。
The primary reference for Kildin Sami, widely circulated for some time but only in draft, is apparently used by Sami language(s) experts in Scandinavian countries [Riessl07]. It, and the references it cites, uses 56 characters, 33 of which do not appear in the basic set. Eight* of these characters have no precomposed forms in Unicode and hence must be written as a sequence of two code points with the second one being COMBINING MACRON (U+0304). Using parentheses to make the two-code-point sequences more obvious, the additional characters are: (U+0430 U+0304)*, (U+0435 U+0304)*, U+0438, U+0439, (U+043E U+0304), U+044A, U+044B, (U+044B U+0304), U+044C, U+044D, (U+044D U+0304), U+044E, (U+044E U+0304), U+044F, (U+044F U+0304), U+0451, (U+0451 U+0304), U+0458, U+048B, U+048D, U+048F, U+04BB, U+04C6, U+04C8, U+04CA, U+04CE, U+04D3, U+04E3, U+04E7, U+04ED, U+04EF, U+04F1, U+04F9.
広くしばらくの間だけ、ドラフト内で循環Kildinサミのための主要なリファレンスは、明らかにサーミ語(s)はスカンジナビア諸国の専門家[Riessl07]に使用されています。また、それは引用の参照は、基本セットには表示されません。33そのうち56個の文字を使用しています。これらの文字の8 *は、Unicodeには合成済みのフォームを持たず、従って第二つMACRON(U + 0304)を組み合わせることで2つのコード・ポイントのシーケンスとして書き込まれなければなりません。 2コード・ポイントのシーケンスがより明白にするために括弧を使用して、追加の文字は次のとおりです。(U + 0430 U + 0304)*、(U + 0435 U + 0304)*、U + 0438、U + 0439、(U + 043E U + 0304)、U + 044A、U + 044B、(U + 044B U + 0304)、U + 044C、U + 044D、(U + 044D U + 0304)、U + 044E、(U + 044E U + 0304)、U + 044F、(U + 044F U + 0304)、U + 0451、(U + 0451 U + 0304)、U + 0458、U + 048B、U + 048D、U + 048F、U + 04BB、U + 04C8 + 04C6、U、U + 04CA、U + 04CE、U + 04D3、U + 04E3、U + 04E7、U + 04ED、U + 04EF、U + 04F1、U + 04F9。
* These characters, CYRILLIC SMALL LETTER A (U+0430) with a COMBINING MACRON (U+0304) and CYRILLIC SMALL LETTER IE (U+0435) with a COMBINING MACRON (U+0304), respectively, have the same visual appearance as LATIN SMALL LETTER A WITH MACRON (U+0101) and LATIN SMALL LETTER E WITH MACRON (U+0113). There are no known keyboards designed specifically for Kildin Sami. If an extended Latin-based keyboard and associated software are used, these characters might appear with the code point based on Latin (e.g., U+0113 for the second case). By contrast, keyboards and input software that are designed to be more Cyrillic-friendly are more likely to produce code points for the Cyrillic base characters. The use of a Latin character base for that second case occurs in some Western European sources including Riessler's work [Riessl07]. While we have not found explicit substitutions for A with Macron, we believe they might be found in practice. These alternatives are not mapped together by Unicode Normalization Form C (NFC) (or Normalization Form KC (NFKC)), so registries, and possibly applications software, should exercise some care about these coding variations. However, U+0101 and U+0113 are Latin Script characters so, if either is used, any tests on homogeneity of the script within a label need to be made with care.
*これらの文字は、それぞれCOMBINING MACRON(U + 0304)と組み合わせるMACRON(U + 0304)とCYRILLIC SMALL LETTER IE(U + 0435)とCYRILLIC SMALL LETTER A(U + 0430)は、同じ外観を有しますMACRON(U + 0101)とMACRON付きラテン小文字E(U + 0113)付きラテン小文字A。 Kildinサミのために特別に設計された全く知られているキーボードはありません。拡張ラテンベースのキーボード及び関連するソフトウェアが使用される場合、これらの文字は、ラテン語(第2ケースのために、例えば、U + 0113)に基づいて、コードポイントで表示されることがあります。これとは対照的に、キーボードとよりキリルフレンドリーになるように設計されている入力ソフトウェアは、キリル基本文字のコードポイントを生成する可能性が高くなります。その第二ケースのためのラテン文字ベースの使用はRiesslerの仕事[Riessl07]を含むいくつかの西ヨーロッパの源で発生します。我々は長音とAのための明示的な置換を発見していないが、我々は、彼らが実際に見つけられるかもしれないと考えています。これらの選択肢がUnicode正規化形式C(NFC)(または正規化形式KC(NFKC))によって一緒にマップされていない、レジストリ、そしておそらくアプリケーションソフトウェアので、これらの符号化の変動に関するいくつかの注意を払う必要があります。しかし、+ 0101 UとU + 0113には、ラテン文字の文字のいずれかが使用されている場合、ラベル内のスクリプトの均質性のいずれかのテストは注意して行う必要がある、そうです。
Similar issues may apply to other Kildin Sami characters constructed with combining sequences.
同様の問題は、シーケンスを組み合わせて構築され、他のKildinサミ文字に適用される場合があります。
The key references in Russian ([Anto90], [Kert86], [Kuru85]) all propose slightly different character tables relative to each other and to Riessler's list. Because the latter list appears to be more comprehensive and to represent more recent scholarship, we have based the tables in this document on it. We recommend, however, that registries review these recommendations and the relevant papers should registration requests for Kildin Sami actually appear.
ロシアでのキー参照([Anto90]、[Kert86]、[Kuru85])の全ては、互いに相対してRiesslerのリストに、わずかに異なる指標表を提案します。後者のリストは、より包括的であることを、より最近の奨学金を表すように表示されますので、我々はそれにこの文書のテーブルをベースとしています。私たちは、レジストリは、これらの推奨事項を確認し、関連する論文がKildinサミの登録要求が実際に表示される必要があること、しかし、お勧めします。
Additional perspectives on Kildin Sami can be found on the Omniglot Sami pages [OmniglotSaami].
Kildinサミに関する追加視点がOmniglotサミページ[OmniglotSaami]で見つけることができます。
Macedonian has 31 characters in the alphabet. This is eight in addition to the basic set: U+0438, U+0458, U+0452, U+0459, U+045A, U+045C, U+045F, U+0491, U+0455.
マケドニアはアルファベットで31文字が含まれています。 U + 0438、U + 0458、U + 0452、U + 0459、U + 045A、U + 045C、U + 045F、U + 0491、U + 0455:これは、基本セットに加えて、8です。
According to the most recent, and now final, government specification [MontenegrinChars], Montenegrin has 32 characters in its alphabet, including two that have no precomposed forms in Unicode. This is nine in addition to the basic set and two in addition to Bosnian and Serbian: U+0437 U+0301, U+0438, U+0441 U+0301, U+0452, U+0458, U+0459, U+045A, U+045B, U+045F.
最新の、そして今、最終的な、政府の仕様[MontenegrinChars]によると、モンテネグロは、Unicodeには合成済みのフォームを持っていない2を含むそのアルファベットで32個の文字を持っています。これは、ボスニアとセルビア語に加えて、基本セットに加えて、9と2である:U + 0437 U + 0301、U + 0438、U + 0441 U + 0301、U + 0452、U + 0458、U + 0459、U + 045A、U +の値に045B、U + 045F。
See Bosnian, Section 2.1, above.
上記、ボスニア語、2.1節を参照してください。
The current Russian alphabet has 33 characters, consisting of the Base Cyrillic set plus an additional ten characters: U+0451, U+0438, U+0439, U+0449, U+044A, U+044B, U+044C, U+044D, U+044E, U+044F.
U + 0451、U + 0438、U + 0439、U + 0449、U + 044A、U + 044B、U + 044C、U +:現在のロシアのアルファベットは、追加の10の文字との塩基キリル文字からなる、33個の文字を有します044D、U + 044E、U + 044F。
See Bosnian, Section 2.1, above.
上記、ボスニア語、2.1節を参照してください。
The character list for modern Ukrainian has apparently not completely stabilized. Some references claim 31 characters and therefore an additional 8 characters to the Base Cyrillic set of 23. Others claim 33, adding U+0438 and U+0439 and replacing U+044A (Hard Sign) with U+044C (Soft Sign), for a total of an additional 11 characters as compared to the Base Cyrillic set. Unless better information is available, the prudent registry should probably assume that all 34 characters are in use, i.e., the Base Cyrillic set plus U+0438, U+0439, U+0454, U+0456, U+0457, U+0491, U+0449, U+044A, U+044C, U+044E, U+044F.
現代のウクライナのための文字リストは明らかに完全に安定していません。いくつかの参照がため、U + 0438とU + 0439を追加し、U + 044C(ソフトサイン)とU + 044A(ハードサイン)を置き換え、33を主張23その他の基本キリル文字セットに31文字、したがって、追加の8つの文字を請求しますベースキリル文字セットと比較して、付加的な11文字の合計。より良い情報が利用可能でない限り、慎重なレジストリは、おそらくすなわち、ベースキリル文字セットプラスU + 0438、U + 0439、U + 0454、U + 0456、U + 0457、U + 0491、すべての34個の文字が使用されていることを前提とすべきです、U + 0449、U + 044A、U + 044C、U + 044E、U + 044F。
The registration strategy described in this document uses a table that lists all characters allowed for input and any variants of those characters. Note that the table lists all characters allowed, not only the ones that have variants.
この文書で説明した登録戦略を入力し、これらの文字のいずれかの変異体を許可されているすべての文字を一覧表示テーブルを使用しています。テーブルが許可され、すべての文字、バリアントを持っていないものだけをリストしていることに注意してください。
The input to the process is called the "input label". The output of the process is either failure (the input label cannot be registered at all), or a registration bundle that contains one or more labels in A-label form.
プロセスへの入力は、「入力ラベル」と呼ばれています。プロセスの出力は、故障(入力ラベルは、すべてに登録することができない)、またはラベル形態の一つ以上のラベルを含む登録バンドルのいずれかです。
The table in Appendix A consists of four columns. The first and second identify the Cyrillic character, and the third and fourth identify Latin or Greek characters that might be easily confused with them visually. If both a Latin and Greek character are present, the Greek one appears in the third and fourth columns on the subsequent line (with "..." in the first column to indicate more information about the character specified on the previous line). Variants needed only because of case folding are shown with "+++" in the first column, as noted in the table.
付録Aの表には、4つの列で構成されています。第一及び第二のキリル文字を識別し、第3および第4は、ラテン語や視覚的に容易にそれらと混同されるかもしれないギリシャ文字を識別します。ラテン語やギリシャ語の文字の両方が存在する場合には、ギリシャ語の一つは(前の行に指定された文字に関する詳細な情報を示すために、最初の列で、「...」で)それ以降の行に3番目と4番目の列に表示されます。表に記載されているようにのみ理由ケースフォールディングの必要な変異体は、最初の列で「+++」で示されています。
Each character in the table is given in the "U+" notation for Unicode characters followed, in the next column, by its name as shown in the Unicode Standard. For easy reference, the characters are listed in the order in which they appear in the Unicode Standard.
Unicode文字が続くためにユニコード規格に示すように、テーブルの各文字は、その名前によって、次の列では、「U +」の表記で与えられます。簡単に参照できるように、文字は、それらがUnicode標準に表示される順序で記載されています。
The table does not, and any future revision MUST NOT, have more than one entry for a particular base character.
テーブルにはありませんし、将来の改訂版ではありません、特定のベース文字のための複数のエントリを持たなければなりません。
A registry has at least three policy options for handling the cases where the registration bundle has more than one label. These options, and their key implications, are:
レジストリは、登録バンドルが複数のラベルを持っている場合を扱うための少なくとも三つの政策の選択肢を持っています。これらのオプション、およびその主要な影響は、以下のとおりです。
o Allocate all labels to the same registrant, making the zone information identical to that of the input label.
O入力ラベルと同じゾーン情報を作り、同じ登録者にすべてのラベルを割り当てます。
This option will cause end users to be able to find names with variants more easily, but will result in larger zone files. In principle, the zone file could become so large that it could negatively affect the ability of the registry to perform name resolution.
このオプションは、エンドユーザーがより簡単に変形して名前を見つけることができるようになりますが、より大きなゾーンファイルになります。原則として、ゾーンファイルは、それがマイナスの名前解決を行うために、レジストリの能力に影響を与えることができるように大きくなる可能性があります。
o Block all labels so they cannot be registered in the future.
彼らは将来的に登録することはできませんので、Oすべてのラベルをブロックします。
This option does not increase the size of the zone file, but it may cause end users to not be able to find names with variants that they would expect.
このオプションは、ゾーンファイルのサイズを増加させないが、それは、エンドユーザーが期待するの変種で名前を見つけることができないために発生することがあります。
o Allocate some labels and block some other labels.
Oいくつかのラベルを割り当て、他のいくつかのラベルをブロックします。
This option is likely to cause the most confusion with users because including some variants will cause a name to be found, but using other variants will cause the name to be not found.
いくつかの亜種を含むことは発見される名前が発生しますが、他の変異体を使用すると、名前が見つからなかったことになりますので、このオプションは、ユーザーと最も混乱を引き起こす可能性があります。
With any of these three options, the registry MUST keep a database that links each label in the registration bundle to the input label. This link needs to be maintained so that changes in the non-DNS registration information (such as the label's owner name and address) are reflected in every member of the registration bundle as well.
これらの3つのオプションのいずれかを使用すると、レジストリは、入力ラベルに登録バンドルに各ラベルをリンクするデータベースを維持しなければなりません。このリンクは、(例えば、ラベルの所有者の名前や住所など)非DNS登録情報の変更も同様に登録バンドルのすべてのメンバーに反映されるように維持する必要があります。
The information provided in this document may assist DNS zone administrators and registrants in selecting names that are less likely to be confused with others and in adopting policies that help avoid confusion. It may also assist user-interface designers in identifying possible areas of confusion so that they can better protect users. The document otherwise has no consequences for the security of the Internet.
この文書で提供される情報には、他の人とし、混乱を避けるための政策を採用して混乱しにくい名前を選択するには、DNSゾーンの管理者と登録者を助けることができます。それはまた、彼らはより良いユーザーを保護することができるように混乱の可能な分野を特定するには、ユーザーインターフェースの設計者を助けることができます。文書には、そうでない場合は、インターネットのセキュリティには影響を与えません。
Support from Afilias for a major portion of this work is appreciated.
この作品の大部分のためのAfiliasからのサポートが認識されます。
The material on Kildin Sami would not have been possible without the efforts of Cary Karp for his help directly and his pointer to Riessler's work [Riessl07] and from Vladimir Shadrunov and Sergey Nikolaevich Teryoshkin for their own analyses and references ([Anto90], [Kert86], and [Kuru85]) and partial translations from them. We are grateful for their efforts that facilitated treating it nearly the same way as other actively used European languages that use Cyrillic script.
Kildinサミ上の材料は、[Riessl07] Riesslerの仕事に、自分の分析や参照のウラジミールShadrunovとセルゲイ・ニコラエTeryoshkin([Anto90]、[Kert86から直接彼の助けと彼のポインタのためのキャリー・カープの努力なしには不可能でした]、および[Kuru85])及びそれらの部分的翻訳。私たちは、キリル文字を使用する他の積極的な使用のヨーロッパ言語とほぼ同じ方法でそれを処理することが容易彼らの努力に感謝しています。
Careful reading of late drafts of this document by Bill McQuillan, Alexey Melnikov, and Peter Saint-Andre, identified a number of editorial problems, some of which might not have been caught otherwise.
ビルMcQuillan氏の説明による、アレクセイ・メルニコフ、そしてピーターサンタンドレによって、このドキュメントの後半の草稿を注意深く読むと、そうでない場合はキャッチされていない可能性がありますそれらのいくつかの編集多くの問題を、同定しました。
[RFC5895] Resnick, P. and P. Hoffman, "Mapping Characters in Mapping Characters for Internationalized Domain Names in Applications (IDNA) 2008", RFC 5895, September 2010.
[RFC5895]レズニック、P.およびP.ホフマン、 "アプリケーションにおける国際化ドメイン名のマッピング文字でマッピング文字(IDNA)2008"、RFC 5895、2010年9月。
[Unicode52] The Unicode Consortium. The Unicode Standard, Version 5.2.0, defined by: "The Unicode Standard, Version 5.2.0", (Mountain View, CA: The Unicode Consortium, 2009. ISBN 978-1-936213-00-9). <http://www.unicode.org/versions/Unicode5.2.0/>.
【Unicode52]ユニコードコンソーシアム。 "Unicode標準、バージョン5.2.0"、(カリフォルニア州マウンテンビュー:ユニコードコンソーシアム、2009年ISBN 978-1-936213-00-9)によって定義されたUnicode標準、バージョン5.2.0、。 <http://www.unicode.org/versions/Unicode5.2.0/>。
[Anto90] Antonova, A., "Primer for Sami schools first grade: Sami language, 2nd edition", Leningrad: Prosveshchenie, Leningrad department, 1990. Published in Russian, no authoritative translation is known.
[Anto90] Antonova、A.、「サミ学校一年生のためのプライマー:サーミ語、第2版」、レニングラード:Prosveshchenie、レニングラード部門、1990年にはロシア語で出版は、何の権威翻訳は知られていません。
[EU-registry] European Registry of Internet Domain Names (EURid), ".eu Supported Characters", January 2010, <http://www.eurid.eu/en/ eu-domain-names/technical-limitations/ supported-characters>.
[EU-レジストリ]インターネットドメイン名(EURid)のヨーロッパレジストリ、 ".EUサポートされている文字"、2010年1月、<http://www.eurid.eu/en/ EU-ドメイン名/技術-制限/ supported-文字>。
[Kert] Kertom, G., "Kildin dialect of the Sami language". Published in Russian, no authoritative translation is known.
【KERT] Kertom、G.、 "サミ言語のKildin方言"。ロシアで出版され、何の権威翻訳は知られていません。
[Kert86] Kertom, G., "Sami-Russian and Russian-Sami dictionary: textbook for primary school pupils", Leningrad: Prosveshchenie Leningrad Department, 1986. Published in Russian, no authoritative translation is known.
[Kert86] Kertom、G.、「サミ・ロシアおよびロシア・サミ辞書は:小学生用教科書」、レニングラード:ロシアで公開Prosveshchenieレニングラード部門、1986年、何の権威翻訳は知られていません。
[Kuru85] Kuruch, R., "Sami-Russian dictionary: eight thousand words", Moscow: Russkiy yazyk, 1985. Published in Russian, no authoritative translation is known.
[Kuru85] Kuruch、R.、「サミ - ロシア語辞書:8000個の言葉」、モスクワ:ロシアで公開Russkiy yazyk、1985年には、何の権威翻訳は知られていません。
[MontenegrinChars] Crna Gora Ministarstvo prosvjete i nauke (Ministry of Science and Education, Montenegro), "Pravopis Crnogorskoga Jezika I", 2009, <http://www.gov.me/files/1248442673.pdf>. In Montenegrin, no known English translation. See especially the table on page 8.
文部科学[MontenegrinChars]モンテネグロ省(科学と教育省、モンテネグロ)、2009年、<http://www.gov.me/files/1248442673.pdf>「モンテネグロ語とスペル」。そして、モンテネグロが、知らAngleščina翻訳。ページの第八に、特にテーブルを参照してください。
[OmniglotSaami] Ager, S., "Sami (Saami)", 2009, <http://www.omniglot.com/writing/saami.htm>.
【Omniglatjami】以前、S.、 "時間(夫)"、トウ09、<HTTP:oooamanigulotekamaraitimsbamihatama>。
[RFC3743] Konishi, K., Huang, K., Qian, H., and Y. Ko, "Joint Engineering Team (JET) Guidelines for Internationalized Domain Names (IDN) Registration and Administration for Chinese, Japanese, and Korean", RFC 3743, April 2004.
[RFC3743]小西、K.、黄、K.、銭、H.、およびY.コ、 "国際化ドメイン名のための共同エンジニアリングチーム(JET)ガイドライン中国語、日本語、韓国語用(IDN)登録と管理"、 RFC 3743、2004年4月。
[RFC4290] Klensin, J., "Suggested Practices for Registration of Internationalized Domain Names (IDN)", RFC 4290, December 2005.
[RFC4290] Klensin、J.、 "国際化ドメイン名(IDN)の登録のための推奨プラクティス"、RFC 4290、2005年12月。
[RFC4713] Lee, X., Mao, W., Chen, E., Hsu, N., and J. Klensin, "Registration and Administration Recommendations for Chinese Domain Names", RFC 4713, October 2006.
[RFC4713]リー、X.、真央、W.、チェン、E.、スー、N.、およびJ. Klensin、RFC 4713、2006年10月 "中国のドメイン名の登録と管理勧告"。
[RFC5564] El-Sherbiny, A., Farah, M., Oueichek, I., and A. Al-Zoman, "Linguistic Guidelines for the Use of the Arabic Language in Internet Domains", RFC 5564, February 2010.
[RFC5564]エル・Sherbiny、A.、ファラー、M.、Oueichek、I.、およびA.アル・Zoman、 "インターネットのドメインでアラビア語を使用するための言語のガイドライン"、RFC 5564、2010年2月。
[RFC5890] Klensin, J., "Internationalized Domain Names for Applications (IDNA): Definitions and Document Framework", RFC 5890, August 2010.
[RFC5890] Klensin、J.、 "アプリケーション(IDNA)のための国際化ドメイン名:定義とドキュメントフレームワーク"、RFC 5890、2010年8月。
[RFC5892] Faltstrom, P., "The Unicode Code Points and Internationalized Domain Names for Applications (IDNA)", RFC 5892, August 2010.
[RFC5892] Faltstrom、P.、 "Unicodeのコードポイントとアプリケーションのための国際化ドメイン名(IDNA)"、RFC 5892、2010年8月。
[Riessl07] Riessler, M., "Kola Saami character chart (draft)", November 2007.
[Riessl07] Riessler、M.、 "コラサーミの文字チャート(案)"、2007年11月。
Appendix A. European Cyrillic Character Tables
付録A.欧州のキリル文字表
These tables are constructed on the basis of the characters that can actually occur in the DNS, i.e., those that are valid in U-labels as defined in RFC 5890. If the characters that can be mapped into those characters are to be considered instead, then the number of variants would increase considerably. For example, while CYRILLIC SMALL LETTER A (U+0430) and GREEK SMALL LETTER ALPHA (U+03B1) are readily distinguished visually, their capital letter equivalents are not, so, if case mappings such as those discussed in the IDNA2008 Mapping document [RFC5895] are considered, the two small letters must be considered variants of each other. Some of the variants have been selected on the assumption that unusual fonts may be used and that users will see what they expect to see; others, involving subtle decorations but considered more far-fetched out of context, have not been listed.
これらのテーブルは、実際にDNSで発生する可能性があります文字に基づいて構築されている、すなわち、それらの文字にマッピングすることができます文字が代わりに考慮されるべきである場合は、RFC 5890.で定義されているU-ラベルで有効なもので、その後、亜種の数が大幅に増加するであろう。もしそのようなIDNA2008マッピング文書で説明したものとケースマッピングは[例えば、CYRILLIC SMALL LETTER A(U + 0430)、ギリシャSMALL LETTER ALPHA(U + 03B1)は容易に、その大文字の等価物ではない、視覚的に区別そうしている間RFC5895]と考えられているが、二つの小さな文字は、互いの変形を考慮しなければなりません。変種のいくつかは珍しいフォントを使用することができることと、ユーザーが見ることを期待するものが表示されますことを前提に、選択されています。他の人、微妙な装飾が関与するが、文脈からより多くのこじつけと考えるが、上場されていません。
These additional, possibly required, variants are shown below with "+++" in the first column of the table.
これらの追加、おそらく必要な、変異体は、表の最初の欄の「+++」で以下に示されています。
"..." in the first column is used to indicate more information about the character specified on the previous line.
「...」最初の列の前の行に指定された文字についての詳細を示すために使用されます。
Characters needed for European languages, other than Montenegrin and Sami, written in Cyrillic.
モンテネグロとサミ以外のヨーロッパ言語、のために必要な文字は、キリル文字で書かれました。
+----------+--------------------------+---------+-------------------+ | Cyrillic | Unicode Name | Variant | Unicode Name | | Char | | | | +----------+--------------------------+---------+-------------------+ | U+0430 | CYRILLIC SMALL LETTER A | U+0061 | LATIN SMALL | | | | | LETTER A | | | | | | | +++ | | U+03B1 | GREEK SMALL | | | | | LETTER ALPHA | | | | | | | U+0431 | CYRILLIC SMALL LETTER BE | | | | | | | | | U+0432 | CYRILLIC SMALL LETTER VE | U+0062 | LATIN SMALL | | | | | LETTER B | | | | | | | +++ | | U+03B2 | GREEK SMALL | | | | | LETTER BETA | | | | | | | U+0433 | CYRILLIC SMALL LETTER | U+0072 | LATIN SMALL | | | GHE | | LETTER R | | | | | | | +++ | | U+03B3 | GREEK SMALL | | | | | LETTER GAMMA | | | | | | | U+0434 | CYRILLIC SMALL LETTER DE | | | | | | | | | +++ | | U+03B4 | GREEK SMALL | | | | | LETTER DELTA | | | | | | | U+0435 | CYRILLIC SMALL LETTER IE | U+0065 | LATIN SMALL | | | | | LETTER E | | | | | | | +++ | | U+03B5 | GREEK SMALL | | | | | LETTER EPSILON | | | | | | | U+0436 | CYRILLIC SMALL LETTER | | | | | ZHE | | | | | | | | | U+0437 | CYRILLIC SMALL LETTER ZE | | | | | | | | | U+0438 | CYRILLIC SMALL LETTER I | U+0075 | LATIN SMALL | | | | | LETTER U | | | | | | | U+0439 | CYRILLIC SMALL LETTER | | | | | SHORT I | | |
| | | | | | U+043A | CYRILLIC SMALL LETTER KA | U+006B | LATIN SMALL | | | | | LETTER K | | | | | | | ... | | U+03BA | GREEK SMALL | | | | | LETTER KAPPA | | | | | | | U+043B | CYRILLIC SMALL LETTER EL | | | | | | | | | +++ | | U+03BB | GREEK SMALL | | | | | LETTER LAMBDA | | | | | | | U+043C | CYRILLIC SMALL LETTER EM | U+006D | LATIN SMALL | | | | | LETTER M | | | | | | | +++ | | U+03BC | GREEK SMALL | | | | | LETTER MU | | | | | | | U+043D | CYRILLIC SMALL LETTER EN | U+0048 | LATIN CAPITAL | | | | | LETTER H | | | | | | | +++ | | U+0068 | LATIN SMALL | | | | | LETTER H (in some | | | | | fonts) | | | | | | | +++ | | U+03B7 | GREEK SMALL | | | | | LETTER ETA | | | | | | | U+043E | CYRILLIC SMALL LETTER O | U+006F | LATIN SMALL | | | | | LETTER O | | | | | | | ... | | U+03BF | GREEK SMALL | | | | | LETTER OMICRON | | | | | | | U+043F | CYRILLIC SMALL LETTER PE | U+006E | LATIN SMALL | | | | | LETTER N | | | | | | | ... | | U+03C0 | GREEK SMALL | | | | | LETTER PI | | | | | | | U+0440 | CYRILLIC SMALL LETTER ER | U+0070 | LATIN SMALL | | | | | LETTER P | | | | | | | ... | | U+03C1 | GREEK SMALL | | | | | LETTER RHO | | | | | | | U+0441 | CYRILLIC SMALL LETTER ES | U+0063 | LATIN SMALL | | | | | LETTER C |
| | | | | | U + 043A | CYRILLIC SMALL LETTER KA | U + 006B | LATIN SMALL | | | | | LETTER K | | | | | | | ... | | U + 03BA | GREEK SMALL | | | | | LETTER KAPPA | | | | | | | U + 043B | CYRILLIC SMALL LETTER EL | | | | | | | | | +++ | | U + 03BB | GREEK SMALL | | | | | LETTERのLAMBDA | | | | | | | Uの+の043C | CYRILLIC SMALL LETTER EM | U + 006D | LATIN SMALL | | | | | LETTER M | | | | | | | +++ | | U + 03BC | GREEK SMALL | | | | | LETTER MU | | | | | | | U + 043D | CYRILLIC SMALL LETTER EN | U + 0048 | LATIN CAPITAL | | | | | LETTERのH | | | | | | | +++ | | U + 0068 | LATIN SMALL | | | | | LETTERの(一部で| | | | |フォント)H | | | | | | | +++ | | U + 03B7 | GREEK SMALL | | | | | LETTERのETA | | | | | | | U + 043E | CYRILLIC SMALL LETTER O | U + 006F | LATIN SMALL | | | | | LETTER O | | | | | | | ... | | U + 03BF | GREEK SMALL | | | | | LETTERのOMICRON | | | | | | | U + 043F | CYRILLIC SMALL LETTER PE | U + 006E | LATIN SMALL | | | | | LETTER N | | | | | | | ... | | U + 03C0 | GREEK SMALL | | | | | LETTERのPI | | | | | | | U + 0440 | CYRILLIC SMALL LETTERのER | U + 0070 | LATIN SMALL | | | | | LETTER P | | | | | | | ... | | U + 03C1 | GREEK SMALL | | | | | LETTER RHO | | | | | | | U + 0441 | CYRILLIC SMALL LETTERのES | U + 0063 | LATIN SMALL | | | | | LETTERのC |
| | | | | | U+0442 | CYRILLIC SMALL LETTER TE | U+0074 | LATIN SMALL | | | | | LETTER T | | | | | | | +++ | | U+03C4 | GREEK SMALL | | | | | LETTER TAU | | | | | | | U+0443 | CYRILLIC SMALL LETTER U | U+0079 | LATIN SMALL | | | | | LETTER Y | | | | | | | +++ | | U+03C5 | GREEK SMALL | | | | | LETTER UPSILON | | | | | | | U+0444 | CYRILLIC SMALL LETTER EF | U+03D5 | GREEK PHI SYMBOL | | | | | | | +++ | | U+03C6 | GREEK SMALL | | | | | LETTER PHI | | | | | | | U+0445 | CYRILLIC SMALL LETTER HA | U+0078 | LATIN SMALL | | | | | LETTER X | | | | | | | ... | | U+03C7 | GREEK SMALL | | | | | LETTER CHI | | | | | | | U+0446 | CYRILLIC SMALL LETTER | | | | | TSE | | | | | | | | | U+0447 | CYRILLIC SMALL LETTER | | | | | CHE | | | | | | | | | U+0448 | CYRILLIC SMALL LETTER | | | | | SHA | | | | | | | | | U+0449 | CYRILLIC SMALL LETTER | | | | | SHCHA | | | | | | | | | U+044A | CYRILLIC SMALL LETTER | U+0062 | LATIN SMALL | | | HARD SIGN | | LETTER B | | | | | | | U+044B | CYRILLIC SMALL LETTER | | | | | YERU | | | | | | | | | U+044C | CYRILLIC SMALL LETTER | U+0062 | LATIN SMALL | | | SOFT SIGN | | LETTER B | | | | | | | U+044D | CYRILLIC SMALL LETTER E | | | | | | | | | U+044E | CYRILLIC SMALL LETTER YU | | |
| | | | | | U + 0442 | CYRILLIC SMALL LETTER TE | U + 0074 | LATIN SMALL | | | | | LETTERのT | | | | | | | +++ | | U + 03C4 | GREEK SMALL | | | | | LETTERのTAU | | | | | | | U + 0443 | CYRILLIC SMALL LETTER U | U + 0079 | LATIN SMALL | | | | | LETTER Y | | | | | | | +++ | | U + 03C5 | GREEK SMALL | | | | | LETTERのウプシロン| | | | | | | U + 0444 | CYRILLIC SMALL LETTER EF | U + 03D5 | GREEK PHI SYMBOL | | | | | | | +++ | | U + 03C6 | GREEK SMALL | | | | | LETTER PHI | | | | | | | U + 0445 | CYRILLIC SMALL LETTER HA | U + 0078 | LATIN SMALL | | | | | LETTER X | | | | | | | ... | | U + 03C7 | GREEK SMALL | | | | | LETTERのCHI | | | | | | | U + 0446 | CYRILLIC SMALL LETTER | | | | | TSE | | | | | | | | | U + 0447 | CYRILLIC SMALL LETTER | | | | | CHE | | | | | | | | | U + 0448 | CYRILLIC SMALL LETTER | | | | | SHA | | | | | | | | | U + 0449 | CYRILLIC SMALL LETTER | | | | | SHCHA | | | | | | | | | U + 044A | CYRILLIC SMALL LETTER | U + 0062 | LATIN SMALL | | | HARD SIGN | | LETTER B | | | | | | | U + 044B | CYRILLIC SMALL LETTER | | | | | YERU | | | | | | | | | Uの+の044C | CYRILLIC SMALL LETTER | U + 0062 | LATIN SMALL | | | SOFT SIGN | | LETTER B | | | | | | | U + 044D | CYRILLIC SMALL LETTER E | | | | | | | | | U + 044E | CYRILLIC SMALL LETTER YU | | |
| | | | | | U+044F | CYRILLIC SMALL LETTER YA | | | | | | | | | U+0451 | CYRILLIC SMALL LETTER IO | U+00EB | LATIN SMALL | | | | | LETTER E WITH | | | | | DIAERESIS | | | | | | | U+0452 | CYRILLIC SMALL LETTER | | | | | DJE | | | | | | | | | U+0453 | CYRILLIC SMALL LETTER | | | | | GJE | | | | | | | | | U+0454 | CYRILLIC SMALL LETTER | U+03B5 | GREEK SMALL | | | UKRAINIAN IE | | LETTER EPSILON | | | | | | | U+0455 | CYRILLIC SMALL LETTER | U+0073 | LATIN SMALL | | | DZE | | LETTER S | | | | | | | U+0456 | CYRILLIC SMALL LETTER | U+0069 | LATIN SMALL | | | BYELORUSSIAN-UKRAINIAN I | | LETTER I | | | | | | | +++ | | U+03B9 | GREEK SMALL | | | | | LETTER IOTA | | | | | | | U+0457 | CYRILLIC SMALL LETTER | U+03CA | GREEK SMALL | | | UKRAINIAN YI | | LETTER IOTA WITH | | | | | DIALYTIKA | | | | | | | +++ | | U+00EF | LATIN SMALL | | | | | LETTER I WITH | | | | | DIAERESIS | | | | | | | U+0458 | CYRILLIC SMALL LETTER JE | U+006A | LATIN SMALL | | | | | LETTER J | | | | | | | ... | | U+03F3 | GREEK LETTER YOT | | | | | | | U+0459 | CYRILLIC SMALL LETTER | | | | | LJE | | | | | | | | | U+045A | CYRILLIC SMALL LETTER | | | | | NJE | | | | | | | | | U+045B | CYRILLIC SMALL LETTER | | | | | TSHE | | | | | | | |
| | | | | | U + 044F | CYRILLIC SMALL LETTER YA | | | | | | | | | U + 0451 | CYRILLIC SMALL LETTER IO | U + 00EB | LATIN SMALL | | | | | WITH LETTER E | | | | |ダイエレシス| | | | | | | U + 0452 | CYRILLIC SMALL LETTER | | | | | DJE | | | | | | | | | U + 0453 | CYRILLIC SMALL LETTER | | | | | GJE | | | | | | | | | U + 0454 | CYRILLIC SMALL LETTER | U + 03B5 | GREEK SMALL | | |ウクライナIE | | LETTERのEPSILON | | | | | | | U + 0455 | CYRILLIC SMALL LETTER | U + 0073 | LATIN SMALL | | | DZE | | LETTER S | | | | | | | U + 0456 | CYRILLIC SMALL LETTER | U + 0069 | LATIN SMALL | | |ベラルーシ - ウクライナI | | LETTER I | | | | | | | +++ | | U + 03B9 | GREEK SMALL | | | | | LETTER IOTA | | | | | | | U + 0457 | CYRILLIC SMALL LETTER | U + 03CA | GREEK SMALL | | |ウクライナYI | | WITH LETTER IOTA | | | | | DIALYTIKA | | | | | | | +++ | | U + 00EF | LATIN SMALL | | | | | LETTER I WITH | | | | |ダイエレシス| | | | | | | U + 0458 | CYRILLIC SMALL LETTER JE | U + 006A | LATIN SMALL | | | | | LETTERのJ | | | | | | | ... | | U + 03F3 |ギリシャ文字のYOT | | | | | | | U + 0459 | CYRILLIC SMALL LETTER | | | | | LJE | | | | | | | | | U + 045A | CYRILLIC SMALL LETTER | | | | | NJE | | | | | | | | | U +の値に045B | CYRILLIC SMALL LETTER | | | | | TSHE | | | | | | | |
| U+045C | CYRILLIC SMALL LETTER | | | | | KJE | | | | | | | | | U+045D | CYRILLIC SMALL LETTER I | | | | | WITH GRAVE | | | | | | | | | U+045E | CYRILLIC SMALL LETTER | | | | | SHORT U | | | | | | | | | U+045F | CYRILLIC SMALL LETTER | | | | | DZHE | | | | | | | | | U+0491 | CYRILLIC SMALL LETTER | U+0072 | LATIN SMALL | | | GHE WITH UPTURN | | LETTER R | | | | | | | U+04C2 | CYRILLIC SMALL LETTER | | | | | ZHE WITH BREVE | | | +----------+--------------------------+---------+-------------------+
Additional characters needed for Montenegrin written in Cyrillic.
キリル文字で書かれたモンテネグロのために必要な追加の文字。
+--------------+-----------------------------+---------+------------+ | Cyrillic | Unicode Name | Variant | Unicode | | Char | | | Name | +--------------+-----------------------------+---------+------------+ | U+0437 + | CYRILLIC SMALL LETTER ZE | | | | U+0301 | WITH ACUTE | | | | | | | | | U+0441 + | CYRILLIC SMALL LETTER ES | | | | U+0301 | WITH ACUTE | | | +--------------+-----------------------------+---------+------------+
Additional characters needed for Kildin Sami written in Cyrillic.
キリル文字で書かれたKildinサミのために必要な追加の文字。
+----------+---------------------+----------+-----------------------+ | Cyrillic | Unicode Name | Variant | Unicode Name | | Char | | | | +----------+---------------------+----------+-----------------------+ | U+0430 + | CYRILLIC SMALL | U+0101 | LATIN SMALL LETTER A | | U+0304 | LETTER A WITH | | WITH MACRON | | | MACRON | | | | | | | | | ... | | U+03B1 + | GREEK SMALL LETTER | | | | U+0304 | ALPHA WITH MACRON | | | | | | | U+0435 + | CYRILLIC SMALL | U+0113 | LATIN SMALL LETTER E | | U+0304 | LETTER IE WITH | | WITH MACRON | | | MACRON | | | | | | | | | U+043E + | CYRILLIC SMALL | U+014D | LATIN SMALL LETTER O | | U+0304 | LETTER O WITH | | WITH MACRON | | | MACRON | | | | | | | | | ... | | U+03BF + | GREEK SMALL LETTER | | | | U+0304 | OMICRON WITH MACRON | | | | | | | U+044B + | CYRILLIC SMALL | | | | U+0304 | LETTER YERU WITH | | | | | MACRON | | | | | | | | | U+044D + | CYRILLIC SMALL | | | | U+0304 | LETTER E WITH | | | | | MACRON | | | | | | | | | U+044E + | CYRILLIC SMALL | | | | U+0304 | LETTER YU WITH | | | | | MACRON | | | | | | | | | U+044F + | CYRILLIC SMALL | | | | U+0304 | LETTER YA WITH | | | | | MACRON | | | | | | | | | U+0451 + | CYRILLIC SMALL | U+00EB + | LATIN SMALL LETTER E | | U+0304 | LETTER IO WITH | U0304 | WITH DIAERESIS AND | | | MACRON | | MACRON | | | | | | | U+048B | CYRILLIC SMALL | | | | | LETTER SHORT I WITH | | | | | TAIL | | | | | | | |
| U+048D | CYRILLIC SMALL | | | | | LETTER SEMISOFT | | | | | SIGN | | | | | | | | | U+048F | CYRILLIC SMALL | | | | | LETTER ER WITH TICK | | | | | | | | | U+04BB | CYRILLIC SMALL | U+0068 | LATIN SMALL LETTER H | | | LETTER SHHA | | | | | | | | | U+04C6 | CYRILLIC SMALL | | | | | LETTER EL WITH TAIL | | | | | | | | | U+04C8 | CYRILLIC SMALL | | | | | LETTER EN WITH HOOK | | | | | | | | | U+04CA | CYRILLIC SMALL | | | | | LETTER EN WITH TAIL | | | | | | | | | U+04CE | CYRILLIC SMALL | | | | | LETTER EM WITH TAIL | | | | | | | | | U+04D3 | CYRILLIC SMALL | U+00E4 | LATIN SMALL LETTER A | | | LETTER A WITH | | WITH DIAERESIS | | | DIAERESIS | | | | | | | | | U+04E3 | CYRILLIC SMALL | U+016B | LATIN SMALL LETTER U | | | LETTER I WITH | | WITH MACRON | | | MACRON | | | | | | | | | U+04E7 | CYRILLIC SMALL | U+00F6 | LATIN SMALL LETTER O | | | LETTER O WITH | | WITH DIAERESIS | | | DIAERESIS | | | | | | | | | U+04ED | CYRILLIC SMALL | | | | | LETTER E WITH | | | | | DIAERESIS | | | | | | | | | U+04EF | CYRILLIC SMALL | | | | | LETTER U WITH | | | | | MACRON | | | | | | | | | U+04F1 | CYRILLIC SMALL | | | | | LETTER U WITH | | | | | DIAERESIS | | | | | | | |
| U + 048D | CYRILLIC SMALL | | | | | LETTERのSEMISOFT | | | | | SIGN | | | | | | | | | U + 048F | CYRILLIC SMALL | | | | | TICK WITH LETTERのER | | | | | | | | | U + 04BB | CYRILLIC SMALL | U + 0068 | LATIN SMALL LETTER H | | | LETTER SHHA | | | | | | | | | U + 04C6 | CYRILLIC SMALL | | | | | TAIL WITH LETTER EL | | | | | | | | | U + 04C8 | CYRILLIC SMALL | | | | | HOOK WITH LETTER EN | | | | | | | | | U + 04CA | CYRILLIC SMALL | | | | | TAIL WITH LETTER EN | | | | | | | | | U + 04CE | CYRILLIC SMALL | | | | | TAIL WITH LETTER EM | | | | | | | | | U + 04D3 | CYRILLIC SMALL | U + 00E4 | LATIN SMALL LETTER A | | | LETTER A WITH | |ダイエレシスWITH | | |ダイエレシス| | | | | | | | | U + 04E3 | CYRILLIC SMALL | U + 016B | LATIN SMALL LETTER U | | | LETTER I WITH | | MACRON WITH | | | MACRON | | | | | | | | | U + 04E7 | CYRILLIC SMALL | U + 00F6 | LATIN SMALL LETTER O | | | LETTER O WITH | |ダイエレシスWITH | | |ダイエレシス| | | | | | | | | U + 04ED | CYRILLIC SMALL | | | | | WITH LETTER E | | | | |ダイエレシス| | | | | | | | | U + 04EF | CYRILLIC SMALL | | | | | WITH LETTER U | | | | | MACRON | | | | | | | | | U + 04F1 | CYRILLIC SMALL | | | | | WITH LETTER U | | | | |ダイエレシス| | | | | | | |
| U+04F9 | CYRILLIC SMALL | | | | | LETTER YERU WITH | | | | | DIAERESIS | | | +----------+---------------------+----------+-----------------------+
Authors' Addresses
著者のアドレス
Sergey Sharikov Regtime Ltd Kalinina str.,14 Samara 443008 Russia
セージ・シャリコブRegtyme株式会社カリーニン頁、14サマラ443008ロシア
Phone: +7(846) 979-9039 Fax: +7(846)979-9038 EMail: s.shar@regtime.net
電話番号:+7(846)979-9039ファックス:+7(846)979-9038 Eメール:s.shar@regtime.net
Desiree Miloshevic Afilias Oxford Internet Institute, 1 St. Giles Oxford OX1 3JS United Kingdom
デジレ・ミロシェビックAfiliasオックスフォードインターネット研究所、1セントジャイルズオックスフォード3JSイギリス
Phone: +44 7973 987 147 EMail: dmiloshevic@afilias.info
電話:+44 7973 987 147 Eメール:dmiloshevic@afilias.info
John C Klensin 1770 Massachusetts Ave, #322 Cambridge, MA 02140 USA
ジョン・C Klensin 1770マサチューセッツアベニュー、#322ケンブリッジ、MA 02140 USA
Phone: +1 617 491 5735 EMail: john-ietf@jck.com
電話:+1 617 491 5735 Eメール:john-ietf@jck.com