一連の文字と数字の間の対応関係。タスク a6、a7 (1)…(2) コンピュータ上で処理するその他すべての情報 (音声、画像) を数値形式に変換する必要があります。 (3)似ている。自制心を養うための質問

21.08.2020

コンテンツ

I. 情報コーディングの歴史……………………………………..3

II. 情報のコーディング…………………………………………………………4

Ⅲ．テキスト情報のコーディング……………………………….4

IV. エンコードテーブルの種類………………………………………………………………6

V. テキスト情報量の計算……………………………………14

参考文献リスト………………………………..16

私。情報暗号化の歴史

人類は、最初の秘密情報が現れたその瞬間から、テキストの暗号化（エンコーディング）を使用してきました。以下に、人間の思考の発展のさまざまな段階で発明されたテキストエンコード技術をいくつか示します。

暗号化は秘密の書き込みであり、テキストを初心者が理解できないようにするために書き込みを変更するシステムです。

モールス信号または不均一電信符号。各文字または記号は、電流の短い基本バースト (ドット) と持続時間 3 倍の基本バースト (ダッシュ) の独自の組み合わせによって表されます。

既知の最も古い暗号化方式の 1 つは、ローマ皇帝ジュリアスシーザー (紀元前 1 世紀) にちなんで命名されました。この方法は、元の文字から一定の文字数だけアルファベットをずらすことによって、暗号化されたテキストの各文字を別の文字に置き換えることに基づいており、アルファベットは円状に読み取られます。つまり、文字 i の後に、a が考慮されます。。したがって、「byte」という単語は、右に 2 文字シフトされると、「gwlf」という単語としてエンコードされます。暗号化された各文字をその左から 2 番目の文字に置き換えるには、特定の単語を解読する逆のプロセスが必要です。

II.エンコード情報

コードは、事前に定義された概念を記録 (または伝達) するための一連の規則 (または信号) です。

情報コーディングは、情報の特定の表現を形成するプロセスです。より狭い意味では、「コーディング」という用語は、情報表現の 1 つの形式から、保存、送信、または処理により便利な別の形式への移行として理解されることがよくあります。

通常、エンコード (暗号化と呼ばれることもあります) 時の各画像は、個別の符号で表されます。

記号は、互いに異なる要素の有限集合の要素です。

より狭い意味では、「コーディング」という用語は、情報表現の 1 つの形式から、保存、送信、または処理により便利な別の形式への移行として理解されることがよくあります。

文字情報をコンピュータ上で処理することができます。コンピューターに入力されると、各文字は特定の番号でエンコードされ、外部デバイス (画面または印刷物) に出力されると、人間の認識のためにこれらの番号から文字のイメージが構築されます。一連の文字と数字の対応関係を文字エンコーディングと呼びます。

原則として、コンピュータ内のすべての数値は 0 と 1 を使用して表されます (人間が通常使用する 10 桁ではありません)。言い換えれば、コンピュータは通常、次のような環境で動作します。バイナリシステムこの場合、それらを処理するためのデバイスがはるかに単純になるためです。コンピュータに数値を入力して人間が読めるように出力することは、通常の 10 進数形式で行うことができ、必要な変換はすべてコンピュータ上で実行されるプログラムによって実行されます。

Ⅲ．テキスト情報のエンコード

同じ情報をいくつかの形式で表現 (エンコード) できます。コンピューターの出現により、個人と人類全体が扱うあらゆる種類の情報をエンコードする必要が生じました。しかし人類は、コンピューターの出現よりもずっと前に、情報のエンコードの問題を解決し始めました。人類の偉大な成果である文字と算術は、音声と数値情報を符号化するためのシステムにすぎません。情報は純粋な形で現れることはなく、常に何らかの形で、何らかの形でエンコードされて提示されます。

バイナリコーディングは、情報を表現する一般的な方法の 1 つです。コンピュータ、ロボット、数値制御機械では、原則として、デバイスが扱うすべての情報はバイナリアルファベットの単語の形式でエンコードされます。

60 年代後半以降、テキスト情報の処理にコンピュータが使用されることが多くなり、現在、世界中のパーソナルコンピュータの大部分 (そしてほとんどの場合) がテキスト情報の処理に使用されています。コンピューター内のこれらの種類の情報はすべてバイナリコードで表現されます。つまり、アルファベットの 2 乗が使用されます (0 と 1 の 2 つの文字のみ)。これは、情報を一連の電気インパルスの形式で表現するのが便利であるという事実によるものです。インパルスは存在しません (0)、インパルスは存在します (1)。

このようなコーディングは通常バイナリと呼ばれ、0 と 1 の論理シーケンス自体は機械語と呼ばれます。

コンピュータの観点から見ると、テキストは個々の文字で構成されます。記号には、文字 (大文字または小文字、ラテン語またはロシア語) だけでなく、数字、句読点、「=」、「(」、「&」などの特殊文字、さらには (特に注意してください) も含まれます。単語間のスペース。

テキストはキーボードを使用してコンピュータのメモリに入力されます。キーには、私たちがよく知っている文字、数字、句読点、その他の記号が書かれています。彼らはバイナリコードでRAMに入ります。これは、各文字が 8 ビットのバイナリコードで表されることを意味します。

T 従来、1 文字をエンコードするには、1 バイトに等しい情報量が使用されます。つまり、I = 1 バイト = 8 ビットです。起こり得るイベントの数 K と情報量 I を結び付ける式を使用すると、エンコードできる異なるシンボルの数を計算できます (シンボルが起こり得るイベントであると仮定して): K = 2 I = 2 8 = 256、つまり To の場合テキスト情報を表す場合は、256 文字までのアルファベットを使用できます。

この文字数は、ロシア語とラテン語のアルファベットの大文字と小文字、数字、記号、グラフィックシンボル等

コーディングとは、各文字に 0 ～ 255 の固有の 10 進コード、または 00000000 ～ 11111111 の対応する 2 進コードが割り当てられることです。したがって、人間は文字をその輪郭で区別し、コンピュータはコードで区別します。

バイトはメモリのアドレス指定可能な最小部分であり、したがってテキストを処理するときにプロセッサが各文字に個別にアクセスできるため、バイト単位の文字エンコードの利便性は明らかです。一方、256 文字は、さまざまな記号情報を表すのに十分な数です。

コンピューター画面にシンボルを表示するプロセスでは、逆のプロセス、つまりデコード、つまりシンボルコードをその画像に変換するプロセスが実行されます。特定のコードをシンボルに割り当てることは合意事項であり、それがコードテーブルに記録されることが重要です。

ここで、各文字にどの 8 ビットバイナリコードを割り当てるかという問題が生じます。これが条件付きの問題であることは明らかであり、さまざまなエンコード方法が考えられます。

コンピュータのアルファベットのすべての文字には 0 ～ 255 の番号が付けられています。各数字は、00000000 ～ 11111111 の 8 ビットバイナリコードに対応しています。このコードは、単に 2 進数体系における文字のシリアル番号です。

Ⅳ。エンコードテーブルの種類

コンピュータのアルファベットのすべての文字に通し番号を割り当てたテーブルをエンコードテーブルと呼びます。

のためにさまざまな種類コンピューターはさまざまなエンコーディングテーブルを使用します。

ASCII（American Standard Code for Information Interchange）コード表が国際標準として採用されており、文字の前半部分を0～127の数値コードでエンコードしています（0～32のコードは文字ではなくファンクションキーに割り当てられています）。。

ASCII コード表は 2 つの部分に分かれています。

表の前半のみが国際標準です。 0 (00000000) から 127 (01111111) までの数字を持つ文字。

ASCIIエンコードテーブルの構造

シリアルナンバー		シンボル
	00000000 - 00011111	0 から 31 までの数字を持つシンボルは、通常、制御シンボルと呼ばれます。その機能は、画面上にテキストを表示したり、印刷したり、フィードしたりするプロセスを制御することです。音声信号、テキストマークアップなど。
	0100000 - 01111111	表の標準部分 (英語)。これには、ラテンアルファベットの小文字と大文字、10 進数、句読点、あらゆる種類の括弧、商業記号およびその他の記号が含まれます。文字 32 はスペースです。テキスト内の空の位置。
	10000000 - 11111111	他のすべては特定の兆候によって反映されます。表の代替部分 (ロシア語)。コードページ (10000000 から始まり 11111111 で終わる 128 個のコード) と呼ばれる ASCII コードテーブルの後半には、さまざまなオプションを含めることができ、各オプションには独自の番号が付いています。

コードページは主に、ラテン語以外の各国のアルファベットに対応するために使用されます。ロシアの国別エンコーディングでは、ロシア語のアルファベットの文字がテーブルのこの部分に配置されます。

ASCIIコード表の前半

エンコード表では、文字（大文字と小文字）はアルファベット順に、数字は昇順に並べられていることに注意してください。記号の配置における辞書編集上のこの順序の遵守は、アルファベットの逐次コーディングの原理と呼ばれます。

ロシア語のアルファベットの文字についても、順次コーディングの原則が適用されます。

ASCIIコード表の後半

歴史的に見て、コンピューター上でロシア文字をエンコードするための最初の標準の 1 つは KOI8 (「情報交換コード、8 ビット」) でした。このエンコーディングは 70 年代に ES コンピュータシリーズのコンピュータで使用され、80 年代半ばから最初のロシア語化バージョンで使用され始めました。オペレーティング·システムユニックス。

MS DOS オペレーティングシステムが優勢だった 90 年代初頭から、CP866 エンコーディングが残っています (「CP」は「コードページ」、「コードページ」を意味します)。

Mac OS オペレーティングシステムを実行している Apple コンピュータは、独自の Mac エンコーディングを使用します。

さらに、国際標準化機構 (ISO) は、ISO 8859-5 と呼ばれる別のエンコーディングをロシア語の標準として承認しました。

現在使用されている最も一般的なエンコーディングは Microsoft Windows、略称 CP1251 です。マイクロソフトによって導入されました。ロシア連邦における同社のオペレーティングシステム (OS) およびその他のソフトウェア製品の広範な配布を考慮すると、広範囲に配布されていることがわかります。

90 年代後半以降、文字エンコーディングの標準化の問題は、Unicode と呼ばれる新しい国際標準の導入によって解決されました。

これは 16 ビットのエンコーディングです。各文字に 2 バイトのメモリが割り当てられます。もちろん、これにより占有されるメモリの量は 2 倍に増加します。ただし、このようなコードテーブルでは、最大 65536 文字を含めることができます。 Unicode 標準の完全な仕様には、世界中の既存のアルファベット、絶滅したアルファベット、および人工的に作成されたすべてのアルファベットに加え、多くの数学、音楽、化学、その他の記号が含まれています。

コンピュータメモリ内の単語の内部表現

ASCII テーブルを使用する

別のコンピュータから受信したロシア語のアルファベットの文字で構成されるテキストが読めないことが時々起こります。ある種の「アブラカダブラ」がモニター画面に表示されます。これは、コンピュータがロシア語に異なる文字エンコーディングを使用するために発生します。

したがって、各エンコーディングは独自のコードテーブルによって指定されます。表からわかるように、異なるエンコーディングでは異なる文字が同じバイナリコードに割り当てられます。

N たとえば、CP1251 エンコーディングの一連の数値コード 221、194、204 は「コンピュータ」という単語を形成しますが、他のエンコーディングでは意味のない文字のセットになります。

幸いなことに、これはアプリケーションに組み込まれた特別なコンバータプログラムによって行われるため、ほとんどの場合、ユーザーはテキストドキュメントのトランスコードについて心配する必要はありません。

V。テキスト情報量の計算

タスク 1: KOI8-R および CP1251 エンコードテーブルを使用して、単語「Rome」をエンコードします。

解決：

タスク 2:各文字が 1 バイトでエンコードされると仮定して、次の文の情報量を見積もってください。

「私の叔父には最も誠実なルールがあります。

私が大病を患った時、

彼は自分に敬意を払うよう強制した

そして、これ以上良いことは思いつきませんでした。」

解決：このフレーズには、句読点、引用符、スペースを含む 108 文字が含まれています。この量に 8 ビットを掛けます。 108*8=864 ビットになります。

タスク 3: 2 つのテキストには同じ数の文字が含まれています。最初のテキストはロシア語で書かれ、2 番目のテキストはナグリ族の言語で書かれており、そのアルファベットは 16 文字で構成されています。誰の文章に書かれているかもっと情報？

解決：

1) I = K * a (テキストの情報量は、文字数と 1 文字の情報重みの積に等しい)。

2) なぜならどちらのテキストも同じ文字数 (K) を持ち、その違いはアルファベット 1 文字の情報量 (a) によって決まります。

3) 2 a1 = 32、つまり a 1 = 5 ビット、2 a2 = 16、つまり 2 = 4 ビット。

4) I 1 = K * 5 ビット、I 2 = K * 4 ビット。

5) これは、ロシア語で書かれたテキストには 5/4 倍の情報が含まれていることを意味します。

タスク 4: 2048 文字を含むメッセージのサイズは 1/512 MB でした。アルファベットのパワーを決定します。

解決：

1) I = 1/512 * 1024 * 1024 * 8 = 16384 ビット - メッセージの情報量をビットに変換します。

2) a = I / K = 16384 /1024 = 16 ビット - アルファベットの 1 文字を占めます。

3) 2*16*2048 = 65536 文字 – 使用されるアルファベットのパワー。

タスク 5: Canon LBP レーザープリンタは、平均 6.3 Kbps の速度で印刷します。 1 ページに平均 45 行、1 行あたり 70 文字 (1 文字 - 1 バイト) があることがわかっている場合、8 ページの文書を印刷するにはどのくらい時間がかかりますか?

解決：

1) 1 ページに含まれる情報量を求めます: 45 * 70 * 8 ビット = 25200 ビット

2) 8 ページの情報量を求めます: 25200 * 8 = 201600 ビット

3) 一般的な測定単位に換算します。これを行うには、M ビットをビットに変換します: 6.3*1024=6451.2 ビット/秒。

4) 印刷時間を見つけます: 201600: 6451.2 = 31 秒。

中古文献リスト

アゲエフ VM 情報とコーディング理論: 測定情報のサンプリングとコーディング。 - M.: MAI、1977 年。

クズミン I.V.、ケドルス V.A. 情報理論とコーディングの基礎。 - キエフ、ヴィシュチャ学校、1986年。

テキスト暗号化の最も簡単な方法 / D.M. ズラトポルスキー。 – M.: Chistye Prudy、2007 – 32 p.

ウグリノビッチND コンピューターサイエンスと情報技術。 10〜11年生用の教科書/N.D. Ugrinovich。 – M.: ビノム。知識の実験室、2003年 – 512 p.

http://school497.spb.edu.ru/uchint002/les10/les.html#n

数値形式。上で述べたように、コンピューターは数値形式で提示された情報のみを処理できます。他のすべての情報 (音、画像、計器の測定値など) は、コンピューターで処理するために数値形式に変換する必要があります。たとえば、音をデジタル化するには、音の強さを短い間隔で測定し、各測定の結果を数値形式で表示できます。コンピュータープログラムを使用すると、受信した情報を変換できます。たとえば、さまざまなソースからの音を互いに「重ね合わせる」ことができます。結果は音声形式に変換し直すことができます。

文字エンコーディング。コンピュータでテキスト情報を処理するには、通常、コンピュータに入力するときに各文字が特定の番号でエンコードされ、外部デバイス (画面または印刷物) に出力されるときに、人間の認識のためにこれらの番号から対応する文字のイメージが構築されます。一連の文字と数字の対応関係を文字エンコーディングと呼びます。 IBM PC で最も一般的に使用される文字エンコーディングについては、第 10 章と第 32 章で説明します。

二進法。原則として、コンピューター内のすべての数値は、人間が通常使用している 10 桁ではなく、0 と 1 を使用して表されます。言い換えれば、コンピューターは通常 2 進数システムで動作します。これにより、コンピューターの構造がはるかに単純になるからです。コンピュータに数値を入力し、人間が読めるように出力することは、人々に馴染みのある 10 進数形式で行うことができます。必要な変換はすべて、コンピュータ上で実行されるプログラムによって実行できます。

ビットとバイト。コンピュータの情報の単位は 1 ビット、つまり 1 ビットです。値 0 または 1 を取ることができる 2 進数。通常、コンピュータ命令は個々のビットではなく、一度に 8 ビットを操作します。連続する 8 ビットで 1 バイトが構成されます。 1 バイトは、可能な 256 文字のうちの 1 文字の値をエンコードできます (256 = 2)。情報のより大きな単位は、1024 バイト (1024=2) に等しいキロバイト (略称 KB)、1024 KB に等しいメガバイト (略称 MB)、および 1024 MB に等しいギガバイト (GB) です。向きについては、平均 2500 文字がテキストページに収まる場合、1 MB は約 400 ページ、1 GB は 400,000 ページであるとします。

コンピュータはどのように動作するのでしょうか?

1945 年に最初のコンピューターが作成されたときでさえ、有名な数学者ジョンフォンノイマンは、コンピューターが普遍的かつ汎用性の高いものとなるようにコンピューターをどのように構造化すべきかを説明しました。効果的な装置情報処理のため。コンピューター設計のこれらの基本は、フォン・ノイマン原理と呼ばれます。現在、大多数のコンピューターは、基本機能においてフォン・ノイマンの原理に従っています。

コンピュータデバイス。まず第一に、フォン・ノイマンの原則によれば、コンピューターには次のデバイスが必要です。

· 算術論理算術演算および論理演算を実行するデバイス。

· 制御装置、プログラムの実行プロセスを組織します。

· メモリ、または約を保存するためのメモリ

· グラムとデータ。

· 外部デバイス情報の入出力用。

コンピュータのメモリは、番号が付けられた特定の数のセルで構成されている必要があり、各セルには処理されたデータまたはプログラム命令のいずれかを含めることができます。すべてのメモリセルは、他のコンピュータデバイスから同様に簡単にアクセスできなければなりません。

これは、コンピュータデバイス間の接続のあるべき姿です (単一の線は制御接続を示し、二重線は情報接続を示します)。

コンピュータの動作原理。一般的に、コンピュータの動作は次のように説明できます。まず、何らかの外部デバイスを使用して、プログラムがコンピュータのメモリに入力されます。制御デバイスは、プログラムの最初の命令 (コマンド) が配置されているメモリセルの内容を読み取り、その実行を組織します。このコマンドは、算術演算または論理演算を実行したり、メモリからデータを読み取って算術演算または論理演算を実行したり、その結果をメモリに書き込んだり、外部デバイスからメモリにデータを入力したり、メモリから外部デバイスにデータを出力したりすることができます。

通常、制御デバイスは 1 つのコマンドを実行した後、そのコマンドの直後に位置するメモリセルからコマンドの実行を開始します。ただし、この順序はコントロール転送（ジャンプ）命令を使用して変更できます。これらのコマンドは、他のメモリ位置に含まれるコマンドから開始してプログラムの実行を継続する必要があることを制御デバイスに示します。プログラム内のこのような「ジャンプ」または遷移は常に実行されるわけではなく、特定の条件が満たされた場合にのみ実行されます。たとえば、いくつかの数値が等しい場合、前の算術演算の結果がゼロだった場合などです。これにより、プログラム内で同じコマンドシーケンスを何度も使用したり (つまり、ループを構成したり)、特定の条件の充足に応じて異なるコマンドシーケンスを実行したりすることができます。複雑なプログラムを作成します。

したがって、制御装置はプログラム命令を自動的に実行します。人間の介入なしで。と情報交換できるラムおよび外部コンピュータデバイス。外部デバイスはコンピュータの他の部分よりもはるかに低速で動作する傾向があるため、制御デバイスは外部デバイスとの I/O 操作が完了するまでプログラムの実行を一時停止する場合があります。実行されたプログラムのすべての結果はコンピュータの外部デバイスに出力される必要があり、その後コンピュータは外部デバイスからの信号を待ち続けます。

特徴現代のコンピューター 。現在のコンピューターの設計は上記のものとは多少異なることに注意してください。特に、算術論理演算ユニットと制御ユニットは、通常、組み合わせて使用されます。単一のデバイス- 中央プロセッサ。さらに、外部コンピュータデバイスからの受信信号に関連する緊急アクション、つまり割り込みを実行するために、プログラムの実行プロセスを中断することができます。高速コンピュータの多くは、複数のプロセッサで並列処理を実行します。

ロシア語でタスク A6、A7、A8、A9、A10、A11 を解く

テキストを読み、タスク A6 ～ A11 を完了してください。

(1)...(2) 他のすべての情報 (音声、画像) は、コンピューターで処理できるように数値形式に変換する必要があります。 (3) テキスト情報はコンピュータ上でも同様に処理されます。コンピュータに入力されると、各文字は特定の番号でエンコードされ、外部デバイスに転送されると、これらの番号を使用して対応する文字の画像が構築されます。 (4)この一連の文字と数字の対応関係を文字コードといいます。 (5) コンピュータ内のすべての数字は、人間が通常使用する 10 桁ではなく、0 と 1 を使用して表されます。 (6)... コンピュータは通常 2 進数システムで動作します。

A6

このテキストの中で最初に来るべき文は次のうちどれですか?

1) パーソナルコンピュータ- これらは情報を処理するための汎用デバイスです。
2) コンピュータは数値形式で提示された情報のみを処理できます。
3) 長期使用を目的としたすべての情報はファイルに保存されます。
4) コンピュータ内の情報は、メモリまたはフロッピーやハードディスクなどのさまざまな媒体に保存されます。

正解は文章No.2です。文 2 では ( 他のすべての情報 (音声、画像) は、コンピューターで処理するために数値形式に変換する必要があります。) ヒントがあります。「その他の情報」というフレーズは、前の文がコンピューターによってどのような種類の情報が処理されるかについて述べられているはずであることを示しています ( 数値で表現される情報).

課題A7のロシア語での解答

A7

次の単語 (単語の組み合わせ) のうち、6 番目の文の空白に入るのはどれですか?

1)まず 2)しかし 3)さらに 4)つまり、

正解はNo.4（ 言い換えると）、最後の文が以前に述べたことをすべて要約しているためです。導入工事 言い換えると先ほど述べたことを要約する一般化の意味があります。

課題A8のロシア語での解答

A8

テキストの 2 番目の文の文法上の基礎となる単語は何ですか?

1) 処理する情報
2) 情報は、
3) 情報を変換する必要がある
4) 変換された情報

文法的基礎は、文の主要メンバー、または文の唯一の主要メンバーによって形成される組み合わせです。それ（文法的基礎）には、原則として、文の本質全体が含まれています。
2番目の文の主語は、情報、述語 – 変換する必要があります.
よって、正解はNo.3となります。

課題A9のロシア語での解答

A9

テキストの 3 番目の文の正しい特徴を示してください。

1) 非組合および組合調整接続を含む複雑な
2) 化合物
3) 複雑な非結合
4) 非組合および同盟従属による複合体

文の種類を判断するには、まずその文の文法的根拠を見つける必要があります。提案概要を作成しましょう。

テキスト情報はコンピュータ上でも同様の方法で処理されます。コンピュータに入力されると、各文字は特定の番号でエンコードされ、外部デバイスに転送されると、これらの番号から対応する文字の画像が構築されます。

1.[情報が処理される]: 2.[文字が暗号化される]、そして 3.[文字のイメージが構築される]。

文中でいくつかの (3) 文法的基礎を強調しているため、文は複雑です。図からわかるように、パート No. 1 とパート No. 2 は非和集合接続 (筆記ではコロン) で接続されており、パート No. 2 とパート No. 3 は等位接続詞を使用して接続されています。あ。したがって、この文章は、非同盟および同盟の調整関係を伴う複雑なものとして特徴付けられます。
正解はNo.1です

タスクA10のロシア語での解答

A10

テキストの 2 番目の文から「CONVERTED」という単語の正しい形態学的特徴を示します。

1) 能動分詞
2) 受動分詞
3) 短い形容詞
4) 完了分詞

言葉 変換された動詞から派生した 変換するそして質問に答えます とは何ですか? したがって、これは一般的な連体詞（特徴）の意味を持つ言語形成です。ロシア語では、分詞のみが動作による記号の意味を持ちます。分詞の能動態または受動態は、形式的な指標 (接尾辞による) によって簡単に決定されます。実分詞には接尾辞 -ush-/-yush-、-ash-/-yash-、-vsh-、-v-、受動態が含まれます。 em -、-im-、-n-/-nn-。
したがって、 変換された– 受動分詞、正解は No. 2 です。

ロシア語でのタスク A11 の解決策

A11

文 3 の CODED という単語の意味を示してください。

1) 特定のシーケンスで再生されます
2) 常にそれを繰り返す
3) テキストとして書かれる
4) ある記号体系から別の記号体系に変換される

このテキストでは、コンピュータが数値情報のみをどのように認識するかについて説明しています。コンピュータは、テキストを含む他のすべての情報を数値情報に変換します。ある記号体系から別の記号体系に変換されます。
正解はNo.4です

こちらも参照

2. さまざまなキリル文字エンコーディング。

1. テキストのバイナリコーディング。コードテーブル。

ご存知のとおり、コンピューターに入力されるすべての情報は、一連の電気インパルスに変換されます。通常、インパルスの存在は「1」、存在しない場合は「0」と表されます。この情報をエンコードする方法は、バイナリまたはバイナリと呼ばれます。 1 つの 2 進文字をビットと呼びます。 (少し - 英語から バイナリ 桁 - 「2進数」)。

テキスト情報がコンピュータに入力されると、各文字は特定の番号でエンコードされ、外部デバイス (画面または印刷物) に出力されると、人間の認識のためにこれらの番号から文字のイメージが構築されます。一連の文字と数字の対応関係を文字エンコーディングと呼びます。

従来、1 文字をエンコードするには 1 バイト (8 ビット) に等しい情報量が使用されます。コーディングは、各文字に一意の 10 進コード (または対応する 2 進コード) を割り当てることで構成されます。シンボルコードはコンピュータメモリに保存され、すでに述べたように 1 バイトを占めます。この方法では、256 個の異なる文字をエンコードできます (256 = 2) 8 ）。この文字数は、ロシア語アルファベットの大文字と大文字、数字、記号、図形記号などを含むテキスト情報を表すのに十分です。

このようなアルファベットの各文字には 0 ～ 255 の固有の 10 進コードが割り当てられ、各 10 進コードは 00000000 ～ 11111111 の 8 ビットの 2 進コードに関連付けられています。したがって、コンピューターはコードによって文字を区別します。

コンピュータやオペレーティングシステムの種類が異なると、異なるエンコードテーブルが使用され、エンコードテーブル内でアルファベットが配置される順序も異なります。

現在、ロシア文字にはいくつかの異なるエンコーディング (コードテーブル) があります。したがって、あるエンコーディングでテキストが作成された場合、別のエンコーディングでは正しく表示されません。

各エンコーディングが独自のコードテーブルによって指定されていることは明らかです。異なるエンコーディングの同じバイナリコードは、異なる文字に対応します。

異なるエンコーディングで入力されたテキストの読み取りと編集を可能にするために、ロシア語のテキストコード変換プログラムが使用されます。一部のテキストエディタ (MSWord など) には、さまざまなエンコーディングでテキストを読み取ることができるコンバータプログラムが組み込まれています。

シンボルへの特定のコードの割り当ては合意事項であり、特定のコードテーブルに記録されます。コード表は国際標準として採用されています アスキー。このコード表では、ラテン文字 (大文字と小文字) がアルファベット順に配置されています。数値の配置も値の増加順に並べられます。この規則は他のエンコーディングテーブルにも見られ、アルファベットの順次エンコーディングの原則と呼ばれます。

このコード表の標準アスキー最初の 128 文字のみです。つまり、0 (バイナリコード 00000000) から 127 (01111111) までの番号が付いた文字です。これには、ラテン語のアルファベットの文字、数字、句読点、括弧、およびその他の記号が含まれます。残りの 128 コードは、128 (バイナリコード 10000000) で始まり 255 (11111111) で終わり、各国のアルファベット、擬似文字、科学記号のエンコードに使用されます。

1. 音声情報のバイナリコーディング。

2. 時間サンプリング。

3. 音の深さ。

4. サンプリング周波数。