KOI Kodu Tablo 8. KOI8-R Kodlama

- kalkış (@comradzampolit) 17 Ağustos 2017

Koi8-R nasıl çalışıyor?

KOI8-R, Kiril alfabelerinin harflerini kodlamak için tasarlanmış sekiz bit kod sayfasıdır. Geliştiriciler, Rus alfabesinin sembollerini, Kiril sembollerinin konumlarının, masanın altındaki İngilizce alfabesindeki fonetik analoglarına karşılık gelecek şekilde yerleştirmiştir. Ve eğer bu kodlamaya yazılmış metinde, her sembolün sekizinci bitini kaldırmak için, Latin harflerine benzer metin elde edilir.

Böyle bir Exchange kodu, AB AB serisinin bilgisayarlarındaki yetmişli yıllarda ve seksenlerin ortasından, ilk Russianed versiyonlarında kullanmaya başladı. işletim sistemi Unix.

Kodlama, her sembole benzersiz bir kodun atandığı: 00000000'den 11111111'e kadar. Böylece, bir kişi tasarımlarındaki sembolleri ve bilgisayarlarına göre, kodlarına göre.

Chernova şimdi kodlaması mı?

Değil. Eski sekiz bit bilgisayarlar için alakalıydı, şimdi Unicode esas olarak çeşitli formatlarda kullanılıyor.

KOI8-R Kodlama

ISO 8859-5 kodlama

ISO 8859-5

Alternatif kodlama

"Alternatif kodlama" - İkinci yarıdaki tüm belirli Avrupa sembollerinin Kiril ile değiştirildiği CP437 kod sayfasına dayanarak, sözde karakterleri bozulmadan bırakır. Sonuç olarak, bu, metin pencerelerini kullanarak programların türünü bozmaz ve ayrıca içinde Kiril karakterlerinin kullanımını sağlar.

Tarihsel olarak, birçok alternatif kodlama seçeneği vardı, ancak tüm farklılıklar sadece 0xf0 - 0xff bölgesi (240-255) ile ilgilidir. Nihai standardı, desteği MS-DOS sürüm 6.22'ye eklenen IBM CP866 kodlamasıydı (her türlü "kendi kendine yapımı" çatlaklar kullanıldı. Alternatif kodlama hala canlı ve DOS ve OS / 2 ortamında son derece popülerdir. . Buna ek olarak, bu kodlama B'yi kaydedilir. dosya sistemi Şişman. CP866 hala rusfied sistemlerinin konsolunda kullanılmaktadır. windows ailesi Nt.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .D. .E.e. .F.
8. 410. B 411. 412'de. G 413. D 414. E 415. 416. S 417. Ve 418. 419. 41A'ya. L 41b. M 41c. H 41d. O 41e. P 41f.
9. R 420. 421 ile. T 422. 423. F 424 X 425. C 426. H 427. W 428. Shch 429. KOMMERSANT 42A. 42b. B 42c. E 42d. Yu 42e. Ben 42F'im.
A. 430. B 431. 432'de. G 433. D 434. E 435. 2036. s 437. ve 438. 439. 43A'ya. L 43b. m 43c. H 43d. Yaklaşık 43E. p 43f.
B. ░ 2591 ▒ 2592 ▓ 2593 │ 2502 ┤ 2524 ╡ 2561 ╢ 2562 ╖ 2556 ╕ 2555 ╣ 2563 ║ 2551 ╗ 2557 ╝ 255d. ╜ 255c. ╛ 255b. ┐ 2510
C. └ 2514 ┴ 2534. ┬ 252c. ├ 251c. ─ 2500 ┼ 253c. ╞ 255e. ╟ 255f. ╚ 255A. ╔ 2554 ╩ 2569 ╦ 2566 ╠ 2560 ═ 2550 ╬ 256c. ╧ 2567
D. ╨ 2568 ╤ 2564 ╥ 2565 ╙ 2559 ╘ 2558 ╒ 2552 ╓ 2553 ╫ 256b. ╪ 256A. ┘ 2518 ┌ 250c. █ 2588 ▄ 2584 ▌ 258c. ▐ 2590 ▀ 2580
E. R 440. 441'den. T 442. 443'te. F 444. x 445. C 446. H 447. sh 448. Shch 449. KOMMERSANT 44A. s 44b. B 44c. E4D. Yu 44e. Ben 44F
F. E 301. ё 451. Є 404. є 454. Ї 407. ї 457. Ў 40e. ў 45e. ° B0. ∙ 2219 · B7. √ 221A. № 2116 ¤ A4. ■ 25A0. A0.

SO 8859-5 - Kiril kaydetmek için ISO-8859 serisinden 8 bit kodlama. Rusya'da neredeyse kullanılmıyor. Genel olarak, ISO 8859-5, bir çizgi (-), boğulma ağacı (""), derece (°), vb. Gibi gerekli karakterlerin çoğuna sahip olmadığı için çok uygun bir kodlama değildir.



.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .D. .E.e. .F.
8. 80 81 82 83 84 85 86 87 88 89 8a. 8b. 8c. 8d. 8e. 8f.
9. 90 91 92 93 94 95 96 97 98 99 9a. 9b. 9c. 9d. 9e. 9f.
A. A0. E 301. € 402. Ѓ 403. Є 404. Ѕ 405. 406. Ї 407. Ј 408. Љ 409. Њ 40A Ћ 40b. Ќ 40c. Reklam Ў 40e. Џ 40F.
B. 410. B 411. 412'de. G 413. D 414. E 415. 416. S 417. Ve 418. 419. 41A'ya. L 41b. M 41c. H 41d. O 41e. P 41f.
C. R 420. 421 ile. T 422. 423. F 424 X 425. C 426. H 427. W 428. Shch 429. KOMMERSANT 42A. 42b. B 42c. E 42d. Yu 42e. Ben 42F'im.
D. 430. B 431. 432'de. G 433. D 434. E 435. 2036. s 437. ve 438. 439. 43A'ya. L 43b. m 43c. H 43d. Yaklaşık 43E. p 43f.
E. R 440. 441'den. T 442. 443'te. F 444. x 445. C 446. H 447. sh 448. Shch 449. KOMMERSANT 44A. s 44b. B 44c. E4D. Yu 44e. Ben 44F
F. № 2116 ё 451. 452. ѓ 453. є 454. ѕ 455. 456. ї 457. ј 458. љ 459. њ 45A. ћ 45b. ќ 45c. § A7. ў 45e. џ 45F.

KOI-8 (bilgi paylaşım kodu, 8 bit), KOI8 - Bilgisayar biliminde sekiz bit sembolü kodlama standardı. Kiril alfabelerinin harflerinin kodlanması için tasarlanmıştır. Ayrıca kodlama sürümünün yedi bitlik bir versiyonu var - KOI-7. KOI-7 ve KOI-8 GOST 19768-74 (şimdi geçersiz) olarak açıklanmaktadır.

KOI-8 geliştiricileri, Rus alfabesinin sembollerini Genişletilmiş ASCII tablosunun üstündeki sembollerini, Kiril karakterlerinin pozisyonlarının, masanın altındaki İngilizce alfabesindeki fonetik analoglarına karşılık gelecek şekilde bir şekilde yerleştirilmiştir. Bu, KOI-8'de yazılan metinde, her bir sembolün sekizinci bitini kaldırmak için, latin sembolleri tarafından yazılmış olmasına rağmen "okunabilen" bir metni ortaya çıkardığı anlamına gelir. Örneğin, "Rusça metin" kelimeleri "Russkij Tekst" haline gelecektir. Yan etki olarak, Kiril sembolleri, alfabetik sırayla düzenlendiği ortaya çıktı.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .D. .E.e. .F.
8. ─ 2500 │ 2502 ┌ 250c. ┐ 2510 └ 2514 ┘ 2518 ├ 251c. ┤ 2524 ┬ 252c. ┴ 2534. ┼ 253c. ▀ 2580 ▄ 2584 █ 2588 ▌ 258c. ▐ 2590
9. ░ 2591 ▒ 2592 ▓ 2593 ⌠ 2320 ■ 25A0. ∙ 2219 √ 221A. ≈ 2248 ≤ 2264 ≥ 2265 A0. ⌡ 2321 ° B0. ² B2. · B7. ÷ F7.
A. ═ 2550 ║ 2551 ╒ 2552 ё 451. ╓ 2553 ╔ 2554 ╕ 2555 ╖ 2556 ╗ 2557 ╘ 2558 ╙ 2559 ╚ 255A. ╛ 255b. ╜ 255c. ╝ 255d. ╞ 255e.
B. ╟ 255f. ╠ 2560 ╡ 2561 E 301. ╢ 2562 ╣ 2563 ╤ 2564 ╥ 2565 ╦ 2566 ╧ 2567 ╨ 2568 ╩ 2569 ╪ 256A. ╫ 256b. ╬ 256c. © A9.
C. Yu 44e. 430. B 431. C 446. D 434. E 435. F 444. G 433. x 445. ve 438. 439. 43A'ya. L 43b. m 43c. H 43d. Yaklaşık 43E.
D. p 43f. Ben 44F R 440. 441'den. T 442. 443'te. 2036. 432'de. B 44c. s 44b. s 437. sh 448. E4D. Shch 449. H 447. KOMMERSANT 44A.
E. Yu 42e. 410. B 411. C 426. D 414. E 415. F 424 G 413. X 425. Ve 418. 419. 41A'ya. L 41b. M 41c. H 41d. O 41e.
F. P 41f. Ben 42F'im. R 420. 421 ile. T 422. 423. 416. 412'de. B 42c. 42b. S 417. W 428. E 42d. Shch 429. H 427. KOMMERSANT 42A.

Koi8-U Kodlama (Ukrayna)

KOI-8, internette ilk Rus standartlaştırılmış kodlama oldu.

IETF KOI-8 kodlama seçeneklerine göre birkaç RFC'yi onayladı:

  • RFC 1489 - KOI8-R (Rus alfabesinin harfleri);
  • RFC 2319 - KOI8-U (Ukrayna alfabesinin harfleri);
  • RFC 1345 - ISO-IR-111 (ana aralığı belirlemede bir hata ile).

Yukarıdaki tablolarda, sayılar, Unicode'deki harfin onaltılık bir koduyla gösterilir.

KOI8-R Kodlama (Rusça)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .D. .E.e. .F.

8.

2500

2502

250c.

2510

2514

2518

251c.

2524

252c.

2534

253c.

2580

2584

2588

258c.

2590

9.

2591

2592

2593

2320

25A0.

2219

221a.

2248

2264

2265

A0.

2321
°
B0.
²
B2.
·
B7.
÷
F7.

A.

2550

2551

2552
e.
451

2553

2554

2555

2556

2557

2558

2559

255A.

255b.

255c.

255d.

255e.

B.

255f.

2560

2561
E.
401

2562

2563

2564

2565

2566

2567

2568

2569

256a.

256b.

256c.
©
A9.

C.
yu
44e.
fakat
430
b.
431
c.
446
d.
434
e.
435
f.
444
g.
433
h.
445
ve
438
j.
439
için
43a.
l.
43b.
m.
43c.
n.
43d.
hakkında
43e.

D.
p
43f.
ben
44f.
r
440
dan
441
t.
442
w.
443
j.
436
içinde
432
b
44c.
s
44b.
z.
437
sh
448
e.
44d.
sh
449
c.
447
komment
44a.

E.
Yu
42e.
FAKAT
410
B.
411
C.
426
D.
414
E.
415
F.
424
G.
413
H.
425
VE
418
J.
419
İçin
41a.
L.
41b.
M.
41c.
N.
41d.
HAKKINDA
41e.

F.
P
41f.
ben
42F.
R
420
Dan
421
T.
422
W.
423
J.
416
İÇİNDE
412
B
42c.
S
42b.
Z.
417
Sh
428
E.
42d.
Sh
429
C.
427
Komment
42a.

Diğer seçenekler

Sadece eşleşen masa çizgileri eşleşmiyor, çünkü diğer her şey çakışıyor.

KOI8-U Kodlama (Rus-Ukrayna)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .D. .E.e. .F.

A.

2550

2551

2552
e.
451
є
454

2554
і
456
ї
457

2557

2558

2559

255A.

255b.
ґ
491

255d.

255e.

B.

255f.

2560

2561
E.
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256a.
Ґ
490

256c.
©
A9.

KOI8-RU Kodlama (Rus-Belorussko-Ukrayna)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .D. .E.e. .F.

A.

2550

2551

2552
e.
451
є
454

2554
і
456
ї
457

2557

2558

2559

255A.

255b.
ґ
491
ў
45e.

255e.

B.

255f.

2560

2561
E.
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256a.
Ґ
490
Ў
40e.
©
A9.

KOI8-C kodlaması (Orta Asya)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .D. .E.e. .F.
8. ғ
493
җ
497
қ
49b.
ҝ
49d.
ң
4A3.
ү
4af.
ұ
4b1
ҳ
4b3.
ҷ
4b7.
ҹ
4b9.
һ
4bb.

2580
ә
4d9.
ӣ
4e3.
ө
4e9.
ӯ
4ef.
9. Ғ
492
Җ
496
Қ
49a.
Ҝ
49c.
Ң
4A2.
Ү
4ae.
Ұ
4b0.
Ҳ
4b2.
Ҷ
4b6.
Ҹ
4b8.
Һ
4ba.

2321
Ә
4d8.
Ӣ
4e2.
Ө
4e8.
Ӯ
4ee.
A.
A0.
ђ
452
ѓ
453
E.
451
є
454
ѕ
455
і
456
ї
457
ј
458
љ
459
њ
45A.
ћ
45b.
ќ
45c.
ґ
491
ў
45e.
џ
45f.
B.
2116
Ђ
402
Ѓ
403
E.
401
Є
404
Ѕ
405
І
406
Ї
407
Ј
408
Љ
409
Њ
40a.
Ћ
40b.
Ќ
40c.
Ґ
490
Ў
40e.
Џ
40f.

KOI8-T kodlaması (Tacik)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .D. .E.e. .F.
8. қ
49b.
ғ
493

201a.
Ғ
492

201E.

2026

2020

2021

2030
ҳ
4b3.

2039
Ҳ
4b2.
ҷ
4b7.
Ҷ
4b6.
9. Қ
49a.

2018

2019

201c.

201d.

2022

2013
-
2014

2122

203a.
A. ӯ
4ef.
Ӯ
4ee.
E.
451
¤
A4.
ӣ
4e3.
¦
A6.
§
A7.
«
Ab
¬
AC
­
Reklam
®
Ae
B. °
B0.
±
B1.
²
B2.
E.
401
Ӣ
4e2.

B6.
·
B7.

2116
»
Bb.
©
A9.

KOI8-O, KOI8-S Kodlama (Slav, Eski Yazım)

0407
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .D. .E.e. .F.

8.
Ђ
0402
Ѓ
0403
¸
00b8.
ѓ
0453

201E.

2026

2020
§
00a7.

20AC.
¨
00A8.
Љ
0409

2039
Њ
040a.
Ќ
040c.
Ћ
040b.
Џ
040f.

9.
ђ
0452

2018

2019

201c.

201d.

2022

2013

2014
£
00A3.
·
00b7.
љ
0459

203a.
њ
045A.
ќ
045c.
ћ
045b
џ
045f

A.

00A0.
ѵ
0475
ѣ
0463
e.
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
®
00ae.

2122
«
00ab
ѳ
0473
ґ
0491
ў
045e.
´
00b4.

B.
°
00b0.
Ѵ
0474
Ѣ
0462
E.
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408

2116
¢
00a2
»
00bb.
Ѳ
0472
Ґ
0490
Ў
040e.
©
00a9.

ISO-IR-111, KOI8-E Kodlama

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .D. .E.e. .F.

A.

00A0.
ђ
0452
ѓ
0453
e.
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A.
ћ
045b
ќ
045c.
­
00ad.
ў
045e.
џ
045f

B.

2116
Ђ
0402
Ѓ
0403
E.
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040a.
Ћ
040b.
Ќ
040c.
¤
00a4.
Ў
040e.
Џ
040f.

KOI8-Unified Kodlama, KOI8-F

KOI8-Unified kodlama (KOI8-F), FingerTip yazılımı tarafından önerilmektedir.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .D. .E.e. .F.

8.

2500

2502

250c.

2510

2514

2518

251c.

2524

252c.

2534

253c.

2580

2584

2588

258c.

2590

9.

2591

2018

2019

201c.

201d.

2022

2013

2014
©
00a9.

2122

00A0.
»
00bb.
®
00ae.
«
00ab
·
00b7.
¤
00a4.

A.

00A0.
ђ
0452
ѓ
0453
e.
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A.
ћ
045b
ќ
045c.
ґ
0491
ў
045e.
џ
045f

B.

2116
Ђ
0402
Ѓ
0403
E.
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040a.
Ћ
040b.
Ќ
040c.
Ґ
0490
Ў
040e.
Џ
040f.

Sigara İçilmeyen Seçenekler KOI-8

Bazı ülkelerde CMEAS, ulusal latice seçenekleri için KOI-8 modifikasyonları ile oluşturulmuştur. Temel fikir aynıydı - sekizinci bitin "kesimi" ile, metin az ya da çok anlaşılabilir kalmalıdır.

- iyi, başla! - Doolokh dedi.
"Peki," dedi ki, Pierre, hala gülümsüyor. - Korktum. Çok kolay başlayan davanın artık olacağını, halihazırda insanların iradesine bakılmaksızın, yapılmasının önlenemediği açıktı. Denisov ilk önce engelle öne çıktı ve ilan edildi:
- P "Svatstniki," Onları "olarak reddettiğinden, başlamak mümkün olup olmadığını reddetti: Silahları ve T kelimesine göre birleştirin" ve birleşmeye başlayın.
"G ..." AZ! İki! T "ve! ..." Denisov öfkeyle bağırdı ve yana taşındı. Her ikisi de birbirlerini tanıdığı siste, daha yakın ve daha yakın olanlara yaklaştı. Rakipler sağa, bariyere çıkan, birisi istediğinde ateş ettiler. Shelokh, silahı yükseltmeden, rakibinin karşısında parlak, parlak, mavi gözleriyle bakmadan yavaştı. Ağzı, her zaman olduğu gibi bir gülümseme vardı.
- Yani istediğimde - ateş edebilirim! - Bahsedilen Pierre, üç hızlı adım attı, Trotan geçitinden ve tam karda yürürken. Pierre, öne doğru uzanan bir silah tuttu sağ elGörünüşe göre bu tabancadan nasıl kendinizi öldürmediğinden korkuyor. Özenle sol eline sahipti, çünkü sağ elini desteklemek istedi ve imkansız olduğunu biliyordu. Altı adımları geçmek ve karda yoldan çıkmak, Pierre ayaklarına baktı, yine Dolokhov'a tekrar baktı ve öğretildiği gibi parmağını çekerek vurdu. Böyle güçlü bir ses beklemiyorum, Pierre atışından titriyordu, sonra kendini izlenimini gülümsedi ve durdu. Duman, özellikle sisden kalın, onu ilk anda görmesini engelledi; Ama beklediği bir başka atış, takip etmedi. Sadece Dolohov'un acelesi adımları duyuldu ve figürü duman yüzünden görünüyordu. Bir elinizle sol tarafın arkasında tuttu, diğeri atlanmış bir tabancayı sıkıştırdı. Yüzü solgundu. Rostov koştu ve bir şey ona söyledi.
"Bu değil ... E ... T," Solokov, dişlerinin arasından, "Hayır, bitti," dedi ve biraz daha düşerek, Sabre'ye adım atıyor, onun yanında karda düştü. Sol eli kandaydı, onu Sutuk'la ele geçirdi ve onu eğildi. Yüzü soluk, çatık ve titredi.
"Yazacağım ..." paylaşmaya başladı, ama hemen söyleyemedi ... "Lütfen, çaba ile kabul etti." Pierre, zar zor holding, Dolohov'a koştu ve Shahov'un bağırdığı gibi engelleri ayıran yerden geçmek istedi: - Bariyere! - ve meselenin ne olduğunu fark eden Pierre, onun kılıcında durdu. Sadece 10 adım onları paylaştı. Shelokhov kafasını kara bıraktı, açgözlülükle kar yağdı, yine başını yükseltti, geri kazandı, bacaklarını topladı ve oturdu, katı bir ağırlık merkezi arıyor. O kalıp soğuk kar ve emmek; Dudakları titredi, ama her şey gülümsüyor; Gözler çaba ve son toplanan kuvvetlerin rahimiyle ışıltılı. Silahı büyüttü ve hedeflemeye başladı.
"Yan, Silahı kapat" dedi Nesvitsky.
- 3Ak "ben! - Bırakmadan, Denisov bile rakibine bağırdı.
Pierre, pişmanlık ve tövbe gülümsemesi ile Pierre, bacaklarını ve ellerini çaresizce, düz göğüsleriyle doğrudan, Dolokhov'dan önce durdu ve ne yazık ki ona baktı. Denisov, Rostov ve Nesvitsky tırmandı. Aynı zamanda, Dologov'un atışını ve kötü ağlamasını duydular.
- tarafından! - Shahov tarafından bağırdı ve güçsüzce kar yüzüne yerleştirin. Pierre başını aldı ve geri döndü, ormana gitti, tamamen karda yürüdü ve yüksek sesle bilinmeyen kelimeler:
- Aptal aptal! Ölüm ... Yanlış ... - Ateş ettiğini söyledi. Nesvitsky onu durdurdu ve evini aldı.
Denisov ile Rostov yaralı dolokhov tarafından şanslıydı.
Shelokhov, sessizce, kapalı gözlerle, kızağın içinde yattı ve yaptığı soruları cevaplamadı; Ancak, Moskova'ya girdikten sonra aniden uyandı ve kafasını kaldırarak zorlukla, eliyle oturan Rostov'u aldı. Rostov, Dologov'un yüzünün tamamen değişti ve beklenmedik şekilde coşkulu bir ifadesini vurdu.
- İyi? Nasıl hissediyorsun? - Diye sordu Rostov.
- Splly! Ama nokta değil. Arkadaşım, "dedi Thearent Voice, - Neredeyiz? Biz Moskova'dayız, biliyorum. Ben hiçbir şeyim, ama onu öldürdüm, öldürdü ... onu almayacak. O olmayacak ...
- DSÖ? - Diye sordu Rostov.
- Annem. Annem, meleğim, sevimli melek, annem, - ve solohov ağladım, Rostov'un elini sıkıyordum. Biraz sakinleştiğinde, annesiyle birlikte yaşayan Rostov'u açıkladı, eğer annenin ölmesini görürse, onu almayacak. Rostov'a gitmeye ve onu hazırlamaya yalvardı.
Rostov, siparişi yerine getirmek için öne çıktı ve Solohov'un Brier'ın yaşlı kadın ve Humptbed bir kız kardeşi ile Moskova'da yaşadığını ve en nazik oğlu ve erkek kardeşi olduğunu öğrendiğini öğrendiğini öğrendi.

Pierre yakın zamanda nadiren karısını göze gözle gördü. Ve St. Petersburg'da ve Moskova'da evleri sürekli misafirleriyle doluydu. Bir düellodan sonra ertesi gece, o, sık sık yaptığı gibi, yatak odasına gitmedi, ancak dilencinin sayısının öldüğü, büyük, babalık ofisinde kaldı.
Kanepeye baktı ve onunla olan her şeyi unutmak için uykuya dalmak istedi, ama bunu yapamadı. Böyle bir duygu fırtınası, düşünceler, anılar aniden ruhunda, sadece uyuyamadığı, ancak yerinde oturamadığı ve kanepeden atlayamadığı ve hızlı adımlarla odanın etrafında yürümek zorunda kaldı. Ona ilk başta evlendikten sonra, açık omuzlar ve yorgun, tutkulu bir görünüm ile ve hemen yanında dollushov'un hemen yanında göründüğü, akşam yemeğinde nasıl olduğunu ve aynı yüze gibiydi, soluk, titreme Ve döndüğünde ve kar yağdığında nasıl olduğunu acı çekmek.
"Orada neydi? - Kendisine sordu. - Sevgiliyi öldürdüm, evet, karısının sevgilisini öldürdü. Evet öyleydi. Neyden? Buna nasıl geldim? - çünkü onunla evlendin, - iç sese cevap verdi.
"Ama ne suçluyum? O sordu. - Onu sevmediğiniz gerçeğiyle, kendinizi ve onu aldattığınız gerçeğinde, - ve o andan akşam yemeğinden sonra bir araya getirildi, bu kelimeleri söyleyemeyecek olan bu kelimeleri söylediğinde, "JE VOUS Aime ". [Seni seviyorum.] Bundan her şey! Daha sonra hissettim, o zaman hissettiğimi hissettim, bunun için hiçbir hakim olmadığı değildi. Öyleyse çıktım. " Balayı hatırladı ve anılarla kızardı. Özellikle canlı, bir günün, bir günün kısa bir süre sonra, günün 12 metrelik olduğu anılar, bir ipek ceketle yatak odasından ofise gelip, düşünceli bir şekilde merak eden müdür başkanlığını buldu, Pierre'nin yüzüne baktım, bornozunda ve biraz gülümsedi, sanki bu gülümsemeyi ilkesinin mutluluğunun mutluluğuna saygılı sempati duyuyormuş gibi.
"Ve onunla kaç kez gurur duyduydum, onun büyük güzelliğiyle gurur duyuyormuş, laik inceliğini düşündü; Erişilemezlik ve güzelliğinden gurur duyan, tüm Petersburg'u aldığı evden gurur duyuyordu. Peki neden gurur duyuyorum?! Sonra onu anlamadığımı sanıyordum. Çoğu zaman, onun karakterini düşünerek, kendime onu anlamadığımı suçlayacağımı söyledim, bu şimdiye kadar herhangi bir bağımlılığın ve arzuların olmadığını, memnuniyetini ve yokluğunu anlamıyorum ve tüm etki bu korkunç kelimedeydi. o korkunç bir kadın olduğu: kendimi korkunç bir kelime olduğunu söyledi ve her şey netleşti!
"Anatol ondan para almak için ona gitti ve onu çıplak omuzlarına öptü. Ona para vermedi, ancak kendini öpmeye izin verdi. Baba, şaka, kıskançlığını heyecanlandırdı; Rahat bir gülümsemeyle, kıskanç olmak için çok aptal olmadığını söyledi: Onu istediğini yapmasına izin ver, benim hakkımda dedi. Bir keresinde, hamilelik belirtileri olup olmadığını sordum. Düşük güldü ve çocuk sahibi olmak isteyen bir aptal olmadığını ve benden çocuk sahibi olmayacağını söyledi. "
Sonra, en yüksek aristokrat dairesinde yetiştirilmesine rağmen, düşüncelerinin netliğini, düşüncelerinin netliğini ve onun içindeki ifadelerin kırılganlığını hatırladı. "Ben bir çeşit aptal değilim ... Kendimi deneyeceğim ... Allez Vous Promenter," [Çık git,] dedi. Genellikle, yaşlı ve genç erkeklerin ve kadınların gözünde başarısına bakarak Pierre, neden onu sevmediğini anlayamadı. Evet, onu hiç sevmedim, kendime Pierre'ye söyledim; Ahlaksız bir kadın olduğunu biliyordum, kendini tekrar etti, ama kabul etmek için uğraşmadı.

Merhaba, Sevgili Blog Okuyucular web sitesi. Bugün sizinle Krakoyarbra'nın hangi metin kodlamalarının var olduğu ve hangisinin kullanılması gerektiği programlardan ve programlardan geldiği hakkında konuşacağız. Temel ASCII'den, CP866, KOI8-R, Windows 1251'in genişletilmiş versiyonlarını ve Unicode UTF 16 ve 8 konsorsiyumunun modern kodlarıyla biten gelişmelerinin geçmişini ayrıntılı olarak düşünelim.

Birisi bu bilgi gereksiz görünebilir, ancak çatlakları tam olarak ilgilenen (bir karakter kümesi okumayan) bana ne kadar sorunun ne kadar olduğunu bileceksiniz. Şimdi herkesi bu makalenin metnine gönderme fırsatım olacak ve bağımsız olarak shoals'ınızı arayacağım. Bilgiyi emmeye hazır olun ve anlatımı izlemeye çalışın.

ASCII - Temel Latiza Metin Kodlama

Metin kodlamalarının gelişimi, BT endüstrisinin oluşumu ile aynı anda gerçekleşir ve bu süre zarfında oldukça az değişiklik geçireceklerdir. Tarihsel olarak, her şey, Rusça'lık Rusça telaffuzunda oldukça zararlıdır, bu da Latin alfabesinin, Arapça sayıların ve noktalama işaretlerinin kontrol sembolleriyle harflerini kodlamayı mümkün kılan.

Ancak yine de modern metin kodlamalarının geliştirilmesi için başlangıç \u200b\u200bnoktası ünlü olarak kabul edilmelidir. ASCII. (Rusça'da "Aski" olarak belirgin olan bilgi değişimi için Amerikan Standart Kodu). İngilizce konuşan kullanıcılar -, Arapça numaralar ve noktalama işaretleri tarafından en sık kullanılan ilk 128 karakteri açıklar.

ASCII'de açıklanan bu 128 karakterde bile, bazı servis sembolleri parantez, kafesler, yıldızlar vb. Tarafından ezildi. Aslında, kendin onları görebilirsin:

Bu, ASCII'nin ilk versiyonundan gelen 128 karakter standarttır ve herhangi bir kodlamada kesinlikle karşılaşacak ve böyle bir şekilde olacaklar.

Ancak gerçek şu ki, bilginin bir bayt yardımı ile, 128, ancak 256 farklı değer (iki dereceye eşit derecede 256), sonra taban versiyonu Aski bir dizi görünüyordu gelişmiş kodlamalar ASCII128 ana işarete ek olarak, ulusal kodlama sembollerini (örneğin, Rusça) kodlamak da mümkündü.

Burada, muhtemelen açıklamada kullanılan sayı sistemi hakkında biraz daha değer. Öncelikle, her şeyi bildiğiniz gibi, bilgisayar sadece bir ikili sistemde, yani sıfır ve birimler ("Boulev Cebir" ile ("Boulev Cebir" ile ("Boulev Cebir" ile birlikte çalışır. Her biri bir dereceye kadar bir inendir, sıfırdan başlayarak ve yedinci sırada two'lar:

Bu tür bir tasarımdaki tüm olası zero ve birimler kombinasyonlarının yalnızca 256 olabileceğini anlamak zor değildir. Çevir, ikili sistemden ondalık basamak. Tüm dereceleri yukarıdaki tüm dereceleri tek bir durdurmanız gerekir.

Örneğimize göre, 1 (2 ila sıfır) artı 8 (iki ila derece 3), artı 32 (beşinci derecede iki kez), artı 64 (altıncı), artı 128 (yedinci) . Toplam 233 alır ondalık sistem Not. Gördüğünüz gibi, her şey çok basit.

Ancak masaya ASCII karakterleriyle bakarsanız, onaltılık kodlamada sunulduğunu göreceksiniz. Örneğin, "yıldız işareti", Aski'ye karşılık gelir. hexadecimal 2a. Muhtemelen bunu biliyorsun onaltılık sistem Arapça sayılara, Latin harflerinden f (on beş) 'den f (onbeş anlamına gelir) ek olarak sayılar kullanılır.

Peki, için aktar İkili sayılar Onaltılık Bir sonraki basit ve görsel yola başvurun. Her bilgi baytı, yukarıdaki ekran görüntüsünde gösterildiği gibi dört bitin iki parçasına ayrılır. Yani Baytın her yarısında, ikili kod yalnızca on altı değer için (dördüncü derecede ikisi), onaltılık olarak kolayca temsil edilebilecek şekilde kodlanabilir.

Ayrıca, baytın sol yarısında, tekrar sıfırdan, ekran görüntüsünde gösterildiği gibi göz önünde bulundurmanız gerekecektir. Sonuç olarak, iyi olmayan bir bilgisayarla, E9 sayısının ekran görüntüsünde kodlandığını alıyoruz. Umarım aklımın kursu ve bu rebusun katılaşması anlaşılabilirdiniz. Şimdi devam edeceğiz, aslında metin kodlaması hakkında konuşacağız.

ASKI - CP866 ve KOI8-R kodlamasının uzatılmış versiyonları

Böylece, tüm modern kodlamaların gelişimi için bir başlangıç \u200b\u200bnoktası gibi olan ASCII hakkında konuşmaya başladık (Windows 1251, Unicode, UTF 8).

Başlangıçta, Latin alfabesinin sadece 128 belirtisi, Arapça sayılar ve orada başka bir şey, ancak genişletilmiş versiyonda, bir ezme bilgisinde kodlanabilecek tüm 256 değerin tümünü kullanmak mümkündü. Şunlar. Dilinin harflerinin sembollerini Aska'ya ekleme fırsatı.

Burada netleştirmek için bir kez daha dikkatini dağıtmak için gerekli olacak - neden kodlamaya ihtiyacın var? Metinler ve neden bu kadar önemlidir. Bilgisayarınızın ekranındaki karakterler, iki şeyin temelinde oluşturulur - her türlü karakterin vektör formları (temsilleri) kümeleri (dosya cinsinden) ve bu vektör şekil kümesini çıkarmanızı sağlayan kodlar ( Yazı Tipi Dosyası) Doğru yere eklenecek karakterdir.

Yazı tiplerinin vektör formlarından sorumlu olduğu açıktır, ancak işletim sistemi ve içinde kullanılan programlar kodlamadan sorumludur. Şunlar. Bilgisayarınızdaki herhangi bir metin, bu metnin tek bir sembolünün kodlandığı her birinde bir bayt kümesi olacaktır.

Bu metni ekranda (metin editörü, tarayıcı vb.) Gösteren program, kodu ayrıştırırken, bir sonraki işaretin kodlamasını okur ve ilgili vektör formunu arar İstenen dosya Bu metin belgesini görüntülemek için bağlı yazı tipi. Her şey basit ve trite.

Böylece, ihtiyacımız olan herhangi bir sembolü kodlamak için (örneğin, ulusal alfabeden), iki koşul tamamlanmalıdır - bu işaretin vektör formu kullanılan fontta olmalı ve bu sembol genişletilmiş ASCII kodlamalarında bir baytta kodlanabilir. . Bu nedenle, bir sürü bu tür seçenek var. Sadece Rus dilinin sembollerinin kodlanması için çeşitli eşek çeşitleri vardır.

Örneğin, başlangıçta ortaya çıktı Cp866.Rus alfabesinin sembollerini kullanmak mümkün olduğu ve bu ASCII'nin genişletilmiş bir versiyonuydu.

Şunlar. Üst kısmı, Scienshot'ta biraz daha yüksek gösterilen Aski'nin (128 Latin, Numaraların ve hatta Labuda'nın) temel versiyonu ile tamamen çakıştı, ancak zaten CP866 kodlama tablosunun alt kısmı ekran görüntüsünde belirtilenlere sahipti. Görünümün biraz altında ve başka bir 128 işareti (Rus mektupları ve herhangi bir psödografik) kodlamasına izin verildi:

Bakınız, doğru sütunda, sayılar 8 ile başlar, çünkü 0 ile 7 arasındaki sayılar ASCII'nin taban kısmına bakın (ilk ekran görüntüsüne bakın). Yani CP866'daki Rusça "M" harfi 9C'ye sahip olacaktır (karşılık gelen satırların 9 ile, bir hexadecial sayı sisteminde C ile ilgili sütun ile kesişimindedir), bir bayt bilgisi içinde yazılabilir ve Rus karakterleri ile uygun bir yazı tipi var, bu mektup problemsiz metin olarak gösterilecektir.

Bu miktar nereden geldi? cP866'da psödograflar.? Bu, şu anki gibi grafik işletim sistemlerinin böyle bir dağılımının olmadığı zaman, bu parlak yıllarda bu parlak yıllarda geliştirilmiş olması. Ve dastik ve benzeri metin operasyonlarında, pseudografik en azından bir şekilde, metinlerin tasarımını çeşitlendirir ve bu nedenle CP866 ve tüm diğer satırları, ASA'nın genişletilmiş sürümlerinin boşalmasından kaynaklanır.

CP866 Dağıtılmış IBM Şirketi, ancak ek olarak, Rus dilinin sembolleri için bir dizi kodlama, örneğin, aynı tip (Genişletilmiş ASCII) atfedilebilir Koi8-r.:

Çalışmalarının ilkesi, daha sonra açıklanan CP866 ile aynı kaldı - her metin sembolü tek bir bayt tarafından kodlanır. Ekran görüntüsü KOI8-R tablosunun ikinci yarısını gösterir, çünkü İlk yarı, bu makaledeki ilk ekran görüntüsünde gösterilen taban ASUS ile tamamen tutarlıdır.

KOI8-R kodlamasının özellikleri arasında, masasındaki Rus harflerinin, örneğin CP866'da yaptığı gibi, bu gibi alfabetik sırayla olmadığı belirtilebilir.

İlk ekran görüntüsüne bakarsanız (tüm genişletilmiş kodlamalara giren ana kısım), Koi8-R'de, Rus harflerinin, latin alfabesinin ilk bölümünden, Latin alfabesinin harfleri olarak aynı tablolarda bulunduğunu fark edin. Masa. Bu, Rus sembollerinden Latince'den Latince'ye geçmenin rahatlığı için yapıldı (yedinci derecede iki ya da 128).

Windows 1251 - ASCII'nin modern bir versiyonu ve Crackels neden çıktı

Metin kodlamalarının daha fazla gelişmesi, grafik işletim sistemlerinin ve bunlara psödografi kullanması gerektiği gerçeğinden kaynaklanıyordu. Sonuç olarak, onların özünde, Aski'nin gelişmiş sürümleri olan bir bütün grup ortaya çıktı (bir metin sembolü, yalnızca bir büzülme bilgiyle kodlanmıştır), ancak pseudografik karakterler kullanmadan.

Amerikan Standardizasyon Enstitüsü tarafından geliştirilen ANSI kodlamasını tedavi ettiler. Kiril adı, Rus dilinin desteğiyle bir seçenek için hala kullanıldı. Böyle bir örnek örneği.

Önceden kullanılan CP866 ve KOI8-R'den, sözdedeki karakterlerin yerini, Rus tipografisinin (azalan işaret) eksik sembollerini ve Rus Slav'una yakın kullanılan sembollerin yanı sıra Diller (Ukrayna, Belarus, vb.):

Rus dilinin kodlarının bu bolluğu nedeniyle, yazı tipi ve üreticileri üreticileri yazılım Sürekli bir baş ağrısı ortaya çıktı ve seninle, sevgili okuyucular, genellikle en ünlü olanları aldılar. krakoYabryKarışıklık, metinde kullanılan versiyonla öğretildiğinde.

Mesaj gönderirken ve alırken çok sık çıktılar e-postaAslında, aslında bu sorunu kök içinde çözemediği ve sıklıkla yazışmalar için kullanıcıların oluşturulmasına neden olan çok karmaşık bir kodlama tablolarının yaratılmasına neden olan şey, bu tür CP866, KOI8-R veya Windows 1251'in Rus kodlamalarını kullanırken komik Krakozyabs'tan kaçınmak için kullanılmıştır.

Özünde, Krakozyabry, Rusça metin yerine veriliyor, sonuç yanlış kullanım Kodlama bu dilinhangi kodlandığı birine karşılık gelmedi sMS Başlangıçta.

CP866 ile kodlanmış semboller, Windows 1251 kod tablosunu kullanarak, daha sonra bu en çok çatlak (anlamsız karakter kümesi) kullanarak görüntülenmeyi deneyin ve mesaj metnini tamamen değiştirmeyi deneyin.

Benzer bir durum çok sık, forumlar, forumlar veya bloglar, yanlışlıkla Rus karakterleri olan metin, varsayılan web sitesinde kullanılan kodlamaya kaydedilmediğinde veya metin düzelticiSebestin koduna eklenen, çıplak gözle görünmez.

Sonunda, birçok kodlamaya sahip ve sürekli sürünen bir durum, çok yorgun, birçok yorgun, yeni bir evrensel varyasyon yaratmanın önkoşulları vardı, bu da mevcut olanların yerini alacak ve son olarak, nihayetinde sorunların köküne okunabilir metinler. Buna ek olarak, dilin sembollerinin 256'dan fazla olduğu için benzer bir dilde bir sorun vardı.

Unicode (Unicode) - Universal Kodları UTF 8, 16 ve 32

Güneydoğu Asya'nın dil grubunun bu binlerce işareti, gelişmiş ASCII sürümlerinde karakter kodlama için ayrılan bir papat bilgisinde tanımlanamadı. Sonuç olarak, denilen bir konsorsiyum oluşturuldu. Unicode (Unicode - Unicode Consortium) Endüstrinin birçok liderinin işbirliğinde (Demir'i kimin oluşturan bir yazılım üreten, yazı tipi oluşturan bir yazılım oluşturanlar), evrensel bir metin kodlamasının ortaya çıkmasıyla ilgilenen.

Unicode konsorsiyumun himayesinde yayınlanan ilk varyasyon UTF 32.. Kodlamanın adındaki rakam, bir sembolü kodlamak için kullanılan bit sayısı anlamına gelir. 32 bit, yeni evrensel UTF kodlamasında tek bir işareti kodlamak için gerekli olacak 4 bayt bilgidir.

Sonuç olarak, aynı dosya, ASCII ve UTF-32'nin genişletilmiş sürümünde kodlanan metnin ikinci durumda olacak şekilde boyutuna (ağırlık) olacaktır. Kötü, ama şimdi UTF'nin yardımıyla iki ila otuz ikinci dereceye eşit olan işaret sayısını kodlama fırsatımız var ( milyarlarca karakterBu, herhangi bir gerçek değeri devasa bir marjla kapsayacak).

Ancak, Avrupa Grubu'nun dilleriyle birçok ülke, kodlamada kullanılması çok fazla sayıda işarete sahiptir ve ancak UTF-32'yi kullanırken, dört zamanlı bir artış almadılar. Metin belgelerinin ağırlığında ve sonuç olarak, internet trafiğinde bir artış ve hacim depolanmış veriler. Bu çok ve hiç kimse bu tür atıkları karşılayamaz.

Unicode'nin gelişmesinin bir sonucu olarak ortaya çıktı UTF-16Bu, bu kadar başarılı ortaya çıktı ki, kullandığımız tüm karakterler için temel bir alan olarak varsayılan olarak kabul edildi. Bir işareti kodlamak için iki bayt kullanır. Bu şeyin nasıl göründüğünü görelim.

Windows işletim sisteminde "Başlat" - "Programlar" - "Standart" - "Hizmet" - "Karakter Tablosu" yolunu geçebilirsiniz. Sonuç olarak, bir masa, fontlarınızda yüklü olan tüm vektör formlarıyla açılır. Eğer seçersen " Ek parametreler»Bir Unicode işaretleri kümesi, her bir yazı tipi için ayrı ayrı görebilirsiniz. İçinde bulunan tüm karakterler aralığı.

Bu arada, bunlardan herhangi birine tıklayarak, onu iki kişi görebilirsiniz. uTF-16 formatında koddört onaltılık haneden oluşan:

UTF-16'da 16 bit kullanılarak kaç karakter kodlanabilir? 65 536 (iki ila on altı) ve bu numara Unicode'daki temel alan için alındı. Buna ek olarak, bununla ve yaklaşık iki milyon karakterle kodlamanın yolları vardır, ancak bir milyon metin sembolündeki genişletilmiş alanla sınırlıdır.

Fakat Unicode'nin kodlamasının bu başarılı versiyonu bile, örneğin, yalnızca İngilizce'deki programları, çünkü ASCII'nin genişletilmiş sürümünden UTF-16'ya geçtikten sonra, belgelerin ağırlığı iki kez arttıkça, (Biri başına bir bayt, ASKI'deki sembol ve UTF-16'da aynı sembolde iki bayt).

Bu tam olarak herkesi tatmin etmek ve tüm unicode konsorsiyumundaki tümü gelmeye karar verdi. değişken uzunluğu kodlama. O utf-8 olarak adlandırıldı. Başlığın sekizine rağmen, gerçekten bir değişken uzunluğu var, yani. Her metin simgesi, bir ila altı bayt dizisine kodlanabilir.

Uygulamada, UTF-8, yalnızca bir ila dört bayttan bir aralık kullanır, çünkü herhangi bir şeyi kodun dört baytına göndermek için teorik olarak mümkün bir şey yoktur. Tüm Latin işaretleri bir baytta ve eski iyi ASCII'de kodlanmıştır.

Dikkat çekici olanı, yalnızca Latince kodlama durumunda, Unicode'u anlamayan bu programlar bile UTF-8'de kodlanmış olanı okuyacaktır. Şunlar. Aska'nın temel kısmı, bu sadece Unicode konsorsiyumunu kapattı.

UTF-8'deki Kiril işaretleri, iki bayt içine kodlanır ve örneğin Gürcüce - üç baytta. UTF 16 ve 8'in yaratılmasından sonra Unicode Consortium, ana soruna karar verdi - şimdi yazı tiplerinde tek bir kod alanı var. Ve şimdi üreticileri sadece metin sembollerinin vektör formlarıyla doldurma güçleri ve fırsatları temelinde kalır. Şimdi takımlarda bile.

Aşağıdaki sembol tablosunda, farklı fontların farklı sayıda karakteri desteklediği görülebilir. Unicode yazı tiplerinin bazı sembolleri çok iyi tartılabilir. Ancak şimdi farklı kodlamalar için yaratıldıkları gerçeğiyle ayırt edilmezler, ancak font üreticisinin tek kod alanını ya da diğer vektör formları tarafından tek kod alanını doldurmadan veya doldurmadığı gerçeğiyle.

KrakoYabry Rus mektupları yerine - nasıl düzeltilir

Şimdi Crakozyabe metninin metin yerine nasıl göründüğünü veya başka bir deyişle, Rusça metin için doğru kodlamanın nasıl seçildiğini görelim. Aslında, bu aynı metni oluşturduğunuz veya düzenleyeceğiniz programda metin parçalarını kullanarak ayarlanmıştır.

Düzenlemek ve oluşturmak metin dosyaları Şahsen, bence çok iyi kullanıyorum,. Bununla birlikte, sözdizimini hala iyi yüzlerce programlama dilini ve işaretlemesini vurgulayabilir ve ayrıca eklentilerle genişletme yeteneğine sahiptir. Okumak detaylı inceleme Bağlantıya göre bu harika program.

Not Defteri ++ üst menüsünde, mevcut bir seçeneği varsayılan sitenizde kullanılan birine dönüştürme yeteneğine sahip olacağınız bir "kodlama" öğesi vardır:

Joomla 1.5 ve üzeri bir site durumunda, WordPress'de bir blog durumunda, Krakyar'ın görünümünü önlemek için seçeneği seçmelisiniz. UTF 8 BOM'suz. BOM öneki nedir?

Gerçek şu ki, ETF-16 kodlaması geliştirildiğinde, bazı nedenlerden dolayı, böyle bir şeyi, hem doğrudan sırayla (örneğin, 0A15) hem de ters (150A) bir sembol kodunu kaydetme yeteneği olarak tutturmaya karar verdi. . Ve programların hangi sırayı okuma kodlarını anlamaları için ve icat edilmesi için BOM. (Byte sipariş işareti veya başka bir deyişle, imza), bu da belgelerin başlangıcına üç ek bayt eklemede ifade edilmiştir.

UTF-8 kodlamasında, Unicode Consortium'da hiçbir BOM yoktu ve bu nedenle imza ekleyerek (bu en ünlü ek üç bayt, belgenin başlangıcına kadar) bazı programlar kodu okumayı önler. Bu nedenle, biz her zaman, UTF'deki dosyaları kaydederken, BOM'suz bir seçenek seçmelisiniz (imza olmadan). Yani şimdi peşin kendinizi çatlamadan gizlemek.

Dikkate değer olan, Windows'taki bazı programlar bunu nasıl yapacağınızı bilmiyor (metni, BOM'suz UTF-8'deki metni kaydetme), örneğin, aynı komuta notebook pencereleri. Belgeyi UTF-8'de kaydeder, ancak yine de başlangıcına imza ekler (üç ek bayt). Dahası, bu baytlar her zaman aynı olacaktır - kodu doğrudan sırayla okuyun. Ancak sunucularda, bu küçük şeyler nedeniyle, bir sorun olabilir - Crackels çıkacak.

Bu nedenle, hiçbir durumda her zamanki notebook pencerelerini kullanmayın Sitenizin belgelerini düzenlemek için, Krakoyarbra'nın görünümünü istemiyorsanız. Daha önce de belirtilen not defteri ++ editörü için en son ve en kolay seçeneği, pratik olarak dezavantajları olmayan ve avantajlardan birinden oluşan seçeneklerini düşünüyorum.

Not Defteri ++ 'da bir kodlama seçerken, metni UCS-2 kodlamaya dönüştürme yeteneğine sahip olacaksınız, bu da UsSence'daki Unicode Standard'a çok yakın olan UCS-2 kodlamasına dönüştürebilirsiniz. Ayrıca, ANSI, yani ANSI'de kodlanmış bir şekilde kodlanabilir. Rus diline referansla, bu zaten Windows 1251'in hemen yanında tarif edilecektir. Bu bilgi nereden geliyor?

Ameliyathanenizin sicilinde yazıldığından windows Sistemleri - ANSI durumunda hangi kodlamayı, OEM durumunda ne seçeceğiniz (Rus dili için CP866 olacak). Bilgisayarınıza bir varsayılan dil yüklerseniz, bu kodlamalar aynı dil için ANSI veya OEM akıntılarına benzer şekilde değiştirilecektir.

Not Defteri ++ bölümünde, belgeyi kodlamaya yönelik kodlamaya kaydetme veya bir belgeyi düzenlemek için düzenleyicinin sağ alt köşesinde, adını görebileceğiniz:

Krakoyarbrov'u önlemek içinYukarıda açıklanan eylemlere ek olarak, sunucu veya yerel ana bilgisayar için bu kodlama hakkındaki bu kodlama hakkındaki tüm sayfaların kaynak kodunun başlığına kaydolması yararlı olacaktır.

Genel olarak, HTML dışındaki hipertext işaretinin tüm dillerinde, metni kodlamayı belirten özel bir XML reklamı kullanılır.

Kodu sökmeye başlamadan önce, tarayıcı hangi sürümün kullanıldığını ve bu dilin karakterlerinin kodlarını tam olarak nasıl yorumlamanız gerektiğini öğrenecektir. Ancak, belgeyi varsayılan Unicode'da kaydetmeniz durumunda, bu XML bildirimi atlanabilir (kodlama, bir BOM veya UTF-16 yoksa, kodlama UTF-8 olarak kabul edilir).

Bir belge durumunda hTML Dili Kullanılan kodlamayı belirtmek için meta elemanıaçılış ve kapama başı etiketi arasında reçete edilir:

... ...

Bu giriş kabul edilen B'den oldukça farklıdır, ancak tamamen HTML 5 standardı tarafından yavaşça tanıtıldığına tamamen uygundur ve kullanılan herkes tarafından kesinlikle doğru bir şekilde anlaşılır. şu an tarayıcılar.

Teoride, kodlama göstergesi olan meta elemanı HTML belgesi Koymak daha iyi dock başlığında mümkün olduğu kadar yüksekBöylece, ilk işaretin metnindeki toplantı sırasında (her zaman her zaman ve herhangi bir varyasyonda okuyan), tarayıcının bu karakterlerin kodlarını nasıl yorumlayacağınız hakkında bilgi sahibi olmalıdır.

Sana iyi şanslar! Blog sayfalarında belirsiz toplantılara web sitesi

İlgilenebilirsin

Ne URL adresleriSite için mutlak ve göreceli bağlantılar arasındaki fark nedir?
OpenServer - Modern yerel sunucu ve kullanımının bir örneği wordpress kurulumları bilgisayarda
Dosya ve klasör atama haklarına (777, 755, 666) ve PHP üzerinden nasıl yapılacağı CHMOD nedir?
Giriş yap Site ve Online Mağazada Yandex