KOI კოდი ცხრილი 8. KOI8-R კოდირება

- გამგზავრება (@comradzampolit) აგვისტო 17, 2017

როგორ მუშაობს KOI8-R?

Koi8-R არის რვა ბიტიანი კოდი გვერდზე, რომელიც განკუთვნილია კირილეური დამწერლობის ასოების encode. დეველოპერებმა განალაგეს რუსული ანბანის სიმბოლოები, რომ კირილიკის სიმბოლოების პოზიციები შეესაბამებოდა მათ ფონეტიკურ ანალოგებს ინგლისურ ანბანში მაგიდის ბოლოში. და თუ ამ კოდირებაში დაწერილი ტექსტით, თითოეული სიმბოლოების მერვე ცოტა ხნით ამოიღონ, მაშინ ლათინური ასოების მსგავსი ტექსტი მიიღება.

ასეთი გაცვლითი კოდექსი გამოყენებული იქნა ევროკავშირის ევროკავშირის სერვისების კომპიუტერებზე სამოცდაათებში და ოთხმოცდაათიანმა დაიწყო პირველი რუსიფიზირებული ვერსიების გამოყენება. ოპერაციული სისტემა Unix.

კოდირება იყო, რომ უნიკალური კოდექსი თითოეულ სიმბოლოს გადაეცა: 00000000- დან 11111111 წლამდე, ამგვარად, ადამიანი გამოირჩევა სიმბოლოების დიზაინზე და კომპიუტერზე - მათი კოდექსის მიხედვით.

არის Chernova კოდირება ახლა?

არა. ეს იყო შესაბამისი ძველი რვა ბიტიანი კომპიუტერი, ახლა Unicode ძირითადად გამოიყენება სხვადასხვა ფორმატებში.

Koi8-r კოდირება

ISO 8859-5 კოდირება

ISO 8859-5

ალტერნატიული კოდირება

"ალტერნატიული კოდირება" - CP437 კოდის გვერდზე, სადაც მეორე ნახევარში ყველა კონკრეტული ევროპული სიმბოლო შეიცვალა კირილიკით, ტოვებს ფსევდოგრაფიულ სიმბოლოებს. აქედან გამომდინარე, ეს არ გააფუჭებს პროგრამების ტიპის პროგრამებს ტექსტში, და ასევე უზრუნველყოფს მათში კირილეური სიმბოლოების გამოყენებას.

ისტორიულად, ბევრი ალტერნატიული კოდირების ვარიანტი იყო, მაგრამ ყველა განსხვავება მხოლოდ 0xf0 - 0xff რეგიონში (240-255). საბოლოო სტანდარტი იყო IBM CP866 კოდირება, რომელთა მხარდაჭერას დაემატა MS-DOS- ის ვერსია 6.22 (თვითნაკეთი "ყველა სახის" თვითნაკეთი "ბზარები. ალტერნატიული კოდირება ჯერ კიდევ ცოცხალია და უკიდურესად პოპულარულია DOS- სა და OS / 2 გარემოში . გარდა ამისა, ეს კოდირება ჩაწერილია ბ. Ფაილების სისტემა ცხიმი. CP866 კვლავ გამოიყენება რუსიფიცირებული სისტემების კონსოლში windows ოჯახი Nt.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .Აა. 6b .C.c. . .E.e. .
8. 410. B 411. 412 წელს. G 413. D 414. E 415. 416. S 417. და 418. 419. 41A. L 41b. M 41c. H 41d. O 41e. P 41f.
9. P 420 421. T 422. 423. F 424 X 425. C 426. H 427. W 428. Shch 429. კომერსანტი 42 ა. 42 ბ. B 42C. E 42d. Yu 42e. მე ვარ 42f.
ა. 430. B 431. 432 წელს. G 433. D 434. E 435. 2036. 437. და 438. 439. 43 ა. L 43b. m 43c. H 43d. დაახლოებით 43E. p 43f.
ბ. ░ 2591 ▒ 2592 ▓ 2593 │ 2502 ┤ 2524 ╡ 2561 ╢ 2562 ╖ 2556 ╕ 2555 ╣ 2563 ║ 2551 ╗ 2557 ╝ 255d. ╜ 255C. ╛ 255b. ┐ 2510
C. └ 2514 ┴ 2534. ┬ 252C. ├ 251c. ─ 2500 ┼ 253c. ╞ 255E. ╟ 255f. ╚ 255a. ╔ 2554 ╩ 2569 ╦ 2566 ╠ 2560 ═ 2550 ╬ 256C. ╧ 2567
დ. ╨ 2568 ╤ 2564 ╥ 2565 ╙ 2559 ╘ 2558 ╒ 2552 ╓ 2553 ╫ 256b. ╪ 256a. ┘ 2518 ┌ 250c. █ 2588 ▄ 2584 ▌ 258C. ▐ 2590 ▀ 2580
ე. P 440. 441 წლიდან. T 442. 443 წელს. F 444. x 445. C 446. H 447. SH 448. Shch 449. კომერსანტი 44 ა. 44b. B 44C. E4D. Yu 44e. მე ვარ 44f.
ვ. E 301. ё 451. Є 404. є 454. Ї 407. ї 457. Ў 40e. ў 45e. ° B0. ∙ 2219 · B7. √ 221a. № 2116 ¤ A4. ■ 25a0. A0.

ასე რომ 8859-5 - 8-ბიტიანი კოდირება ISO-8859 სერიიდან კირილიკის ჩაწერისთვის. რუსეთში თითქმის არ გამოიყენება. ზოგადად, ISO 8859-5 არ არის ძალიან მოსახერხებელი კოდირება, რადგან მას არ გააჩნია ბევრი საჭირო პერსონაჟი, როგორიცაა Dash (-), choke-tree (""), გრადუსი (°) და ა.შ.



.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .Აა. 6b .C.c. . .E.e. .
8. 80 81 82 83 84 85 86 87 88 89 8 ა. 8b. 8c. 8d. 8E. 8f.
9. 90 91 92 93 94 95 96 97 98 99 9 ა. 9 ბ. 9c. 9d. 9E. 9f.
ა. A0. E 301. € 402. Ѓ 403. Є 404. 405. 406. Ї 407. Ј 408. Љ 409. Њ 40a Ћ 40b. Ќ 40C. განცხადობა Ў 40e. Џ 40f.
ბ. 410. B 411. 412 წელს. G 413. D 414. E 415. 416. S 417. და 418. 419. 41A. L 41b. M 41c. H 41d. O 41e. P 41f.
C. P 420 421. T 422. 423. F 424 X 425. C 426. H 427. W 428. Shch 429. კომერსანტი 42 ა. 42 ბ. B 42C. E 42d. Yu 42e. მე ვარ 42f.
დ. 430. B 431. 432 წელს. G 433. D 434. E 435. 2036. 437. და 438. 439. 43 ა. L 43b. m 43c. H 43d. დაახლოებით 43E. p 43f.
ე. P 440. 441 წლიდან. T 442. 443 წელს. F 444. x 445. C 446. H 447. SH 448. Shch 449. კომერსანტი 44 ა. 44b. B 44C. E4D. Yu 44e. მე ვარ 44f.
ვ. № 2116 ё 451. 452. ѓ 453. є 454. 455. 456. ї 457. ј 458. љ 459. њ 45A. ћ 45b. ќ 45C. § A7. ў 45e. џ 45f.

KOI-8 (ინფორმაციის გაზიარების კოდი, 8 ბიტი), KOI8 - კომპიუტერულ მეცნიერებაში რვა-ბიტიანი კოდირების სტანდარტი. კოდირების ასოების ასოების კოდირება. ასევე არსებობს კოდირების ვერსიის შვიდი ვერსია - KOI-7. KOI-7 და KOI-8 აღწერილია 19768-74 წლებში (ახლა არასწორია).

KOI-8 დეველოპერებმა რუსეთის ანბანის სიმბოლოები მოათავსეს ASCII ცხრილის ზედა ნაწილში, რომ კირილიკლის სიმბოლოების პოზიციები შეესაბამება მათ ფონეტიკურ ანალოგებს ინგლისურ ანბანში მაგიდის ბოლოში. ეს იმას ნიშნავს, რომ თუ KOI-8- ში დაწერილი ტექსტით, თითოეული სიმბოლოების მერვე ცოტა ხნის წინ, მაშინ აღმოჩნდება "წაკითხული" ტექსტი, თუმცა ლათინური სიმბოლოების მიერ დაწერილია. მაგალითად, სიტყვები "რუსული ტექსტი" "რუსიკას ტეკსტს" გადაიქცევა. როგორც გვერდითი ეფექტი, კირილიკის სიმბოლოები აღმოჩნდა ანბანის მიხედვით.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .Აა. 6b .C.c. . .E.e. .
8. ─ 2500 │ 2502 ┌ 250c. ┐ 2510 └ 2514 ┘ 2518 ├ 251c. ┤ 2524 ┬ 252C. ┴ 2534. ┼ 253c. ▀ 2580 ▄ 2584 █ 2588 ▌ 258C. ▐ 2590
9. ░ 2591 ▒ 2592 ▓ 2593 ⌠ 2320 ■ 25a0. ∙ 2219 √ 221a. ≈ 2248 ≤ 2264 ≥ 2265 A0. ⌡ 2321 ° B0. ² B2. · B7. F7.
ა. ═ 2550 ║ 2551 ╒ 2552 ё 451. ╓ 2553 ╔ 2554 ╕ 2555 ╖ 2556 ╗ 2557 ╘ 2558 ╙ 2559 ╚ 255a. ╛ 255b. ╜ 255C. ╝ 255d. ╞ 255E.
ბ. ╟ 255f. ╠ 2560 ╡ 2561 E 301. ╢ 2562 ╣ 2563 ╤ 2564 ╥ 2565 ╦ 2566 ╧ 2567 ╨ 2568 ╩ 2569 ╪ 256a. ╫ 256b. ╬ 256C. © A9.
C. Yu 44e. 430. B 431. C 446. D 434. E 435. F 444. G 433. x 445. და 438. 439. 43 ა. L 43b. m 43c. H 43d. დაახლოებით 43E.
დ. p 43f. მე ვარ 44f. P 440. 441 წლიდან. T 442. 443 წელს. 2036. 432 წელს. B 44C. 44b. 437. SH 448. E4D. Shch 449. H 447. კომერსანტი 44 ა.
ე. Yu 42e. 410. B 411. C 426. D 414. E 415. F 424 G 413. X 425. და 418. 419. 41A. L 41b. M 41c. H 41d. O 41e.
ვ. P 41f. მე ვარ 42f. P 420 421. T 422. 423. 416. 412 წელს. B 42C. 42 ბ. S 417. W 428. E 42d. Shch 429. H 427. კომერსანტი 42 ა.

Koi8-u კოდირება (უკრაინული)

KOI-8 გახდა პირველი რუსული სტანდარტიზებული კოდირება ინტერნეტში.

IETF დამტკიცდა რამდენიმე RFCs მიხედვით KOI-8 კოდირების პარამეტრები:

  • RFC 1489 - KOI8-R (რუსული ანბანის ასოები);
  • RFC 2319 - KOI8-U (უკრაინის ანბანის ასოები);
  • RFC 1345 - ISO-IR-111 (ძირითადი დიაპაზონის განსაზღვრისას).

აღნიშნულ ცხრილებში, ნომრები აღინიშნება Unicode- ის წერილით ჰექსადეიმიური კოდით.

KOI8-R კოდირება (რუსული)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .Აა. 6b .C.c. . .E.e. .

8.

2500

2502

250c.

2510

2514

2518

251c.

2524

252c.

2534

253c.

2580

2584

2588

258c.

2590

9.

2591

2592

2593

2320

25a0.

2219

221a.

2248

2264

2265

A0.

2321
°
B0.
²
B2.
·
B7.
÷
F7.

ა.

2550

2551

2552
ე.
451

2553

2554

2555

2556

2557

2558

2559

255 ა.

255 ბ

255c.

255d.

255.

ბ.

255f.

2560

2561
ე.
401

2562

2563

2564

2565

2566

2567

2568

2569

256 ა.

256 ბ.

256c.
©
A9.

C.
yu
44E.
მაგრამ
430
ბ.
431
c.
446
დ.
434
ე.
435
ვ.
444
გ.
433
თ.
445
და
438
ჯ.
439
-კენ
43 ა.
ლ.
43 ბ.
მ.
43c.
ნ.
43d.
გარშემო
43E.

დ.
გვ გვ
43f.
მე
44f.
სთ
440
-დან
441
თ.
442
w.
443
ჯ.
436
-ში
432
ბობლდცემა ეს ბ
44C.
სარა
44b.
ზ.
437
sh
448
ე.
44d.
sh
449
c.
447
კომერსანტი
44 ა.

ე.
Yu
42e.
მაგრამ
410
ბ.
411
C.
426
დ.
414
ე.
415
ვ.
424
გ.
413
თ.
425
და
418
ჯ.
419
-კენ
41a.
ლ.
41b.
მ.
41c.
ნ.
41d.
გარშემო
41e.

ვ.
გვ გვ
41f.
მე
42f.
სთ
420
-დან
421
თ.
422
W.
423
ჯ.
416
-ში
412
ბობლდცემა ეს ბ
42c.
სარა
42 ბ.
ზ.
417
Sh
428
ე.
42d.
Sh
429
C.
427
კომერსანტი
42 ა.

სხვა ვარიანტი

მხოლოდ არ არის შესაბამისი მაგიდის ხაზები, რადგან ყველაფერი ემთხვევა.

Koi8-u კოდირება (რუსული-უკრაინული)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .Აა. 6b .C.c. . .E.e. .

ა.

2550

2551

2552
ე.
451
є
454

2554
і
456
ї
457

2557

2558

2559

255 ა.

255 ბ
ґ
491

255d.

255.

ბ.

255f.

2560

2561
ე.
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256 ა.
Ґ
490

256c.
©
A9.

Koi8-ru encoding (რუსულ-ბელორუსკო-უკრაინული)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .Აა. 6b .C.c. . .E.e. .

ა.

2550

2551

2552
ე.
451
є
454

2554
і
456
ї
457

2557

2558

2559

255 ა.

255 ბ
ґ
491
ў
45E.

255.

ბ.

255f.

2560

2561
ე.
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256 ა.
Ґ
490
Ў
40.
©
A9.

KOI8-C კოდირება (ცენტრალური აზია)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .Აა. 6b .C.c. . .E.e. .
8. ғ
493
җ
497
қ
49 ბ.
ҝ
49d.
ң
4A3.
ү
4af.
ұ
4B1
ҳ
4B3.
ҷ
4b7.
ҹ
4b9.
һ
4bb.

2580
ә
4d9.
ӣ
4E3.
ө
4E9.
ӯ
4EF.
9. Ғ
492
Җ
496
Қ
49 ა.
Ҝ
49c.
Ң
4A2
Ү
4.
Ұ
4B0.
Ҳ
4B2.
Ҷ
4b6.
Ҹ
4B8.
Һ
4BA.

2321
Ә
4d8.
Ӣ
4E2.
Ө
4E8.
Ӯ
4EE.
ა.
A0.
ђ
452
ѓ
453
ე.
451
є
454
ѕ
455
і
456
ї
457
ј
458
љ
459
њ
45 ა.
ћ
45 ბ.
ќ
45c.
ґ
491
ў
45E.
џ
45f.
ბ.
2116
Ђ
402
Ѓ
403
ე.
401
Є
404
Ѕ
405
І
406
Ї
407
Ј
408
Љ
409
Њ
40 ა.
Ћ
40b.
Ќ
40C.
Ґ
490
Ў
40.
Џ
40f.

KOI8-T კოდირება (ტაჯიკი)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .Აა. 6b .C.c. . .E.e. .
8. қ
49 ბ.
ғ
493

201A.
Ғ
492

201.

2026

2020

2021

2030
ҳ
4B3.

2039
Ҳ
4B2.
ҷ
4b7.
Ҷ
4b6.
9. Қ
49 ა.

2018

2019

201C.

201D.

2022

2013
-
2014

2122

203 ა.
ა. ӯ
4EF.
Ӯ
4EE.
ე.
451
¤
A4.
ӣ
4E3.
¦
A6.
§
A7.
«
ზურგი
¬
აკველა
­
განცხადობა
®
ბ. °
B0.
±
B1.
²
B2.
ე.
401
Ӣ
4E2.

B6.
·
B7.

2116
»
BB.
©
A9.

Koi8-o, koi8-s კოდირება (სლავური, ძველი მართლწერა)

0407
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .Აა. 6b .C.c. . .E.e. .

8.
Ђ
0402
Ѓ
0403
¸
00B8.
ѓ
0453

201.

2026

2020
§
00A7.

20AC.
¨
00A8.
Љ
0409

2039
Њ
040A.
Ќ
040c.
Ћ
040b.
Џ
040F.

9.
ђ
0452

2018

2019

201C.

201D.

2022

2013

2014
£
00A3.
·
00B7.
љ
0459

203 ა.
њ
045 ა.
ќ
045C.
ћ
045 ბ
џ
045F

ა.

00A0.
ѵ
0475
ѣ
0463
ე.
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
®
00ae.

2122
«
00
ѳ
0473
ґ
0491
ў
045E.
´
00B4.

ბ.
°
00B0.
Ѵ
0474
Ѣ
0462
ე.
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408

2116
¢
00A2.
»
00bb.
Ѳ
0472
Ґ
0490
Ў
040E.
©
00A9.

ISO-IR-111, KOI8-E კოდირება

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .Აა. 6b .C.c. . .E.e. .

ა.

00A0.
ђ
0452
ѓ
0453
ე.
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045 ა.
ћ
045 ბ
ќ
045C.
­
00.
ў
045E.
џ
045F

ბ.

2116
Ђ
0402
Ѓ
0403
ე.
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A.
Ћ
040b.
Ќ
040c.
¤
00a4.
Ў
040E.
Џ
040F.

KOI8- ერთიანი კოდირება, KOI8-F

KOI8- ერთიანი კოდირება (KOI8-F) შემოთავაზებულია Fingertip პროგრამული უზრუნველყოფა.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .Აა. 6b .C.c. . .E.e. .

8.

2500

2502

250c.

2510

2514

2518

251c.

2524

252c.

2534

253c.

2580

2584

2588

258c.

2590

9.

2591

2018

2019

201C.

201D.

2022

2013

2014
©
00A9.

2122

00A0.
»
00bb.
®
00ae.
«
00
·
00B7.
¤
00a4.

ა.

00A0.
ђ
0452
ѓ
0453
ე.
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045 ა.
ћ
045 ბ
ќ
045C.
ґ
0491
ў
045E.
џ
045F

ბ.

2116
Ђ
0402
Ѓ
0403
ე.
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A.
Ћ
040b.
Ќ
040c.
Ґ
0490
Ў
040E.
Џ
040F.

არასამთავრობო მოწევა პარამეტრები KOI-8

ზოგიერთ ქვეყანაში, Cmeas შეიქმნა KOI-8 მოდიფიკაცია ეროვნული ლატასის პარამეტრები. ძირითადი იდეა იგივე იყო - მერვე ცოტა "შემცირება", ტექსტი უნდა იყოს მეტ-ნაკლებად გასაგები.

- კარგად, დაიწყე! - განაცხადა Doolokh.
"კარგად", - თქვა პიერმა, კვლავ გაღიმებული. - Შემეშინდა. აშკარა იყო, რომ საქმე, რომელიც ასე ადვილად დაიწყო, აღარ შეეძლო ხელი შეუშალა, რომ ეს იყო, მიუხედავად იმისა, რომ ხალხის ნებაა, და უნდა გაკეთდეს. დენისოვმა პირველად მოვიდა ბარიერისკენ და გამოაცხადა:
- მას შემდეგ, რაც P "Svatstniki უარი უთხრა" მათ ", თუ არა შეუძლებელია დაიწყოს: იარაღი და სიტყვის მიხედვით" და დაიწყოს გადავიდეს.
"გ ..." AZ! ორი! T "და!" Denisov ყვიროდა გაბრაზებული და გადავიდა მხარეს. ორივე წავიდა trotted ბილიკების უფრო მჭიდრო და უფრო ახლოს, ნისლში აღიარებს ერთმანეთს. ოპონენტებს უფლება ჰქონდათ, ბარიერის აღება, როცა ვინმეს სურს. Shelokh იყო ნელი, იარაღის აღზრდის გარეშე, მისი ნათელი, გამოუყენებელი, ლურჯი თვალები მისი მოწინააღმდეგე. მისი პირი, როგორც ყოველთვის, ჰქონდა ღიმილი მოსწონს.
- ასე რომ, როდესაც მინდა - შემიძლია გადაღება! - განაცხადა პიერმა, სიტყვა სამი სწრაფი ნაბიჯი წავიდა წინ, დაპირისპირება Trotan Walkway და ფეხით მთელი თოვლი. Pierre გაიმართა იარაღი, გაჭიმვა წინ Მარჯვენა ხელიაშკარად ეშინია, თუ როგორ ამ პისტოლეტი არ კლავს საკუთარ თავს. მან გულმოდგინედ გააჩნდა თავისი მარცხენა ხელი, რადგან მას უნდოდა ხელი შეუწყო ხელი, და მან იცოდა, რომ შეუძლებელი იყო. ექვსი ნაბიჯების გადაღება თოვლისკენ მიმავალ გზაზე, პიერმა ფეხზე უყურებდა, კვლავ დოლოხოვის კვლავ ჩანდა და თითი თითქოს ის ასწავლიდა, გადაღებულია. მე არ მგონია, რომ ასეთი ძლიერი ხმა, პიერმა თავისი გასროლადან გაიღო, მაშინ გაიღიმა თავისი შთაბეჭდილება და შეჩერდა. მოწევა, განსაკუთრებით სქელი ნისლიდან, ხელი შეუშალა მას პირველ მომენტში. მაგრამ კიდევ ერთი გასროლა ის ელოდება, არ დაიცვას. მხოლოდ დოლოჰოვის სასწრაფო ნაბიჯები მოისმინა და მისი ფიგურა, როგორც ჩანს, კვამლის გამო. ერთი მხრივ, მან დატოვა მარცხენა მხარეს, სხვა შეკუმშული გამოტოვებული პისტოლეტი. მისი სახე იყო ღია. როსტოვი გაიქცა და რაღაც უთხრა მას.
"ეს არ არის ..." ... "სოლოკოოვმა თავის კბილზე თქვა," არა, არ დასრულებულა "და კიდევ უფრო დაცემას, საბერისთვის ნაბიჯებს გადადგამს, თოვლის გვერდით დაეცა. მისი მარცხენა ხელი სისხლში იყო, ის სutuk- ს შესახებ გადალახა და მასთან ერთად წაიყვანა. მისი სახე იყო ღია, frowning და trembled.
"მე დავწერე ..." დაიწყო გაზიარება, მაგრამ მას არ შეეძლო დაუყოვნებლივ თქვა ... "გთხოვთ, ის შეთანხმდნენ". Pierre, ძლივს ჩატარების sobs, გაიქცა Dolohov, და უნდოდა გავლა სივრცეში დაშორებით ბარიერები, როგორც Shahov ყვიროდა: - ბარიერი! - და პიერმა, რომელმაც მიხვდა, რა იყო საქმე, შეწყვიტა მისი საბურავი. მათ მხოლოდ 10 ნაბიჯი გაიზიარეს. შელოვმა თოვლისკენ მიჰყავდა, სიხარბემ თოვლი, კიდევ ერთხელ დააყენა თავის არეში, ამოღებული, აიყვანეს მისი ფეხები და დაჯდა, ეძებს მყარი ცენტრი სიმძიმის. ის არის mold ცივი თოვლი და suck ეს; მისი ტუჩები გაანადგურეს, მაგრამ ყველაფერი გაღიმებულია; თვალები ბრწყინავს ძალისხმევას და ბოლო შეგროვებული ძალების საშვილოსნოს. მან იარაღი დააყენა და დაიწყო მიზანი.
"მხარე, დაიხუროს იარაღი," - განაცხადა ნესვიცკიმ.
- 3ak "მე! - გარეშე, თუნდაც დენისოვმა მისი მოწინააღმდეგე ყვიროდა.
Pierre ერთად Meek ღიმილი სინანული და მონანიება, უმწეო აყენებს მისი ფეხები და ხელები, პირდაპირ მისი ფართო ძუძუს იდგა ადრე Dolokhov და სამწუხაროდ შევხედე მას. დენისოვი, როსტოვი და ნესვიცკი. ამავე დროს, მათ მოისმინეს დოლოგოს გასროლა და ბოროტი ტირილი.
- by! - შაჰოვმა ყვიროდა და თოვლის სახეზე უვარგისი. პიერმა თავის თავზე წაიღო და უკან დაბრუნდა, წავიდა ტყეში, ფეხით მთლიანად თოვლი და ხმამაღლა გაუსწორდა უცნობი სიტყვები:
- სულელი ... სულელი! სიკვდილი ... ცრუ ... - თქვა მან გათავისუფლება. ნესვიცსკიმ შეწყვიტა იგი და საკუთარ სახლში წაიყვანა.
როსტოვი დენისოვთან ერთად იღბლიანი დოლოხოვმა გაუმართლა.
შელოკოვი, მდუმარედ, დახურულ თვალებთან ერთად, sleigh და არ უპასუხა კითხვებს, რომ მან გააკეთა; მაგრამ, მოსკოვში შევიდა, მან მოულოდნელად გაიღვიძა და, თავის მხრივ, სირთულეზე, როსტოვმა, რომელიც თავის მხრივ იჯდა. როსტოვმა მთლიანად შეცვალა და დოლოგოს სახეზე მოულოდნელად ენთუზიაზმი გამოხატულებაა.
- კარგად? Როგორ გრძნობ თავს? - სთხოვა როსტოვი.
- splly! მაგრამ არა წერტილი. ჩემი მეგობარი ", - თქვა შარდის ხმა წყვეტილ ხმასთან, - სად ვართ? ჩვენ მოსკოვში ვართ, მე ვიცი. მე არაფერი ვარ, მაგრამ მე მოკლეს, მოკლა ... ის არ მიიღებს მას. ის არ მოხდება ...
- Ჯანმო? - სთხოვა როსტოვი.
- Დედაჩემი. ჩემი დედა, ჩემი ანგელოზი, ჩემი adorable ანგელოზი, დედა, და სოლოჰოვი მე ტიროდა, squeezing როსტოვის ხელი. როდესაც მან გარკვეულწილად გაანადგურა, მან როსტოვმა განმარტა, რომელიც დედასთან ცხოვრობს, რომ თუ დედა მას კვდება, ის არ მიიღებს მას. მან სთხოვა როსტოვის წასვლა მას და მოამზადოს იგი.
როსტოვმა წავიდა ბრძანების შესასრულებლად და ის გაოცებული იყო, რომ მან გაიგო, რომ ეს მყიდველმა, სოლოჰოვის ბრენმა მოსკოვში ხანდაზმულ ქალბატონთან და ჰალსტესთან და ძმა და ძმა იყო.

Pierre ცოტა ხნის წინ იშვიათად ჩანს მისი მეუღლე თვალის თვალით. და სანკტ-პეტერბურგში და მოსკოვში, მათი სახლი მუდმივად სავსე იყო სტუმრებისგან. მომდევნო ღამეს შემდეგ დუელში, ის, როგორც მან ხშირად გააკეთა, არ წავიდა საძინებელი, მაგრამ დარჩა მისი უზარმაზარი, მამა ოფისში, იმდენად, როდესაც დათვლა of beggar გარდაიცვალა.
მან შეექმნა დივანი და სურდა იძინებს, რათა ყველაფერი დაივიწყოს, მაგრამ მას არ შეეძლო ამის გაკეთება. ასეთი ქარიშხალი გრძნობების, აზრების, მოგონებები მოულოდნელად გაიზარდა მისი სული, რომ მას არა მარტო ვერ ძილის, მაგრამ ვერ იჯდეს ადგილზე და უნდა ხტომა საწყისი დივანი და ფეხით ოთახში სწრაფი ნაბიჯები. იგი წარმოდგენილი იყო მას შემდეგ, რაც ქორწინების შემდეგ, ღია მხრებზე და დაღლილი, მგზნებარე სახე, და დაუყოვნებლივ მის შემდეგ, როგორც ჩანს, ლამაზი, თავხედური და მყარად დამცინავი სახე დოლოხოვის, როგორ იყო სადილი, და იგივე სახე Dologov, ღია, trembling და ტანჯვა, თუ როგორ იყო, როდესაც ის აღმოჩნდა და დაეცა თოვლი.
"რა იყო იქ? - მან ჰკითხა თავად. - მე მოკლეს შეყვარებული, დიახ, მოკლეს მისი მეუღლე შეყვარებული. დიახ, ეს იყო. რა? როგორ მოვიდე ეს? - იმიტომ, რომ შენ დაქორწინდით, - უპასუხა შინაგანი ხმას.
"მაგრამ რა ვარ დამნაშავე? მან ჰკითხა. - ის ფაქტი, რომ თქვენ ცოლად არ მოყვარე მისი, იმ ფაქტზე, რომ თქვენ მოატყუეს საკუთარ თავს და მისმა, - მასთან ერთად, პრინცი ვასილას სადილის შემდეგ, როდესაც მან თქვა, რომ ეს სიტყვები ვერ მოუწოდა: "იუ Ime ". [მე შენ მიყვარხარ] ყველაფერი ეს! მე მაშინ ვგრძნობდი, ფიქრობდა, ვიგრძენი მაშინ, რომ ეს არ იყო ის, რაც მე არ მქონდა უფლებები. ასე გამოვიდა. " მან გაიხსენა თაფლობის თვე, და blushed ერთად მოგონებები. განსაკუთრებით ცოცხალი, იმაზე, თუ როგორ ერთ დღეს, მისი ქორწინების შემდეგ, ის იყო 12 მეტრი დღე, აბრეშუმის ქურთუკში მოვიდა საძინებელი ოფისში, და აღმოაჩინა ხელმძღვანელი ხელმძღვანელი მენეჯერი, რომელიც thoughfully დაინტერესდა, შევხედე პიერას სახეზე, მის სააბაზანოზე და გაიღიმა ოდნავ, თითქოს ეს ღიმილი გამოხატავდა მისი პრინციპის ბედნიერებას.
"და რამდენჯერ მე ვამაყობდი, მე ვამაყობ მისი დიდი სილამაზე, მისი საერო ტაქტიკა, ის ფიქრობდა; ეს იყო ამაყი სახლი, რომელშიც მან მთელი პეტერბურგი, ამაყობს მისი მიუწვდომლობა და სილამაზე. რა ვამბობ?! მე ვფიქრობდი, რომ მე არ მესმის მისი. როგორც ხშირად, ფიქრი მისი ხასიათი, მე ვუთხარი თავს, რომ მე ვიყავი დამნაშავე, რომ მე არ მესმის მისი, მე არ მესმის ეს ოდესმე suffment, კმაყოფილება და არარსებობის ნებისმიერი დამოკიდებულება და სურვილები, და მთელი გავლენა იყო ამ საშინელი სიტყვა რომ ის არის depraved ქალი: თქვა, რომ მე საშინელი სიტყვა, და ყველაფერი ნათელი გახდა!
"Anatole იმოგზაურა მას, რომ ფულიდან ფულის აღება და მისი შიშველი მხრებზე კოცნა. მან ფული არ მისცა, მაგრამ თვითონ კოცნა იყო. მამა, ხუმრობით, აღფრთოვანებული მისი ეჭვიანობა; მან, ერთად მოდუნებული ღიმილი, განაცხადა, რომ ის არ იყო იმდენად სულელური, რომ იყოს ეჭვიანი: მისცეს მას, რომ მას სურდა, მან თქვა ჩემზე. ერთხელ ვკითხე მას, თუ არა იგი ორსულობის ნიშნებს. მან გაიცინა contemptuously და განაცხადა, რომ ის არ იყო სულელი სურვილი, რომ შვილები, და რომ მას არ ექნებოდა ბავშვები ჩემგან ".
შემდეგ მან გაიხსენა უხეშობა, მისი აზრების სიწმინდე და მისთვის მისი აღზრდის მიუხედავად მისი აზრების გამოხატვისა და მისი აღზრდის მიუხედავად. "მე არ ვარ რაღაც სულელი ... მე ვცდილობ თავს ... Allez Vous Promener," [გავიდნენ,] მან განაცხადა. ხშირად, ძველი და ახალგაზრდა მამაკაცებისა და ქალების თვალში მისი წარმატების სანახავად, პიერემ ვერ გაიგო, რატომ არ უყვარდა იგი. დიახ, მე არასოდეს უყვარდა მისი, მე ვუთხარი თავს პიერ; ვიცოდი, რომ ის იყო დამამცირებელი ქალი, მან თვითონ გაიმეორა, მაგრამ არ აწუხებდა, რომ აღიარება.

გამარჯობა, ძვირფასო ბლოგი მკითხველი ნახვა. დღეს ჩვენ გესაუბრებით თქვენს შესახებ, სადაც Krakoyarbra მოდის და პროგრამებში, რომელიც ტექსტური encodings არსებობს და რომელი მათგანი უნდა იქნას გამოყენებული. დეტალურად განვიხილოთ მათი განვითარების ისტორია, როგორიცაა ძირითადი ASCII, ასევე CP866, KOI8-R, Windows 1251- ის გაფართოებულ ვერსიები და Unicode UTF 16 და 8 კონსორციუმის თანამედროვე კოდებით.

ვინმეს ეს ინფორმაცია, როგორც ჩანს, არასაჭირო, მაგრამ თქვენ იცით, რამდენი კითხვები ჩემთვის ზუსტად შეშფოთებულია ბზარები (არ კითხულობს კომპლექტი სიმბოლოების). ახლა მე შესაძლებლობა ექნებათ ყველასთვის ამ სტატიის ტექსტის გაგზავნა და დამოუკიდებლად მოძებნოთ თქვენი shoals. კარგად, მოემზადეთ ინფორმაციის შთანთქას და ცდილობენ მონიტორინგი თხრობის.

ASCII - ძირითადი Latiza ტექსტი კოდირება

ტექსტის კოდების განვითარება ერთდროულად ხდება IT ინდუსტრიის ფორმირებით, ხოლო ამ დროს მათ დრო სჭირდებოდათ რამდენიმე ცვლილება. ისტორიულად, ეს ყველაფერი Ebcdic- ის რუსულენოვან რუსულენოვან არჩევნებშიც კი დაიწყო, რამაც შესაძლებელი გახადა ლათინური ასოების, არაბული ნომრებისა და პუნქტუაციის ნიშნების ასოების გამოყენებით.

მაგრამ თანამედროვე ტექსტის კოდების განვითარების დღემდე ჯერ კიდევ უნდა ჩაითვალოს ცნობილი Ascii. (ამერიკული სტანდარტული კოდი ინფორმაციის გაცვლისთვის, რომელიც რუსულ ენაზე, როგორც წესი, გამოხატულია "Aski"). იგი აღწერს პირველ 128 სიმბოლოს ყველაზე ხშირად გამოყენებული ინგლისურენოვანი მომხმარებლების მიერ - არაბული ნომრები და პუნქტუაციის ნიშნები.

მაშინაც კი, ამ 128 სიმბოლოს აღწერილი ASCII- ში, ზოგიერთი სერვისის სიმბოლოები გაანადგურა ფრჩხილებში, ლატეტებით, ასტერიკებით და ა.შ. სინამდვილეში, თქვენ ხედავთ მათ:

ეს არის ASCII- ის თავდაპირველი ვერსიიდან 128 სიმბოლო გახდა სტანდარტი, და ნებისმიერ სხვა კოდირებაში თქვენ აუცილებლად შეხვდებით და დგას, რომ ისინი ასე იქნება.

მაგრამ ფაქტია, რომ ინფორმაციის ერთი ბატის დახმარებით, ეს არ არის 128, მაგრამ რაც შეეხება 256 სხვადასხვა ღირებულებას (ორი ხარისხის რვა 256), ასე შემდეგ ბაზის ვერსია Aski გამოჩნდა რამდენიმე advanced Encodings ASCII128 ძირითადი ნიშნით, ასევე შესაძლებელი იყო ეროვნული კოდირების სიმბოლოების encode (მაგალითად, რუსული).

აქ, ალბათ, ღირს ცოტა მეტი ნომრის სისტემა, რომელიც გამოიყენება აღწერაში. პირველ რიგში, როგორც თქვენ იცით, ყველაფერი, კომპიუტერი მუშაობს მხოლოდ ორობითი სისტემაში, კერძოდ, zeros და ერთეულები ("Boulev ალგებრა", თუ ვინმეს ინსტიტუტში ან სკოლაში). რომელთაგან თითოეული არის decend ხარისხი, დაწყებული ნულოვანი და Twos მეშვიდე:

არ არის ძნელი გასაგები, რომ ასეთ დიზაინში ზონებისა და ერთეულების ყველა შესაძლო კომბინაცია შეიძლება იყოს მხოლოდ 256. თარგმნა ორობითი სისტემის რიცხვში, საკმაოდ მარტივია. აუცილებელია უბრალოდ ჩამოყაროს ყველა გრადუსი Twos ზემოთ, რომ ერთი დგას.

ჩვენს მაგალითში აღმოჩნდება 1 (2-ის ხარისხი ნულოვანი) პლუს 8 (ორი გრადუსი 3), პლუს 32 (ორჯერ მეხუთე ხარისხში), პლუს 64 (მეექვსე), პლუს 128 (მეშვიდე) . სულ იღებს 233 წელს ათობითი სისტემა Შენიშვნა. როგორც ხედავთ, ყველაფერი ძალიან მარტივია.

მაგრამ თუ თქვენ ნახეთ მაგიდასთან ASCII სიმბოლოებთან, ნახავთ, რომ ისინი წარმოდგენილია თექვსმეტი კოდირებით. მაგალითად, "Asterisk" შეესაბამება ACKI- ს თექვსმეტი 2 ა. ალბათ თქვენ იცით, რომ თექვსმეტი სისტემა ნომრები გამოიყენება არაბულ ნომრებზე, ლათინურ ასოებს (ათი) F (ნიშნავს თხუთმეტი).

კარგად, ასე რომ Გადაცემა ორობითი ნომრები Hexadecimal- ში მიმართა შემდეგი მარტივი და ვიზუალური გზით. თითოეული ბატის ინფორმაცია ორ ნაწილად ორ ნაწილად დაყოფილია, როგორც ზემოთ მოყვანილი სკრინშოტი. Ისე Byte- ის ნახევარში, ორობითი კოდექსი შეიძლება იყოს მხოლოდ თექვსმეტი ღირებულებების (ორი მეოთხე ხარისხით), რომელიც შეიძლება ადვილად წარმოდგენილ იქნას ჰექსადეციმალი.

უფრო მეტიც, Byte- ის მარცხენა ნახევარში, აუცილებელია ნულოვანიდან კვლავ განვიხილოთ, და არა როგორც სკრინშოტში. შედეგად, არასამთავრობო კარგი კომპიუტერული, ჩვენ მივიღებთ, რომ ნომერი E9 არის encoded in screenshot. ვიმედოვნებ, რომ ჩემი მსჯელობის კურსი და ამ რეაგირების გამაძლიერებელი გასაგებია. კარგად, ახლა ჩვენ გავაგრძელებთ, რეალურად ვისაუბროთ ტექსტის კოდირებაზე.

გაფართოებული ვერსიები Aski - CP866 და KOI8-R კოდირება ფსევდოგრაფიით

ასე რომ, ჩვენ დავიწყეთ ascii- ის შესახებ საუბარი, რომელიც ყველა თანამედროვე კოდირების განვითარების დაწყებამდე (Windows 1251, Unicode, UTF 8) იყო.

თავდაპირველად, ეს იყო მხოლოდ 128 ნიშნით ლათინური ანბანის, არაბული ნომრები და სხვა რამე, მაგრამ გაფართოებულ ვერსიაში შესაძლებელი იყო ყველა 256 ღირებულების გამოყენება, რომელიც შეიძლება ერთ პიტ-ში. ისინი. ასკას წერილების სიმბოლოების დამატება.

აქ აუცილებელია კიდევ ერთხელ განადგურდეს - რატომ გჭირდებათ კოდირება? ტექსტები და რატომ არის ძალიან მნიშვნელოვანი. თქვენი კომპიუტერის ეკრანზე ჩამოყალიბებულია ორი რამის საფუძველზე - ყველა სახის პერსონაჟების ვექტორული ფორმების (წარმომადგენლობების) კომპლექტი (ისინი ფაილებში CO) და კოდი, რომელიც საშუალებას გაძლევთ გაიყვანოთ ამ ტიპის ვექტორული ფორმების ამ კომპლექტი ( ფონტის ფაილი) ეს არის ხასიათი უნდა ჩაიწეროს სწორი ადგილი.

ნათელია, რომ შრიფტები პასუხისმგებელია ვექტორული ფორმებისთვის, მაგრამ მასში გამოყენებული ოპერაციული სისტემა და პროგრამები პასუხისმგებელია კოდირებისთვის. ისინი. თქვენს კომპიუტერში ნებისმიერი ტექსტი იქნება თითოეული მათგანის კომპლექტი, რომელთაგან თითოეული სიმბოლოა ამ ტექსტის ერთი სიმბოლო.

პროგრამა, რომელიც აჩვენებს ამ ტექსტს ეკრანზე (ტექსტური რედაქტორი, ბრაუზერი და ა.შ.), როდესაც კოდის დამონტაჟებისას, კითხულობს მომდევნო ნიშნის კოდირებას და შესაბამისი ვექტორული ფორმის ძიებას სასურველი ფაილი შრიფტი, რომელიც დაკავშირებულია ამ ტექსტის დოკუმენტის ჩვენება. ყველაფერი მარტივია და ტრაიტეტია.

ასე რომ, ნებისმიერი სიმბოლოების encode ჩვენ გვჭირდება (მაგალითად, ეროვნული ანბანით), ორი პირობა უნდა დასრულდეს - ამ ნიშნის ვექტორული ფორმა უნდა იყოს გამოყენებული შრიფტით და ეს სიმბოლო შეიძლება იყოს ascii encodings ერთ byte- ში . აქედან გამომდინარე, არსებობს მთელი ასეთი ვარიანტი. მხოლოდ რუსული ენის სიმბოლოების კოდირება არსებობს რამდენიმე ჯიშის გაფართოებული asss.

მაგალითად, თავდაპირველად გამოჩნდა CP866.რომელშიც შესაძლებელი იყო რუსული ანბანის სიმბოლოების გამოყენება და ASCII- ის გაფართოებული ვერსია იყო.

ისინი. მისი ზედა ნაწილი მთლიანად დაემთხვა ACKI- ს ძირითადი ვერსია (ლათინური, ციფრები და თუნდაც ლაბუდას 128 სიმბოლო), რომელიც წარმოდგენილია სკრინშოტი ოდნავ უფრო მაღალი, მაგრამ უკვე CP866 კოდირების მაგიდის ქვედა ნაწილში იყო მითითებული სკრინშოტი ოდნავ ქვემოთ ხედვა და ნებადართულია კიდევ ერთი 128 ნიშნები (რუსული ასოები და ნებისმიერი ფსევდოგრაფიული):

იხილეთ, მარჯვენა სვეტში, რიცხვები იწყება 8-ით, რადგან 0-დან 7-მდე ნომრები ეხება ASCII- ის ბაზის ნაწილს (იხ. პირველი სკრინშოტი). Ისე რუსეთის წერილი "M" CP866- ში CD866- ს ექნება კოდექსის 9C (ეს არის შესაბამისი რიგების გადაკვეთაზე 9 და სვეტთან ერთად რიცხვი C- ში, რომელიც შეიძლება დაწეროს ერთ ბაიტურ ინფორმაციაში და თუ არსებობს შესაფერისი შრიფტი რუსული სიმბოლოებით, ეს წერილი პრობლემების გარეშე ტექსტში იქნება ნაჩვენები.

სად წავიდა ეს რაოდენობა pseudographers in CP866.? ეს ყველაფერი ისაა, რომ ამ ბრწყინვალე წლების განმავლობაში შემუშავდა რუსული ტექსტის ეს კოდირება, როდესაც გრაფიკული ოპერაციული სისტემების ასეთი განაწილება არ იყო. და დოსთისა და მსგავსი ტექსტის ოპერაციებში, ფსევდოგრაფიულმა, სულ მცირე, გარკვეულწილად დივერსიფიკაცია ტექსტების დიზაინს და, შესაბამისად, CP866- სთან ერთად და ყველა სხვა რიგებს ასკას გაფართოებული ვერსიებისგან.

CP866 განაწილებული IBM კომპანია, მაგრამ გარდა ამისა, რიგი encodings შემუშავდა რუსული ენის სიმბოლოები, მაგალითად, იგივე ტიპის (გაფართოებული ASCII) შეიძლება მიეწერება Koi8-r.:

მისი მუშაობის პრინციპი იგივე დარჩა, როგორც CP866 მოგვიანებით აღწერილი - თითოეული ტექსტური სიმბოლო ერთი ბაიტიდან არის კოდირებული. სკრინშოტი გვიჩვენებს KOI8-R ცხრილის მეორე ნახევარს, რადგან პირველი ნახევარი სრულად შეესაბამება ბაზის ASUS- ს, რომელიც ამ სტატიაში პირველი სკრინშოტია ნაჩვენები.

KOI8-R კოდირების მახასიათებლებს შორის შეიძლება აღინიშნოს, რომ რუსეთის წერილები თავის მაგიდასთან არ არის ანბანური თანმიმდევრობით, როგორიც ეს, მაგალითად, CP866- ში.

თუ გადავხედავთ პირველ ეკრანზე (საბაზისო ნაწილი, რომელიც შემოდის ყველა გაფართოებულ კოდირებაში), მაშინ შეამჩნევთ, რომ KOI8-R- ში, რუსული ასოები მდებარეობს მაგიდის იმავე მაგიდაზე, როგორც ლათინური ანბანის ასოები პირველი ნაწილიდან მაგიდა. ეს გაკეთდა რუსული სიმბოლოებისგან ლათინურად გადართვისთვის მხოლოდ ერთი ბიტიდან (ორი მეშვიდე ხარისხში ან 128).

Windows 1251 - ASCII- ის თანამედროვე ვერსია და რატომ Crackels გავიდნენ

ტექსტური კოდების შემდგომი განვითარება გამოწვეული იყო იმის გამო, რომ გრაფიკული ოპერაციული სისტემები და მათში ფსევდოგრაფიის გამოყენების აუცილებლობა პოპულარობას მოიპოვეს. შედეგად, მთელი ჯგუფი გაჩნდა, რაც, მათი არსით, ჯერ კიდევ ANCLI- ის თანამედროვე ვერსიებს (ერთი ტექსტური სიმბოლოა მხოლოდ ერთი პროდუქციის საშუალებით), მაგრამ ფსევდოგრაფიული სიმბოლოების გამოყენების გარეშე.

მათ ეწოდა ე.წ. ANSI კოდირება, რომელიც შემუშავდა ამერიკული ინსტიტუტის სტანდარტიზაციის ინსტიტუტის მიერ. კირილიკის სახელწოდება კვლავ გამოყენებულ იქნა რუსულ ენაზე მხარდაჭერით. მაგალითის მაგალითი.

იგი ხელსაყრელი იყო ადრე გამოყენებული CP866 და KOI8-R- ისგან, რომ ფსევდოგრაფიული პერსონაჟების ადგილსამყოფელი რუსული ტიპოგრაფიის (მცირდება ნიშანი) დაკარგული სიმბოლოები, ისევე როგორც რუსეთის სლავურთან ახლოს გამოყენებული სიმბოლოები ენები (უკრაინული, ბელორუსული და ა.შ.):

ამ სიმრავლის გამო რუსული ენის კოდები, შრიფტები და მწარმოებლების მწარმოებლები პროგრამული უზრუნველყოფა მან მუდმივად გაჩნდა თავის ტკივილი, და თქვენთან ერთად, ძვირფასო მკითხველს, ხშირად ყველაზე ცნობილი იყო კრაკოიბაროდესაც დაბნეულობა ასწავლიდა ტექსტში გამოყენებულ ვერსიას.

ხშირად ისინი გამოვიდნენ შეტყობინებების გაგზავნისა და მიღებისას ელ.ფოსტარამაც გამოიწვია ძალიან კომპლექსური ტრანსკოდირების ცხრილების შექმნა, რომელიც, ფაქტობრივად, ამ პრობლემის გადაჭრაში ვერ მოხერხდა და ხშირად კორესპონდენციის მომხმარებლები იყენებდნენ, რათა თავიდან იქნას აცილებული ცნობილი კრაკოზების თავიდან ასაცილებლად, როგორიცაა CP866, KOI8-R ან Windows 1251- ის რუსული კოდების გამოყენება.

არსებითად, კრაკოზიაბრი, რუსული ტექსტის ნაცვლად, იყო შედეგი არასწორი გამოყენება კოდირება ამ ენაზერომელიც არ შეესაბამება იმას, რომლითაც ეს იყო კოდირებული ტექსტური შეტყობინება თავდაპირველად.

დავუშვათ, თუ სიმბოლოები CP866- ით, შეეცადეთ აჩვენოთ Windows 1251 კოდის მაგიდის გამოყენებით, მაშინ ეს ყველაზე დაბზარულია (სიმბოლოების უაზრო კომპლექტი) და გავიდნენ, სრულიად შეცვლის შეტყობინების ტექსტს.

მსგავსი სიტუაცია ძალიან ხშირად ხდება, ფორუმი ან ბლოგები, როდესაც ტექსტი რუსეთის სიმბოლოების შეცდომით არ არის შენახული ამ კოდირებით, რომელიც გამოიყენება ნაგულისხმევი ვებსაიტზე, თუ არა ამ ტექსტის რედაქტორირომელიც დასძენს კოდი Sebestin არ ჩანს შეუიარაღებელი თვალი.

საბოლოო ჯამში, ასეთი სიტუაცია მრავალ კოდირებით და მუდმივად მცოცავი კოდირებით, ბევრი დაღლილი იყო წინაპირობები ახალი უნივერსალური ვარიაციის შესაქმნელად, რომელიც შეცვალა ყველა არსებული და გადაჭრის, საბოლოოდ, პრობლემის ძიებისას არ არის წაკითხვადი ტექსტები. გარდა ამისა, იყო მსგავსი ჩინური ენის ენების პრობლემა, სადაც ენის სიმბოლოები 256-ზე მეტი იყო.

Unicode (Unicode) - უნივერსალური კოდები UTF 8, 16 და 32

სამხრეთ-აღმოსავლეთ აზიის ენის ჯგუფის ამ ათასობით ნიშნით არ შეიძლება აღწერილი ერთ პიპის ინფორმაციაში, რომელიც გამოყოფილი ASCII ვერსიების კოდირების პერსონაჟებისათვის. შედეგად, კონსორციუმი შეიქმნა უნიკედი (Unicode - Unicode Consortium) თანამშრომლობით ბევრი IT ლიდერები ინდუსტრიის (ვინც აწარმოოს პროგრამული უზრუნველყოფა, რომელიც encodes რკინის, რომელიც ქმნის შრიფტები), რომლებიც დაინტერესებულნი იყვნენ უნივერსალური ტექსტის კოდირების გამოჩენა.

Unicode კონსორციუმის ეგიდით გამოქვეყნებული პირველი ვარიაცია იყო UTF 32.. კოდირების სახელით ციფრი ნიშნავს ბიტითა რაოდენობას, რომელიც გამოიყენება ერთი სიმბოლოების encode. 32 ბიტი არის 4 ბაიტი ინფორმაცია, რომელიც საჭირო იქნება ახალი უნივერსალური UTF კოდირების ერთი ნიშანი.

შედეგად, ამ უკანასკნელ შემთხვევაში ASCII- ისა და UTF-32- ის გაფართოებულ ვერსიასთან დაკავშირებული ტექსტის იგივე ფაილს ექნება ზომა (წონა) ოთხჯერ მეტი. ეს ცუდია, მაგრამ ახლა ჩვენ გვაქვს შესაძლებლობა, რომ utf- ის დახმარებით ორიდან ოცდაათი მეორე გრადუსების მქონე ნიშნების encode utf ( მილიარდობით სიმბოლორომელიც დაფარავს რაიმე რეალურ ღირებულებას კოლოსალურ ზღვართან).

მაგრამ ევროპულ ჯგუფს ბევრ ქვეყანას აქვს ასეთი დიდი რაოდენობით ნიშნები, რომლებიც იყენებენ კოდირებაში და არ იყო საჭირო, თუმცა, UTF-32- ის გამოყენებისას, მათ არ მიიღებდნენ ოთხჯერ გაზრდას ტექსტური დოკუმენტების წონაში და შედეგად, ინტერნეტ ტრაფიკის ზრდა და მოცულობის შენახული მონაცემები. ეს არის ბევრი, და არავის შეეძლო ასეთი ნარჩენები.

Unicode- ის განვითარების შედეგად გამოჩნდა UTF-16.რომელიც აღმოჩნდა იმდენად წარმატებული, რომელიც მიღებულ იქნა როგორც ძირითადი სივრცე, რომელიც ჩვენ ვიყენებთ ყველა სიმბოლოს. იგი იყენებს ორ ბაიტს ერთი ნიშანი. მოდი ვნახოთ, როგორ გამოიყურება ეს.

In Windows ოპერაციული სისტემა, თქვენ შეგიძლიათ გაიაროს გასწვრივ გზა "დაწყება" - "პროგრამები" - "სტანდარტული" - "მომსახურება" - "ხასიათი მაგიდა". შედეგად, მაგიდა იხსნება თქვენს შრიფტებში დამონტაჟებული ყველა ვექტორული ფორმებით. თუ თქვენ " დამატებითი პარამეტრების»კომპლექტი Unicode ნიშნები, თქვენ შეგიძლიათ ნახოთ თითოეული შრიფტის ცალკე მთელი სპექტრი გმირები შედის მასში.

სხვათა შორის, დაწკაპვით რომელიმე მათგანი, თქვენ შეგიძლიათ ნახოთ ეს ორი კოდი UTF-16 ფორმატშიშედგება ოთხი თექვსმეტი ციფრი:

რამდენი სიმბოლო შეიძლება იყოს utf-16 გამოყენებით 16 ბიტი? 65 536 (ორი თექვსმეტი), და ეს რიცხვი იყო UNICODE- ში ძირითადი სივრცისთვის. გარდა ამისა, არსებობს გზები encode მასთან და დაახლოებით ორი მილიონი სიმბოლო, მაგრამ შემოიფარგლება გაფართოებული სივრცე მილიონი ტექსტური სიმბოლოები.

მაგრამ მაშინაც კი, Unicode- ის კოდირების ეს წარმატებული ვერსიაც კი არ მოიტანს ბევრ კმაყოფილებას, ვინც დაწერა, მაგალითად, პროგრამები მხოლოდ ინგლისურ ენაზე, რადგან მათ აქვთ ASCII- ის გაფართოებული ვერსიიდან UTF-16- ის გაფართოების შემდეგ, ორჯერ გაიზარდა დოკუმენტების წონა (ერთი სიმბოლო ერთი სიმბოლოა Aski და ორი Bytes იმავე სიმბოლოს UTF-16).

ეს არის ზუსტად, რომ დააკმაყოფილოს ყველას და ყველა Unicode კონსორციუმის გადაწყვიტა ამუშავება კოდირების ცვლადი სიგრძე. მას უწოდებენ UTF-8. მიუხედავად რვა სათაურში, მას მართლაც აქვს ცვლადი სიგრძე, ანუ. თითოეული ტექსტური სიმბოლო შეიძლება იყოს ერთ-ერთი ექვსი ბატის თანმიმდევრობით.

პრაქტიკაში, UTF-8 იყენებს მხოლოდ ერთიდან ოთხ ბაიტს, რადგან არაფერია თეორიულად, რომ არაფერი წარუდგინოს კოდექსის ოთხი ბაიტი. ყველა ლათინური ნიშნები ერთ byte, ისევე როგორც ძველი კარგი ASCII.

რა არის საყურადღებო, მხოლოდ ლათინური კოდირების შემთხვევაში, იმ პროგრამებს, რომლებიც არ იციან უნიკოდი, კვლავ წაიკითხავს, \u200b\u200bრა არის utf-8- ში. ისინი. Aska- ს ძირითადი ნაწილი უბრალოდ Unicode Consortium- ს გადავიდა.

Cyrillic ნიშნები UTF-8 არის encoded ორ ბაიტი, და, მაგალითად, ქართული - სამი ბაიტი. Unicode Consortium შემდეგ შექმნის UTF 16 და 8 გადაწყვიტა მთავარი პრობლემა - ახლა ჩვენ გვაქვს შრიფტებში არსებობს ერთი კოდი. და ახლა მათი მწარმოებლები რჩება მხოლოდ მათი ძალებისა და შესაძლებლობების საფუძველზე ტექსტის სიმბოლოების ვექტორული ფორმებით. ახლა კი კომპლექტიც კი.

ქვემოთ მოყვანილი სიმბოლოების ცხრილში ჩანს, რომ სხვადასხვა შრიფტები სხვადასხვა სიმბოლოების მხარდასაჭერად. უნიკოდის შრიფტის ზოგიერთი სიმბოლო შეიძლება კარგად წონაში. მაგრამ ახლა ისინი არ გამოირჩევიან იმით, რომ ისინი სხვადასხვა კოდებით შეიქმნა, მაგრამ ის ფაქტი, რომ შრიფტის მწარმოებელი შევსებულია ან არ შეავსებს ერთ კოდს ამ ან სხვა ვექტორულ ფორმებს.

Krakoyabry ნაცვლად რუსეთის წერილები - როგორ დაფიქსირება

მოდით ახლა ვნახოთ, როგორ Crakozyabe ტექსტი, როგორც ჩანს, ტექსტის ნაცვლად ან სხვა სიტყვებით, როგორ არის სწორი კოდირება რუსული ტექსტისთვის. სინამდვილეში, იგი არის მითითებული პროგრამა, რომელშიც თქვენ შექმნით ან შეცვალონ იგივე ტექსტი, ან კოდი ტექსტის ფრაგმენტების გამოყენებით.

რედაქტირება და შექმნა ტექსტური ფაილები პირადად, მე ძალიან კარგი ვიყენებ, ჩემი აზრით,. თუმცა, მას შეუძლია ხაზგასმით აღვნიშნოთ სინტაქსი მაინც ასობით პროგრამირების ენებზე და მარკირებას, ასევე აქვს უნარი გაფართოების ერთად plugins. კითხვა დეტალური მიმოხილვა ეს შესანიშნავი პროგრამა ბმულით.

In Notepad ++ ზედა მენიუში, არსებობს "კოდირება" პუნქტი, სადაც თქვენ გექნებათ შესაძლებლობა შექმნან არსებული ვარიანტი, რომელიც გამოიყენება თქვენს სტანდარტულ საიტზე:

იმ შემთხვევაში, თუ საიტი Joomla 1.5 და ზემოთ, ისევე როგორც შემთხვევაში დღიური WordPress, თქვენ უნდა აირჩიოთ ვარიანტი, რათა თავიდან ავიცილოთ გამოჩენა Krakoyar UTF 8 ბომის გარეშე. რა არის ბომ პრეფიქსი?

ფაქტია, რომ როდესაც ETF-16 კოდირება შეიქმნა, რადგან ამ მიზეზით გადაწყვიტა ასეთი რამ, როგორც სიმბოლური კოდის ჩაწერას, როგორც პირდაპირი თანმიმდევრობით (მაგალითად, 015) და საპირისპირო (150A) . და იმისათვის, რომ პროგრამების გასაგებად, რომელი თანმიმდევრობის კითხვის კოდები, და გამოიგონა ბომ. (Byte Order Mark ან, სხვა სიტყვებით, ხელმოწერა), რომელიც გამოითქვა სამი დამატებითი ბატის დასძინა დოკუმენტების დასაწყისში.

UTF-8 კოდირებაში, Unicode Consortium- ში არ ყოფილა BOM და, შესაბამისად, ხელმოწერა (ეს ყველაზე ცნობილი სამი ბაიტიდან დოკუმენტის დასაწყისში) ზოგიერთი პროგრამა უბრალოდ ხელს უშლის კოდს. აქედან გამომდინარე, ჩვენ ყოველთვის, ჩვენ, როდესაც თქვენ Saving ფაილი UTF, თქვენ უნდა აირჩიოთ ვარიანტი გარეშე BOM (გარეშე ხელმოწერა). ასე რომ თქვენ წინასწარ ხართ mustrase თავს crackering.

რა არის აღსანიშნავი, რომ Windows- ში ზოგიერთი პროგრამა არ იცის, თუ როგორ უნდა გააკეთოთ ეს (არ შეინახოთ ტექსტის შენახვა UTF-8 ბომის გარეშე), მაგალითად, იგივე ცნობილი ნოუთბუქის ფანჯრები. ეს ინახავს დოკუმენტს UTF-8- ში, მაგრამ ჯერ კიდევ დასძენს ხელმოწერას (სამი დამატებითი ბაიტი). უფრო მეტიც, ეს ბაიტი ყოველთვის იქნება იგივე - წაიკითხეთ კოდი პირდაპირი თანმიმდევრობით. მაგრამ სერვერებზე, რადგან ეს პატარა რამ, შეიძლება იყოს პრობლემა - Crackels გავიდნენ.

ამიტომ, არ შემთხვევაში არ გამოიყენოთ ჩვეულებრივი ნოუთბუქის ფანჯრები თქვენი საიტის დოკუმენტების რედაქტირება, თუ არ გინდა კრაკოიარბრას გამოჩენა. მიმაჩნია უახლესი და მარტივი ვარიანტი უკვე აღნიშნული Notepad ++ რედაქტორი, რომელიც პრაქტიკულად არ აქვს ნაკლოვანებები და შედგება ერთ-ერთი უპირატესობისგან.

In Notepad + + როდესაც არჩევის კოდირების, თქვენ გექნებათ უნარი გარდაქმნას ტექსტი UCS-2 კოდირებით, რომელიც ძალიან ახლოს Unicode სტანდარტი არსებითად. ასევე არაკომერციულ შეიძლება იყოს encoded in ANSI, I.E. რუსული ენის მითითებით, ეს უკვე აღწერილია აშშ-ს მიერ მხოლოდ Windows 1251- ზე. სად არის ეს ინფორმაცია?

იგი გაწერილია თქვენი საოპერაციო ოთახის რეესტრში windows სისტემები - რა კოდირებას აპირებს ANSI- ს შემთხვევაში, რა უნდა აირჩიოს OEM- ის შემთხვევაში (რუსული ენისთვის ეს იქნება CP866). თუ თქვენს კომპიუტერზე კიდევ ერთი ნაგულისხმევი ენა დააინსტალირებთ, მაშინ ეს encodings შეიცვლება ANSI- ს ან OEM- ის გამონადენის მსგავსი ენისთვის.

მას შემდეგ, რაც Notepad ++, შენახვა დოკუმენტი კოდირებაში თქვენ გჭირდებათ ან გახსენით დოკუმენტი საიტიდან რედაქტირება, მაშინ რედაქტორის ქვედა მარჯვენა კუთხეში შეგიძლიათ ნახოთ მისი სახელი:

თავიდან აცილების მიზნით Krakoyarbrovზემოთ აღწერილი ქმედებების გარდა, სასარგებლო იქნება საიტის ყველა გვერდის ყველა გვერდის კოდის სათავეში, სერვერზე ან ადგილობრივ მასპინძელზე, რომელიც არ მოხდება.

ზოგადად, ჰიპერტექსტის ყველა ენაზე, ვიდრე HTML- ის გარდა, სპეციალური XML რეკლამა გამოიყენება, რომელიც განსაზღვრავს ტექსტის კოდირებას.

კოდის დაშლის დაწყებამდე ბრაუზერი გაიგებს, თუ რომელი ვერსია გამოიყენება და რამდენად ზუსტად უნდა გჭირდებათ ამ ენის გმირების კოდების ინტერპრეტაცია. მაგრამ რა არის საყურადღებო, იმ შემთხვევაში, თუ დოკუმენტის შენახვა Default Unicode- ში, ეს XML დეკლარაცია შეიძლება გამოტოვებული იყოს (კოდირება იქნება UTF-8, თუ არ არსებობს BOM ან UTF-16 თუ ბომბობა).

დოკუმენტის შემთხვევაში hTML ენა მიუთითეთ კოდირება მეტა ელემენტირომელიც ინიშნება გახსნისა და დახურვის უფროსს შორის:

... ...

ეს ჩანაწერი საკმაოდ განსხვავდება მიღებული B- ისგან, მაგრამ სრულად შეესაბამება HTML 5 სტანდარტის ნელა ნელ-ნელა ნელ-ნელა, და ეს აბსოლუტურად სწორად არის გასაგები ადამიანი, რომელიც გამოიყენება ამ მომენტში ბრაუზერები.

თეორიულად, მეტა ელემენტი კოდირების მითითებით HTML დოკუმენტი უკეთესი დასვა რაც შეიძლება მაღალია დოკის სათაურშიასე რომ, პირველი ნიშნის ტექსტში შეხვედრის დროს არ არის ძირითადი ANSI (რომელიც ყოველთვის ყოველთვის და ნებისმიერი ვარიაციით) ბრაუზერმა უკვე უნდა ჰქონდეს ინფორმაცია, თუ როგორ უნდა გაეცნოთ ამ სიმბოლოების კოდებს.

Წარმატებას გისურვებ! ორაზროვანი შეხვედრები ბლოგზე გვერდებზე

თქვენ შეიძლება იყოს დაინტერესებული

Რა URL მისამართებირა განსხვავებაა აბსოლუტურ და ნათესავებს შორის საიტისთვის
Openserver - თანამედროვე ადგილობრივი სერვერი და მისი გამოყენების მაგალითი wordPress დანადგარები კომპიუტერზე
რა არის chmod, რომელიც წვდომის უფლების მინიჭება ფაილების და დასტების (777, 755, 666) და როგორ უნდა გავაკეთოთ მეშვეობით PHP
ძებნა Yandex საიტზე და ონლაინ მაღაზია