DatamaskinerInformasjonsteknologi

Koding av tekstinformasjon i datamaskinen

Computer - en sofistikert enhet som du kan lage, konvertere og lagre informasjon. Men ikke datamaskinen fungerer veldig forståelig måte for oss - grafikk, tekst og numeriske data er lagret som binære matriser tall. I denne artikkelen vil vi se på hvordan koding av tekstinformasjonen.

Det som for oss er teksten i en datamaskin - en sekvens av tegn. Hvert symbol representerer et bestemt sett av nuller og enere. Under symbolene betydde ikke bare store og små bokstaver i det latinske alfabetet, men også skilletegn, aritmetiske tegn, spesialtegn, spesielle symboler og til og med plass.

Binær koding av tekstlig informasjon

Ved å trykke på en bestemt tast på den interne styreenheten sender et elektrisk signal som omformes til en binær kode. Kode er matchet med en viss symbol, som vises på skjermen. For innsending til det latinske alfabetet i et digitalt format ASCII koding internasjonale systemet ble opprettet. Det krever en byte for opptak av ett symbol består således av åtte-symbolsekvens av nuller og enere. Opptaksintervallet - 00000000 til 11111111, dvs. koding av tekst informasjon ved hjelp av dette systemet kan vi representere 256 tegn. I de fleste tilfeller er dette nok.

ASCII er delt i to deler. De første 127 tegn (fra 00.000.000 til 01.111.111) er internasjonale og er bestemte symboler og bokstaver i det engelske alfabetet. Den andre delen - utvidelsen (10000000-11111111) - er ment å representere den nasjonale alfabetet, skriving som er forskjellig fra det latinske.

Koding tekstinformasjon i ASCII er bygd på prinsippet om å øke sekvens, det vil si, jo større sekvens antall bokstaver, desto større er verdien av ASCII-kode. Tall og russisk del av tabellen er bygget på samme prinsipp.

Men i verden er det flere typer koding for kyrilliske bokstaver. Den vanligste - er KOI-8 (åtte-bits koding som har vært brukt for på 70-tallet i den første ruifitsirovannyh Unix operativsystemet), ISO 8859-5 (utviklet av den internasjonale standardiserings Bureau), CP-1251 (koding tekstdata som brukes i moderne OS Windows), samt to-byte koding av Unicode, som kan brukes til å introdusere 65.536 tegn. Slik en rekke kodinger grunn av det faktum at de ble utviklet til forskjellige tider, for ulike operativsystemer og ulike hensyn. På grunn av dette, har ofte vanskeligheter ved overføring av tekst fra et medium til et annet - fra en mistilpasning som koder for brukeren vil se et sett av forvirrende ikoner. Hvordan kan jeg fikse denne situasjonen? I Word, for eksempel når et dokument åpnes, vises en melding om problemer med tekstdisplay og tilbyr flere alternativer for transkoding.

Dermed koding og behandling av tekstlig informasjon i datamaskinens tarmer - prosessen er vanskelig og tidkrevende organisert. Alle symboler av alle alfabetet er bare en viss sekvens av sifre av binære system, en celle - dette er en byte av informasjon.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 no.birmiss.com. Theme powered by WordPress.