Datamaskiner, Programmering
ASCII-kode (amerikansk standard kode for informasjonsutveksling) - den grunnleggende tekstkoding for det latinske alfabetet
Ifølge International Telecommunication Union, i 2016 Internett med mer eller mindre regelmessig bruke tre og en halv milliard mennesker. De fleste av dem ikke engang tenke på at alle meldinger som sendes til dem via en PC eller mobile dingser, samt tekster som vises på monitorene av alle slag, faktisk, er en kombinasjon av 0 og 1. Dette kalles den kodede representasjon av informasjonen. Det gir og letter gjennomføringen av dens lagring, behandling og overføring. I 1963 har den amerikanske ASCII-kode blitt utviklet, som er gjenstand for denne artikkelen.
Presentasjon av informasjon i datamaskinen
I forhold til alle elektroniske datamaskin teksten er en samling av individuelle tegn. Blant dem er ikke bare brevet, inkludert hovedstaden, men også skilletegn, tall. I tillegg er spesielle symboler brukt "=", "&", "(" og mellomrom.
Et flertall av symboler som utgjør teksten, kalt alfabetet, og nummeret - strøm (betegnet som N). For å bestemme uttrykket N = 2 ^ b, hvor b - antallet informasjonsbiter, eller et bestemt symbol vekt.
Det viste seg at kraften i 256 tegn alfabetet kan du sende inn alle de nødvendige tegn.
Siden 256 er en 8-grad to, da vekten av hvert tegn er 8 biter.
Måleenhet 8 biter kalles en 1-byte, så vi sier at binærkoden til alle tegn i teksten som er lagret på datamaskinen, inntar en byte minne.
Hvordan er kodingen
All tekst skrevet inn i PC-minnet gjennom tastaturet, på det som var skrevet tall, bokstaver, skilletegn og andre symboler. Til minne blir de overført i binær, dvs. at hvert symbol kartlagt til det kjente desimal koden for en person fra 0 til 255, noe som tilsvarer en binær kode - .. Fra 00000000-11111111.
Byte tegnkoding gjør det mulig for prosessoren utfører prosessering av teksten, refererer til hvert tegn separat. Samtidig, er nok til å representere noen tegn informasjon de 256 tegn.
Koding ASCII-tegn
Denne forkortelsen står for det engelske amerikansk standard kode for informasjonsutveksling.
Selv ved daggry av databehandling, ble det klart at det er mulig å komme opp med en rekke måter å kode informasjon. Men for å overføre informasjon fra en datamaskin til en annen var nødvendig for å utvikle en enkel standard. Så, i 1963 var det en ASCII-tabellen i USA. Det alle tegn datamaskin alfabetet er tildelt et sekvensnummer i den binære representasjon. I utgangspunktet er ASCII-koden brukes kun i USA, og senere ble en internasjonal standard for PC.
innholdsfortegnelsen
ASCII-koder er delt i 2 deler. Internasjonal standard er ansett å være bare første halvdel av tabellen. Det omfatter kode fra sekvensnummeret til 0 (som kodet 00000000) til 127 (kode 01111111).
serienummer N | Koding ASCII tekst | symbol |
0-31 | 0000 0000 - 0001 1111 | Tegn med N fra 0-31 kalles ledere. Deres funksjon er å "guide" prosessen med tekst utgang til en monitor eller utskriftsenhet, en pipelyd, etc. |
32-127 | 0010 0000 - 0111 1111 | Symboler med N 32-127 (en standard del av tabellen) - store og små bokstaver i det latinske alfabet, den 10-Nye tall, skilletegn og forskjellige braketter, kommersielle og andre tegn .. Symbol 32 indikerer en plass. |
128-255 | 1000 0000 - 1111 1111 | Symboler med N 128-255 (en annen del av bordet eller kodesiden) kan ha en rekke alternativer, som hver har sitt eget nummer. Koden siden brukes til å sette nasjonale alfabeter, som er forskjellig fra det latinske. Spesielt er det foretatt ved hjelp av ASCII-koden for de russiske tegn. |
Tabell koding store og små bokstaver som følger hverandre i alfabetisk rekkefølge og tall - stigende verdier. Dette prinsippet gjelder for det russiske alfabetet.
kontrolltegn
ASCII-koding tabell ble opprinnelig utformet for mottak og overføring av informasjon om dette ikke lenger benyttes ved innretningen som en fjernskriver. I denne forbindelse, den tegnsettet som ikke skrives anvendt som kommandoer for å styre enheten. Slike kommandoer benyttet i slike pre-datameldinger teknikker som Morse-kode, og så videre.
Den mest vanlige "fjernskriver" -symbolet er det NUL (00 "null"). Han er fortsatt i bruk i de fleste programmeringsspråk, som viser tegn på slutten av linjen.
Der anvendes ASCII-koding
American Standard Kode krever ikke bare tekstinntasting tastaturet. Det er også brukt i diagrammet. Spesielt ASCII kunst Maker program bildene representerer forskjellige utvidelser spektrum ASCII tegnkoding.
Disse produktene kommer i to typer: grafiske redaktører utfører funksjonen ved å konvertere et bilde til tekst og konverterer "Pictures" i ASCII-grafikk. For eksempel kjent er et godt eksempel Smiley Coding symbol.
ASCII kan brukes når du oppretter dokumentet HTML. I dette tilfellet, kan du skrive inn et sett med tegn og et symbol som tilsvarer denne koden vises når du ser på siden på skjermen.
ASCII er nødvendig for å lage flerspråklige nettsteder, som tegn som ikke tilhører en bestemt nasjonal bord, erstattet av ASCII-koder.
noen funksjoner
Å kode tekstinformasjon i ASCII ble opprinnelig brukt 7 biter (en forble tom), men i dag jobber hun som en 8-bit.
Bokstavene, som er plassert i søylene er over og under, skiller seg fra hverandre bare ved en enkelt bit. Dette reduserer kompleksiteten av testen.
ASCII-programmet i Microsoft Office
Om nødvendig kan denne type koding tekstinformasjon brukes i tekst redaktører av Microsoft, for eksempel Notisblokk, og Office Word. Men når du skriver i dette tilfellet, kan du ikke bruke enkelte funksjoner. For eksempel, vil du ikke være i stand til å utføre dristige som ASCII beholder bare betydningen av informasjon, ignorerer sin generelle form og form.
standardisering
Organisasjonen vedtatt ISO-standarden ISO 8859. Denne gruppen definerer åtte-bit koding for ulike språkgrupper. Spesielt ISO 8859-1 - er utvidet ASCII, som er en tabell for USA og Vest-Europa. En ISO 8859-5 - er tabellen som brukes for det kyrilliske alfabetet, inkludert det russiske språket.
Av historiske grunner til ISO 8859-5 er det brukt for en kort tid.
For det russiske språket i øyeblikket faktisk brukes koding:
- CP866 (kodesett 866), eller DOS, som ofte kalles alternativ koding GOST. Det ble aktivt brukt frem til midten av 90-tallet av forrige århundre. For øyeblikket nesten aldri brukt.
- KOI-8. Koding ble utviklet i 1970-80-tallet, og i øyeblikket er det en felles standard for e-postmeldinger i RuNet. Det er mye brukt i OS familien Unix, inkludert Linux. "Russian" versjon av KOI-8, heter KOI-8R. I tillegg finnes det versjoner for andre kyrilliske språk som ukrainsk.
- Kode Page 1251 (CP 1251, Windows - 1251). Utviklet av Microsoft for å gi støtte for det russiske språket i Windows-miljøet.
Den største fordelen med CP866 første standard var å bevare pseudo-grafisk tegn i samme posisjoner som i den utvidede ASCII. Dette lar deg kjøre uendret tekst av programmet, utenlandsk produksjon, slik som den berømte Norton Commander. På dette punktet CP866 brukes for programmer som er laget for Windows, som opererer i fullskjermtekstvisning eller i tekstbokser, blant annet i FAR Manager.
Data tekster skrevet i CP866 koding, det siste er ganske sjeldne, men det brukes mot russiske filnavn i "Vindous".
"Unicode"
For øyeblikket er den mest utbredte denne kodingen. Codes "Unicode" på feltet. Den første (fra 0000 til U + U + 007F) omfatter et sett av ASCII-tegn med koder. Etterfulgt av felttegn av ulik nasjonal litteratur, samt tegnsetting og tekniske symboler. I tillegg er en del av koden "Unicode" reservert i tilfelle behovet for å inkludere nye karakterer i fremtiden.
Nå vet du at i ASCII hvert tegn representeres som en kombinasjon av 8 nuller og enere. Lekmann, kan denne informasjonen virke unødvendig og uinteressant, men du ønsker ikke å vite hva som skjer "i hjernen" i datamaskinen?!
Similar articles
Trending Now