Kaip kompiuterių moksle matuojama abėcėlės galia? Informacijos matavimo problemų sprendimas

17.11.2023

Pamokos tikslas: supažindinti su sąvokomis: „informacijos matavimas“, „abėcėlė“, „abėcėlės galia“, „abėcėlinis požiūris į informacijos matavimą“, išmokyti išmatuoti pranešimų informacijos kiekį, atsižvelgiant į simbolių informacinį svorį.

Pamokos tipas: aiškinamasis ir demonstravimas su praktiniais elementais.

Žvilgsnis: pristatymas „Matavimo informacija“ (1 priedas).

Mokomoji literatūra: vadovėlis „Informatika“. 8 klasė (pagrindinis kursas) I.G. Semakin, „Informatikos“ probleminė knyga-dirbtuvė (1 dalis) I.G.

Reikalavimai žinioms ir įgūdžiams:

Mokiniai turėtų žinoti:

  • kas yra „abėcėlė“, „abėcėlės galia“, „abėcėlinis metodas matuojant informaciją“;
  • kaip išmatuoti informacijos kiekį;
  • kaip nustatomas informacijos bitų matavimo vienetas;
  • Kas yra baitas, kilobaitas, megabaitas, gigabaitas.

Studentai turėtų turėti galimybę:

  • pateikite pranešimų, kuriuose yra 1 bitas informacijos, pavyzdžius;
  • išmatuoti teksto informacijos apimtį;
  • atspindi gautos informacijos kiekį įvairiais vienetais (bitai, baitai, kilobaitai, megabaitai, gigabaitai).

Pamokos planas

  1. Org. momentas – 1 min.
  2. Namų darbų tikrinimas – 2 min.
  3. Nauja medžiaga. Matavimo informacija. Abėcėlinis požiūris – 25 min.
  4. To, kas išmokta, įtvirtinimas – 14 min.
  5. Apibendrinant pamoką. - 2 minutės.
  6. Namų darbai – 1 min.

I. Org. momentas.

II. Namų darbų tikrinimas.

Darbo lapas Nr.1. p. 11 Nr. 2, 5, 8, 11, 19 *.

III. Nauja medžiaga.

1. Įvadas.

Aplinkinio pasaulio pažinimo procesas veda į informacijos kaupimąsi žinių pavidalu.

Kaip sužinoti, ar gavote daug informacijos, ar ne?

Būtina išmatuoti informacijos kiekį. Ir šiandien mes išsiaiškinsime, kaip tai padaryti.

Naujos informacijos gavimas veda prie žinių išplėtimo arba, kitaip sakant, prie žinių neapibrėžtumo mažėjimo.

Jei kuri nors žinutė sumažina mūsų žinių neapibrėžtumą, galime sakyti, kad tokiose žiniose yra informacijos (1 pav.).

2. Kaip galite išmatuoti informacijos kiekį.

Norint išmatuoti įvairius dydžius, naudojami standartiniai matavimo vienetai.

Pavyzdžiui:

  • Atstumas matuojamas milimetrais, centimetrais, decimetrais...
  • Masė matuojama gramais, kilogramais, tonomis...
  • Laikas matuojamas sekundėmis, minutėmis, dienomis, metais...

Todėl norint išmatuoti informaciją, reikia įvesti savo standartinį vienetą.

Yra du informacijos matavimo būdai:

b) Abėcėlinis. Leidžia išmatuoti teksto informacijos apimtį bet kuria kalba (natūralia ar formalia), naudojant šį metodą, informacijos apimtis nesusieta su teksto turiniu, šiuo atveju apimtis priklauso nuo informacijos svorio; personažai.

3. Abėcėlinis požiūris į informacijos matavimą.

Prisiminkime, kas yra abėcėlė?

  • Abėcėlė – tai visas tekste naudojamas raidžių, skyrybos ženklų, skaičių, skliaustų ir kitų simbolių rinkinys.

*Abėcėlė apima tarpą (tarpą tarp žodžių).

Kokia yra abėcėlės galia?

  • Abėcėlės galia yra bendras abėcėlės simbolių skaičius.

Pavyzdžiui: naudojamos rusiškų raidžių ir simbolių abėcėlės galia yra 54:

33 raidės + 10 skaičių + 11 skyrybos ženklų, skliausteliuose, tarpas.

Kompiuteryje naudojama abėcėlė (mašinų kalba) turi mažiausią galią, ji vadinama dvejetaine abėcėle, nes jame yra tik du simboliai „0“, „1“.

Dvejetainės abėcėlės simbolio informacinis svoris laikomas informacijos vienetu ir vadinamas 1 bitu.

Pabandykite nustatyti informacinio pranešimo garsumą:

Mašinų kalba parašyta informacija sveria:

01110 - …bit

010010 – …bit

010 - … bitai

0111111011110 – … bit

Taikant abėcėlinį metodą, manoma, kad kiekvienas teksto simbolis turi informacinį svorį.

Simbolio informacinis svoris priklauso nuo abėcėlės galios.

Didėjant abėcėlės galiai, didėja kiekvieno simbolio informacijos svoris.

Norint išmatuoti informacijos apimtį, reikia nustatyti, kiek kartų informacija, lygi 1 bitui, yra nustatytame informacijos tūryje.

Pavyzdžiui:

1) Paimkime keturženklę abėcėlę (išrasta), (2 pav.).

Visi originalios abėcėlės simboliai gali būti koduojami visomis įmanomomis kombinacijomis, naudojant dvejetainės abėcėlės skaitmenis.

Gaukime kiekvieno abėcėlės simbolio dvejetainį kodą. Norint užkoduoti abėcėlės, kurios kardinalumas yra keturi, simbolius, mums reikia dviejų dvejetainio kodo simbolių.

Todėl kiekvienas keturių simbolių abėcėlės simbolis sveria 2 bitus.

2) Užkoduokite kiekvieną abėcėlės simbolį dvejetainiu kodu, kurio kardinalumas yra 8 (3 pav.).

Išvada. Visą abėcėlę, kurios kardinalumas yra 8, galima užkoduoti mašinine kalba, naudojant tris dvejetainės abėcėlės simbolius (4 pav.).

Kaip manote, koks yra kiekvieno aštuonių simbolių abėcėlės simbolio informacijos kiekis?

Kiekvienas aštuonių simbolių abėcėlės simbolis sveria 3 bitus.

3). Užkoduokite kiekvieną abėcėlės simbolį, kurio kardinalumas yra 16, naudodami dvejetainį kodą.

Ką galima padaryti išvadą?

Šešiolikos simbolių abėcėlė gali būti užkoduota naudojant keturių skaitmenų dvejetainį kodą.

Išspręsti problemą.

Užduotis: Kiek informacijos yra 3 16 simbolių abėcėlės simboliuose?

Kadangi kiekvienas 16 simbolių abėcėlės simbolis gali būti užkoduotas naudojant keturių skaitmenų dvejetainį kodą, kiekvienas originalios abėcėlės simbolis sveria 4 bitus.

Kadangi iš viso buvo naudojami 3 abėcėlės simboliai, kurių talpa 16 simbolių, todėl: 4 bitai 3 = 12 bitų

Atsakymas: informacijos kiekis, parašytas 3 abėcėlės ženklais, kurių talpa yra 16 simbolių, yra lygus 12 bitų.

Užsirašykime abėcėlės galios (N) ir kodo simbolių skaičiaus (b) – dvejetainio kodo bitų talpos – atitikmenų lentelę.

Raskite modelį (5 pav.)!

Kokią išvadą galima padaryti?

Kiekvieno simbolio informacijos svoris, išreikštas bitais (b), ir abėcėlės galia (N) yra susieti pagal formulę: N = 2 b

Abėcėlė, iš kurios kompiuteriu sudaromas tekstas (dokumentas), susideda iš 256 simbolių.

Šioje abėcėlėje yra simbolių: mažųjų ir didžiųjų lotyniškų ir rusiškų raidžių, skaičių, aritmetinių operacijų ženklų, visų rūšių skliaustų, skyrybos ženklų ir kitų simbolių.

Sužinokite, kiek informacijos yra viename abėcėlės ženkle, kurio galia yra 256.

Sprendimas. Iš formulės N = 2 b išeina 256 = 2 8.

Išvada. Tai reiškia, kad kiekvienas abėcėlės simbolis, naudojamas kompiuteryje spausdinant dokumentus, sveria 8 bitų.

Ši reikšmė taip pat buvo paimta kaip informacijos vienetas ir buvo pavadintas baitu.

8 bitai = 1 baitas

Užduotis. Straipsnį sudaro 30 puslapių, kiekviename puslapyje yra 40 eilučių, kiekvienoje eilutėje yra 50 simbolių. Kiek informacijos yra straipsnyje?

Sprendimo eiga.

1) Kiekviename puslapyje yra 50 40 = 2000 simbolių;

2) visame straipsnyje 2000 30 = 60 000 ženklų;

3) nes kiekvieno simbolio svoris yra 1 baitas, todėl viso straipsnio informacijos apimtis yra 60000 1 = 60000 baitų arba 60000 8 = 480000 bitų.

Kaip matyti iš problemos, baitas yra „mažas“ teksto informacijos apimties matavimo vienetas, todėl dideliems informacijos kiekiams matuoti naudojami didesni vienetai.

Informacijos apimties matavimo vienetai:

1 kilobaitas = 1 KB = 210 baitų = 1024 baitai

1 megabaitas = 1 MB = 210 KB = 1024 KB

1 gigabaitas = 1 GB = 210 MB = 1024 MB

Pabandykite konvertuoti problemos rezultatą į didesnius matavimo vienetus:

    60 000 baitų 58,59375 KB

    60 000 baitų 0,057 MB

IV. To, kas išmokta, įtvirtinimas.

Probleminė knyga Nr. 1. P. 19 Nr. 19, 20, 22, 23, 25.

V. Apibendrinant.

VI. Namų darbai.

Darbo lapas Nr.1. p. 20 Nr. 21, 24, 26.


Abėcėlinis požiūris į informacijos matavimą

Taikant abėcėlinį požiūrį į informacijos kiekio nustatymą atitrauktas nuo turinio informaciją ir laikyti informacinį pranešimą kaip simbolių seka tam tikra ženklų sistema.

Viskas paruošta vartojamas kalboje personažai tradiciškai skambinsime abėcėlė .

Paprastai vadinamas bendras abėcėlės simbolių skaičius abėcėlės galia .

Šį kiekį pažymėsime raide N .


RUSŲ ALABETĖS GALIA:

  • 33 raidės
  • 10 skaitmenų
  • 11 skyrybos ženklų
  • skliausteliuose
  • erdvė

Informacinis simbolio svoris

Simbolio informacinis svoris priklauso nuo abėcėlės galios.

simbolio informacinis svoris - informacijos kiekis, kurį neša vienas simbolis.

Mažiausias simbolių skaičius abėcėlėje: 2 (0 ir 1) – dvejetainė abėcėlė.

Dvejetainės abėcėlės simbolio informacinis svoris imamas informacijos vienetu ir vadinamas 1 BIT.


Didėjant abėcėlės galiai, didėja šios abėcėlės simbolių informacinis svoris. Taigi vienas simbolis iš keturių ženklų abėcėlės (N = 4) "sveria" 2 bitus.

Naudodami tris dvejetainius skaitmenis galite sukurti 8 skirtingus derinius

Todėl, jei abėcėlės galia yra 8, tai vieno simbolio informacijos svoris yra 3 bitai.

Simbolio eilės numeris

Dviejų skaitmenų dvejetainis kodas

Simbolio eilės numeris

Trijų skaitmenų dvejetainis kodas


Kiekvienas 16 simbolių abėcėlės simbolis gali būti užkoduotas keturių skaitmenų dvejetainiu kodu. Ir taip toliau.

Raskime ryšį tarp abėcėlės galios (N) ir simbolių skaičiaus kode (b) – dvejetainio kodo bitų talpos.

Atkreipkite dėmesį, kad 2 = 2 1, 4 = 2 2, 8 = 2 3, 16 = 2 4.

Apskritai tai parašyta taip: N=2 b


Lentelė abėcėlės galios priklausomybė nuo simbolio informacinio svorio

Informacinis simbolio svoris

Abėcėlės simboliai

Abėcėlės galia

00000000… …11111111


Dvejetainio kodo bitų gylis yra simbolio informacijos svoris.

Kiekvieno simbolio informacijos svoris, išreikštas bitais ( b), ir abėcėlės galia ( N) yra susiję vienas su kitu pagal formulę: N=2 b

Abėcėlę, iš kurios sudarytas „kompiuterinis tekstas“, sudaro 256 simboliai. Tokio dydžio abėcėlėje telpa beveik visi reikalingi simboliai.


Kadangi 256 = 2 8, tada vienas kompiuterio abėcėlės simbolis „sveria“ 8 informacijos bitus - tai tokia būdinga reikšmė, kad jai netgi buvo suteiktas savas pavadinimas - baitas.

1 baitas = 8 bitai

Lengva apskaičiuoti teksto informacijos apimtį, jei žinoma, kad vieno simbolio informacijos svoris yra 1 baitas. Jums tereikia suskaičiuoti teksto simbolių skaičių. Gauta reikšmė bus teksto informacijos apimtis, išreikšta baitais.


, :, ;, #, &) b = 8 bitai = 1 baitas N = 256 = 2 8 N = 2 b 1 baitas yra vieno kompiuterio abėcėlės simbolio informacijos svoris = = = 1024 baitai 2 10 baitai 1 KB 1 kilobaitas 1 MB 1 megabaitas 2 10 KB 1024 KB = = = 1024 MB 2 10 MB 1 gigabaitas 1 GB = = = 10" width="640"

INFORMACIJOS MATAVIMO VIENETAI

KOMPIUTERIO SIMBOLIŲ ABĖCĖLĖ

  • Rusiškos (RUSIŠKOS) raidės
  • lotynų ( LAT ) raidės
  • skaičiai (1, 2, 3, 4, 5, 6, 7, 8, 9, 0)
  • matematiniai ženklai (+, -, *, / , ^, =)
  • kiti simboliai ("", Nr., %, , , :, ;, #, &)

b = 8 šiek tiek = 1 baitas

N = 256 = 2 8

N=2 b

1 baitas yra vieno kompiuterio abėcėlės simbolio informacijos svoris

1024 baitų

1 kilobaitas

1 megabaitas

1024 KB

1024 MB

1 gigabaitas


1 MB (megabaitas) = ​​1024 KB (2 10 KB arba 2 20 baitų)

1 GB (gigabaitas) = ​​1024 MB (2 10 MB arba 2 30 baitų)

1 TB (terabaitas) = ​​1 024 GB (2 10 GB arba 2 40 baitų)

Tačiau artimiausiu metu mūsų laukia šie padaliniai:

1PB (petabaitas) = ​​1024 TB (2 10 TB arba 2 50 baitų)

1 EB baitas (eksabaitas) = ​​1024 PB (2 10 PB arba 2 60 baitų)

1 Zbaitas (zetabaitas) – 1024 EBaitai (2 10 EB arba 2 70 baitų)

1 (yottabaitas) – 1024 Zbaitai (2 10 Zbaitų arba 2 80 baitų)


INFORMACIJA TEKSTO TOMAS

UŽDUOTIS

Knygoje, parengtoje kompiuteriu, yra 150 puslapių. Kiekviename puslapyje yra 40 eilučių, kiekvienoje eilutėje yra 60 simbolių (įskaitant tarpus tarp žodžių). Kiek informacijos yra knygoje?

SPRENDIMAS

Kompiuterio abėcėlės galia yra 256, taigi vienas simbolis neša 1 baitą informacijos. Tai reiškia, kad knygos puslapyje yra 40 60 = 2400 baitų informacijos.

[simbolių skaičius eilutėje] [eilučių skaičius] = [puslapio informacijos apimtis]

Visos knygoje esančios informacijos apimtis (skirtingais vienetais):

[puslapio informacijos apimtis] [puslapių skaičius] = [knygos informacijos apimtis]

2400 150 = 360 000 baitų / 1024 = 351,5625 KB / 1024 = 0,34332275 MB


1 problema

Pranešimas parašytas raidėmis iš 128 simbolių abėcėlės ir yra 30 simbolių. Kiek informacijos joje yra?

N = 2 b

b = 7 bitai (vieno simbolio svoris).

Todėl žinutėje yra 30 simbolių

7 × 30 = 210 bitų


2 problema

Kiek baitų yra pranešime, kuriame yra 1000 bitų?

1 baitas = 8 bitai

1000: 8 = 125 baitai


Užduotis 3

5 KB informaciniame pranešime yra 8192 simboliai. Kiek simbolių yra abėcėlėje, kuria buvo parašytas šis pranešimas?

SPRENDIMAS

N = 2 b

5 KB = 5120 baitų = 40960 bitų

Todėl žinutėje yra 8192 simboliai

b = 40960: 8192 = 5 bitai (vieno simbolio svoris).


Užduotis 4

Kompiuteriu atspausdintas tekstas užima penkis puslapius. Kiekviename puslapyje yra 30 eilučių po 70 simbolių. Kiek RAM užima šis tekstas? Ar tekstas tilps į kompaktinį diską?

Atsakymas

30 × 70 = 2100 simbolių

2100 × 8 = 16800 baitų

16800: 1024 = 16,40625 KB


Užduotis 5

Kiek informacijos yra 10 simbolių žinutėje, parašytame 32 simbolių abėcėlės raidėmis?

N = 2 b

SPRENDIMAS

Informacijos kiekis

= 10*5 = 50 bitų


Užduotis 6

Norint išsaugoti tekstą, reikia 84 000 bitų. Kiek puslapių užims šis tekstas, jei puslapyje yra 30 eilučių po 70 simbolių?

SPRENDIMAS

1 baitas = 8 bitai.

84000/8=10500 simbolių tekste.

Puslapyje yra

30×70=2100 simbolių.

5 puslapiai.

5 puslapiai.

ATSAKYMAS:


Užduotis 7

Čičevokų genties abėcėlėje yra 24 raidės ir 8 skaičiai. Nėra skyrybos ženklų ar aritmetinių ženklų. Koks yra minimalus dvejetainių skaitmenų skaičius, kurio jiems reikia norint užkoduoti visus simbolius?

N = 2 b

SPRENDIMAS

ATSAKYMAS:

5 bitai


Pirmąją raidę sudaro 50 32 simbolių abėcėlės simbolių, o antrąją raidę sudaro 40 64 simbolių abėcėlės simbolių.

Palyginkite pateiktos informacijos kiekį

dviem raidėmis.

Užduotis 8

Nustatykime kiekvienos raidės vieno simbolio informacijos talpą:

SPRENDIMAS

2 b = 32, b = 5 bitai – pirmajai raidei, 2 b = 64, b = 6 bitai – antrajai raidei

Nustatykime informacijos kiekį kiekvienoje raidėje:

50*5 = 250 bitų – pirmajai raidei,

40*6 = 240 bitų – antrajai raidei.

Raskime skirtumą tarp dviejų raidžių informacijos tūrių. 250–240 = 10 bitų.

Prisiminkime, kad subjektyvaus požiūrio į informacijos apibrėžimą požiūriu informacija yra pranešimų, kuriuos žmogus gauna iš įvairių šaltinių, turinys. Ta pati žinutė vienam žmogui gali nešti daug informacijos, o kitam jos visai nenešti. Taikant šį metodą, sunku vienareikšmiškai nustatyti informacijos kiekį.

Abėcėlinis metodas leidžia išmatuoti tam tikra kalba (natūralia ar formalia) pateikto pranešimo informacijos apimtį, neatsižvelgiant į jos turinį.

Norint kiekybiškai išreikšti bet kokį dydį, pirmiausia reikia matavimo vieneto. Matavimas atliekamas lyginant išmatuotą vertę su matavimo vienetu. Kiek kartų matavimo vienetas „telpa“ į išmatuotą vertę, yra matavimo rezultatas.

Taikant abėcėlinį metodą, manoma, kad kiekvienas tam tikro pranešimo simbolis turi tam tikrą informacijos svorį – jis neša fiksuotą informacijos kiekį. Visi tos pačios abėcėlės simboliai turi vienodą svorį, priklausomai nuo abėcėlės galios. Dvejetainės abėcėlės simbolio informacinis svoris laikomas minimaliu informacijos vienetu ir vadinamas 1 bitu. Atkreipkite dėmesį, kad informacijos vieneto pavadinimas „bitas“ kilęs iš angliškos frazės „binary digit“.

1.4.2. Savavališkos abėcėlės simbolio informacijos svoris

Anksčiau išsiaiškinome, kad bet kurios natūralios ar formalios kalbos abėcėlę galima pakeisti dvejetaine abėcėle. Šiuo atveju pradinės abėcėlės galia N yra susijusi su dvejetainio kodo i bitų talpa, reikalinga visiems pradinės abėcėlės simboliams užkoduoti, santykis: N = 2 i.

1 problema. Pulti abėcėlę sudaro 8 simboliai. Koks yra šios abėcėlės simbolio informacinis svoris?

Sprendimas. Trumpai apibūdinkime problemos sąlygas.

Ryšys tarp dydžių i ir N žinomas: N = 2 i.

Atsižvelgiant į pradinius duomenis: 8 = 2 i. Taigi: i = 3.

Visas sprendimas užrašų knygelėje gali atrodyti taip:

Atsakymas: 3 bitai

1.4.3. Pranešimo informacijos apimtis

Pranešimo informacijos kiekis (informacijos kiekis pranešime), vaizduojamas natūralios arba formalios kalbos simboliais, susideda iš jį sudarančių simbolių informacinių svorių.

2 problema. Pranešime, parašytame 32 simbolių abėcėlėmis, yra 140 simbolių. Kiek informacijos joje yra?

Sprendimas.

Atsakymas": 700 bitų.

3 problema. 720 bitų apimties informacinis pranešimas susideda iš 180 simbolių. Kokia yra abėcėlės, kuria parašyta ši žinia, galia?

Sprendimas.

Atsakymas: 16 simbolių.

1.4.4. Informacijos vienetai

Šiais laikais tekstas daugiausia ruošiamas kompiuteriu. Galime kalbėti apie „kompiuterinę abėcėlę“, kurią sudaro šie simboliai: mažosios ir didžiosios rusiškos ir lotyniškos raidės, skaičiai, skyrybos ženklai, aritmetinių operacijų ženklai, skliausteliuose ir kt. Šioje abėcėlėje yra 256 simboliai. Kadangi 256 = 2 8 , kiekvieno šios abėcėlės simbolio informacijos svoris yra 8 bitai. Reikšmė, lygi aštuoniems bitams, vadinama baitu. 1 baitas yra 256 talpos abėcėlės simbolio informacinis svoris.

4 problema. 4 KB informacinį pranešimą sudaro 4096 simboliai. Koks šio pranešimo simbolio informacinis svoris? Kiek simbolių yra abėcėlėje, su kuria parašytas šis pranešimas? Sprendimas.

Atsakymas: 256 simboliai.

Svarbiausias

Taikant abėcėlinį metodą, manoma, kad kiekvienas tam tikro pranešimo simbolis turi tam tikrą informacijos svorį – jis neša fiksuotą informacijos kiekį.

1 bitas yra mažiausias informacijos vienetas.

Abėcėlės simbolio informacinis svoris i ir abėcėlės galia N yra tarpusavyje susiję ryšiu: N = 2 i . Pranešimo informacinis tūris I lygus žinutėje esančių simbolių skaičiaus K sandaugai su abėcėlės i simbolio informaciniu svoriu: I = K i.

1 baitas = 8 bitai.

Baitas, kilobaitas, megabaitas, gigabaitas, terabaitas yra informacijos matavimo vienetai. Kiekvienas paskesnis vienetas yra 1024 (2 10) kartų didesnis nei ankstesnis.

Klausimai ir užduotys


Ir daugelis kitų sąvokų turi labai tiesioginių sąsajų viena su kita. Labai mažai vartotojų šiandien gerai išmano šias problemas. Pabandykime išsiaiškinti, kokia yra abėcėlės galia, kaip ją apskaičiuoti ir pritaikyti praktikoje. Ateityje tai, be jokios abejonės, gali būti naudinga praktikoje.

Kaip matuojama informacija

Prieš pradėdami nagrinėti klausimą, kokia yra abėcėlės galia ir kas ji apskritai yra, turėtume pradėti, taip sakant, nuo pagrindų.

Tikrai visi žino, kad šiandien yra specialių sistemų, skirtų bet kokiems dydžiams matuoti, remiantis pamatinėmis vertėmis. Pavyzdžiui, atstumams ir panašiems dydžiams tai yra metrai, masei ir svoriui - kilogramai, laiko intervalams - sekundės ir kt.

Bet kaip išmatuoti informaciją teksto apimtimi? Būtent todėl buvo įvesta abėcėlės galios sąvoka.

Kokia yra abėcėlės galia: pradinė sąvoka

Taigi, jei vadovausimės visuotinai priimta taisykle, kad galutinė bet kokio dydžio reikšmė yra parametras, nustatantis, kiek kartų pamatinis vienetas yra išmatuotame dyde, galime daryti išvadą: abėcėlės galia yra bendras naudojamų simbolių skaičius. tam tikrai kalbai.

Kad būtų aiškiau, kol kas palikime nuošalyje klausimą, kaip rasti abėcėlės galią, ir atkreipkite dėmesį į pačius simbolius, žinoma, informacinių technologijų požiūriu. Grubiai tariant, pilname naudojamų simbolių sąraše yra raidžių, skaičių, visokių skliaustų, specialiųjų simbolių, skyrybos ženklų ir kt. Tačiau jei prie klausimo, kokia yra abėcėlės galia, priartėtume kompiuteriniu būdu, turėtume įtraukti ir tarpą (vieną tarpą tarp žodžių ar kitų simbolių).

Paimkime kaip pavyzdį rusų kalbą, tiksliau, klaviatūros išdėstymą. Remiantis tuo, kas išdėstyta aukščiau, visą sąrašą sudaro 33 raidės, 10 skaičių ir 11 specialiųjų simbolių. Taigi bendra abėcėlės galia yra 54.

Informacinis simbolių svoris

Tačiau bendra abėcėlės galios samprata neapibrėžia teksto, kuriame yra raidžių, skaičių ir simbolių, informacijos apimties skaičiavimo esmės. Tam reikia specialaus požiūrio.

Iš esmės, pagalvokite, koks galėtų būti minimalus rinkinys kompiuterinės sistemos požiūriu, kiek simbolių jame gali būti? Atsakymas: du. Ir todėl. Faktas yra tas, kad kiekvienas simbolis, nesvarbu, ar tai būtų raidė, ar skaičius, turi savo informacijos svorį, pagal kurį aparatas atpažįsta, kas tiksliai yra priešais jį. Tačiau kompiuteris supranta tik vaizdavimą vienetų ir nulių pavidalu, kuriuo iš tikrųjų remiasi visas kompiuterių mokslas.

Taigi, bet kuris simbolis gali būti pavaizduotas kaip sekos, kuriose yra skaičiai 1 ir 0, tai yra, mažiausia raidė, skaičius ar simbolis žymi seka susideda iš dviejų komponentų.

Pats informacijos svoris, imamas kaip standartinis informacijos matavimo vienetas, vadinamas bitu (1 bitu). Atitinkamai, 8 bitai sudaro 1 baitą.

Simbolių vaizdavimas dvejetainiame kode

Taigi, kokia yra abėcėlės galia, manau, jau šiek tiek aišku. Dabar pažvelkime į kitą aspektą, ypač į praktinį galios vaizdavimą naudojant Kaip pavyzdį, kad būtų paprasčiau, paimkime abėcėlę, kurią sudaro tik 4 simboliai.

Dviejų skaitmenų dvejetainiame kode seką ir jų informacijos pateikimą galima apibūdinti taip:

Serijos numeris

Dvejetainis kodas

Taigi paprasčiausia išvada: esant abėcėlės galiai N=4, vieno simbolio svoris yra 2 bitai.

Jei naudosime trijų skaitmenų dvejetainį kodą abėcėlei su, pavyzdžiui, 8 simboliais, derinių skaičius bus toks:

Serijos numeris

Dvejetainis kodas

Kitaip tariant, esant abėcėlės galiai N=8, vieno triženklio dvejetainio kodo simbolio svoris bus lygus 3 bitams.

abėcėlę ir naudokite ją kompiuterinėje išraiškoje

Dabar pabandykime pažvelgti į ryšį, išreikštą simbolių skaičiumi kode ir abėcėlės galia. Formulė, kurioje N yra abėcėlės galia, o b yra dvejetainio kodo simbolių skaičius, atrodys taip:

Tai yra, 2 1 = 2, 2 2 = 4, 2 3 = 8, 2 4 = 16 ir tt. Grubiai tariant, reikiamas paties dvejetainio kodo simbolių skaičius yra simbolio svoris. Informacine prasme tai atrodo taip:

Informacijos apimties matavimas

Tačiau tai tebuvo paprasčiausi pavyzdžiai, taip sakant, pirminiam supratimui, kokia yra abėcėlės galia. Pereikime prie praktikos.

Šiame teksto įvedimo kompiuterinės technologijos vystymosi etape, atsižvelgiant į didžiąsias raides, didžiąsias ir kirilicos bei lotyniškas raides, skyrybos ženklus, skliaustus, aritmetinius simbolius ir kt. Naudojami 256 simboliai. Remiantis tuo, kad 256 yra 2 8, nesunku atspėti, kad kiekvieno simbolio svoris tokioje abėcėlėje yra 8, tai yra 8 bitai arba 1 baitas.

Remdamiesi visais žinomais parametrais, galime nesunkiai gauti norimą bet kokio teksto informacijos kiekį. Pavyzdžiui, mes turime 30 puslapių kompiuterinį tekstą. Viename puslapyje yra 50 eilučių po 60 bet kokių simbolių ar simbolių, įskaitant tarpus.

Taigi viename puslapyje bus 50 x 60 = 3000 baitų informacijos, o visame tekste bus 3000 x 50 = 150 000 baitų. Kaip matote, net mažus tekstus matuoti baitais nepatogu. O kaip su ištisomis bibliotekomis?

Tokiu atveju geriau konvertuoti garsumą į galingesnius vienetus - kilobaitus, megabaitus, gigabaitus ir kt. Remiantis tuo, kad, pavyzdžiui, 1 kilobaitas yra lygus 1024 baitams (2 10), o megabaitas yra 2 10 kilobaitų (1024 kilobaitai), nesunku apskaičiuoti, kad teksto apimtis informacijoje ir matematinė išraiška mūsų pavyzdys bus 150000/1024 = 146, 484375 kilobaitai arba apytiksliai 0,14305 megabaitai.

Vietoj pokalbio

Apskritai, tai trumpai viskas, kas susiję su klausimo, kokia yra abėcėlės galia, svarstymui. Belieka pridurti, kad šiame aprašyme buvo naudojamas grynai matematinis metodas. Savaime suprantama, kad šiuo atveju į semantinę teksto apkrovą neatsižvelgiama.

Bet jei svarstysime klausimus būtent iš pozicijos, kuri suteikia žmogui ką nors suprasti, beprasmių simbolių derinių ar sekų rinkinys šiuo atžvilgiu turės nulinį informacijos krūvį, nors informacijos sampratos požiūriu. tūrio, rezultatą dar galima apskaičiuoti.

Apskritai žinios apie abėcėlės galią ir susijusias sąvokas nėra taip sunkiai suprantamos ir gali būti tiesiog pritaikytos praktinių veiksmų prasme. Be to, bet kuris vartotojas su tuo susiduria beveik kiekvieną dieną. Pakanka pateikti populiaraus Word redaktoriaus ar bet kurio kito tokio pat lygio redaktoriaus, kuris naudoja tokią sistemą, pavyzdį. Tačiau nepainiokite to su įprastu užrašų knygele. Čia abėcėlės galia mažesnė, nes rašant nenaudojamos, tarkime, didžiosios raidės.

Yra keletas būdų, kaip išmatuoti informacijos kiekį. Vienas iš jų vadinamas abėcėlės tvarka.

Abėcėlinis požiūris leidžia išmatuoti informacijos kiekį tekste (simboliniame pranešime), sudarytame iš tam tikros abėcėlės simbolių.

Abėcėlė yra raidžių, ženklų, skaičių, skliaustų ir kt.
Simbolių skaičius abėcėlėje vadinamas jo galia.

Taikant abėcėlinį metodą, manoma, kad kiekvienas teksto veikėjas turi specifinį informacijos svoris. Simbolio informacinis svoris priklauso nuo abėcėlės galios.

Kokia yra mažiausia abėcėlės galia, kuria galima įrašyti (koduoti) informaciją?



Pavadinkime 2, 3 ir tt derinį. šiek tiek dvejetainis kodas.

Kiek simbolių galima užkoduoti dviem bitais?

Simbolio eilės numeris

1

2

3

4

Dviejų skaitmenų dvejetainis kodas

00

01

10

11

4 simboliai 2 bitai.

Kiek simbolių galima užkoduoti trimis bitais?

Simbolio eilės numeris

1

2

3

4

5

6

7

8

Trijų skaitmenų dvejetainis kodas

000

001

010

011

100

101

110

111


Iš to seka, kad abėcėlėje su kardinalumu 8 simboliai kiekvieno simbolio informacijos svoris - 3 bitai.

Galime daryti išvadą, kad abėcėlėje su talpa 16 simbolių kiekvieno simbolio informacinis svoris bus 4 bitai.

Abėcėlės galią pažymėkime raide N, o simbolio informacinis svoris yra raidė b.

Santykis tarp abėcėlės galios N ir simbolio informacinis svoris b.

N

2

4

8

16

b

1 bitas