Fayl Entropiyası Nədir

Fayl Entropiyası Nədir
Fayl Entropiyası Nədir

Video: Fayl Entropiyası Nədir

Video: Fayl Entropiyası Nədir
Video: Dərs 12. Əməliyyat sistemləri, fayl anlayışı 2024, Noyabr
Anonim

Hər hansı bir kompüter faylı baytdan ibarətdir. Bir bayt 0-dan 255-ə qədər dəyər ala bilər. Məlumat entropiyası bir sənəddə müəyyən baytların meydana çıxma ehtimalını göstərən statistik parametrdir.

Fayl entropiyası nədir
Fayl entropiyası nədir

Bir histoqramdan istifadə edərək entropiyanın dərəcəsini vizual olaraq qiymətləndirə bilərsiniz - eyni baytların bir faylda təkrarlanması ehtimalının paylanması. Fayl entropiyasından yalnız histoqramını görərək qarşımızda hansı növ fayl olduğunu təxmin edə bilərik.

Nümayiş üçün müxtəlif tipli üç sənəd götürək və histoqramlarını müqayisə edək. Birincisi mətn faylı olsun (*. TXT). Onun histoqramı şəkildə göstərilir:

гистограмма=
гистограмма=

Mətn faylı yalnız mətn ehtiva edir. Mətnin hər bir simvolu kodlaşdırma cədvəlinə uyğun olaraq müəyyən baytlarla kodlanır. Çox sayda kodlama növü olmasına baxmayaraq, adətən 255-dən az olan məhdud sayda alfasayısal simvol olduğu açıq-aşkar görünür. Buna görə ilk histoqramda yalnız bəzi sahələr işğal olunur və bəzi baytlar ümumiyyətlə deyil.

Aşağıdakı sənəd PDF formatında olacaq:

гистограмма=
гистограмма=

PDF mətn sənədlərindən fərqli olaraq kodlandığı üçün bu fayl bütün mümkün baytları ehtiva edir. Bir çox xidmət məlumatını saxlayır: formatlaşdırma, şriftlər, şəkillər və s. Lakin onun histoqramı göstərir ki, baytların bir hissəsi təqribən bərabər ehtimalla, digərləri isə digərlərindən daha çox olur. Beləliklə, histoqramdakı çoxsaylı kəskin partlayışlar və ümumiyyətlə mövcud genişliyi tutmasına baxmayaraq, kifayət qədər "cırıq" bir görünüşə sahibdir.

Və son fayl 7Z formatında sıxılır:

гистограмма=
гистограмма=

Bu histoqramın iki əsas xüsusiyyəti var: birincisi, bütün baytlar az və ya çox bərabər ehtimalla (kifayət qədər düz üst kənar) sıxılmış faylda tapılır və ikincisi, histoqramın üzərində demək olar ki, tam bir yoxluğu göstərən boş yer yoxdur çoxluq belə bir sənəd. Buradan belə nəticəyə gəlmək olar ki, arxivverənin alqoritmi xüsusi bir şəkildə fayl baytlarını maksimum vahid paylanmasına nail olmaq üçün “qarışdırır”.

Beləliklə, fizikada olduğu kimi kompüter elmindəki entropiya sistemdəki pozğunluğun bir ölçüsüdür, bu halda baytın fayldakı paylanmasında pozğunluqdur. Entropiya, faylın sıxılma dərəcəsini və dolayı yolla - növü barədə mühakimə etməyə imkan verir.

Tövsiyə: