যে কোনও কম্পিউটার ফাইল বাইট নিয়ে গঠিত। একটি বাইট 0 থেকে 255 পর্যন্ত মান নিতে পারে Information
আপনি হিস্টোগ্রাম ব্যবহার করে এন্ট্রপির ডিগ্রিটি দৃশ্যত মূল্যায়ন করতে পারেন - কোনও ফাইলে একই বাইটগুলি পুনরাবৃত্তি করার সম্ভাবনার বন্টন। ফাইলটির এন্ট্রপি থেকে, আমরা অনুমান করতে পারি যে কোন ধরণের ফাইলটি আমাদের সামনে রয়েছে কেবল তার হিস্টোগ্রাম দেখে seeing
প্রদর্শনের জন্য, আসুন বিভিন্ন ধরণের তিনটি ফাইল নেওয়া যাক এবং তাদের হিস্টোগ্রামগুলি তুলনা করুন। প্রথমটি একটি পাঠ্য ফাইল হতে হবে (*. TXT)। এর হিস্টোগ্রাম চিত্রে দেখানো হয়েছে:
পাঠ্য ফাইলটিতে কেবল পাঠ্য থাকে। পাঠ্যের প্রতিটি অক্ষর এনকোডিং সারণী অনুসারে নির্দিষ্ট বাইটগুলির সাথে এনকোড করা হয়। যদিও প্রচুর সংখ্যক এনকোডিং প্রকার রয়েছে, তবে এটি স্পষ্টতই যে সীমিত সংখ্যক বর্ণমালা রয়েছে যা সাধারণত 255 এরও কম থাকে Therefore সুতরাং, কেবলমাত্র কয়েকটি অঞ্চল প্রথম হিস্টোগ্রামে দখল করা হয়, এবং কিছু বাইটগুলি মোটেও হয় না।
নিম্নলিখিত ফাইলটি পিডিএফ ফর্ম্যাটে থাকবে:
এই ফাইলটিতে সমস্ত সম্ভাব্য বাইট রয়েছে, কারণ পিডিএফ পাঠ্য ফাইল থেকে আলাদাভাবে এনকোড করা হয়েছে। এটি প্রচুর পরিষেবা তথ্য সঞ্চয় করে: ফর্ম্যাটিং, ফন্ট, চিত্র ইত্যাদি etc. তবে এর হিস্টোগ্রাম দেখায় যে কিছু বাইট প্রায় সমান সম্ভাবনার সাথে ঘটে, অন্যরা - অন্যদের তুলনায় অনেক বেশি। অতএব হিস্টোগ্রামে একাধিক তীব্র ফেটে যায় এবং সাধারণভাবে এটির পরিবর্তে "র্যাগড" চেহারা রয়েছে, যদিও এটি পুরো উপলব্ধ প্রস্থটি দখল করে।
এবং শেষ ফাইলটি 7 জেড ফরমেটে জিপ করা হয়েছে:
এই হিস্টোগ্রামের দুটি প্রধান বৈশিষ্ট্য রয়েছে: প্রথমত, সমস্ত বাইটগুলি কমবেশি সমান সম্ভাবনা (মোটামুটি সমতল শীর্ষ প্রান্ত) সহ জিপ করা ফাইলটিতে পাওয়া যায় এবং দ্বিতীয়ত, হিস্টগ্রামের উপরে কার্যত কোনও মুক্ত স্থান নেই যা প্রায় সম্পূর্ণ অনুপস্থিতি নির্দেশ করে indicates অপ্রয়োজনীয় যেমন একটি ফাইল। সুতরাং, আমরা উপসংহারে পৌঁছাতে পারি যে প্রত্নতাকারীর অ্যালগোরিদম তাদের সর্বাধিক ইউনিফর্ম বিতরণ অর্জনের জন্য কোনও বিশেষ উপায়ে ফাইলের বাইটগুলিকে "মিশ্রিত" করে।
সুতরাং, পদার্থবিজ্ঞানের মতো কম্পিউটার বিজ্ঞানে এনট্রপি হ'ল সিস্টেমের ব্যাধি একটি পরিমাপ, এই ক্ষেত্রে ফাইলটিতে বাইট বিতরণের ক্ষেত্রে ব্যাঘাত ঘটে। এন্ট্রপি আপনাকে ফাইলের সংকোচনের ডিগ্রি এবং - অপ্রত্যক্ষভাবে - এর ধরণের সম্পর্কে বিচার করতে দেয়।